Spaces:

O-ken5481
/

talkingAvater_bgk

Paused

talkingAvater_bgk / README_hf_space.md

Phase1クリア

8768811 3 months ago

1.33 kB

	---
	title: DittoTalkingHead
	emoji: 🗣️
	colorFrom: blue
	colorTo: purple
	sdk: gradio
	sdk_version: 4.19.0
	app_file: app.py
	pinned: false
	license: apache-2.0
	hardware: a100-large
	preload_from_hub:
	- digital-avatar/ditto-talkinghead
	---


	# DittoTalkingHead - Talking Head Generation

	音声とソース画像から、リアルなTalking Headビデオを生成します。

	## 特徴

	- 高品質なリップシンク
	- 自然な表情と頭部の動き
	- TensorRTによる高速推論
	- 自動モデルダウンロード機能

	## 使い方

	1. 音声ファイル（WAV形式）をアップロード
	2. ソース画像（PNG/JPG形式）をアップロード
	3. 生成ボタンをクリック

	## 技術仕様

	- GPU: NVIDIA A100（推奨）
	- フレームワーク: PyTorch
	- モデル: DittoTalkingHead (PyTorch版)
	- モデルサイズ: 約2.5GB

	## 注意事項

	- 初回実行時は、モデルの自動ダウンロードのため時間がかかります（約10-15分）
	- GPU（A100）環境での実行を推奨します
	- 音声ファイルは16kHz WAV形式が推奨です

	## モデルソース

	モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。

	## ライセンス

	Apache License 2.0