Spaces:
Paused
Paused
File size: 1,331 Bytes
43f5a2b 78c995a 43f5a2b 8768811 43f5a2b |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 |
---
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
- digital-avatar/ditto-talkinghead
---
# DittoTalkingHead - Talking Head Generation
音声とソース画像から、リアルなTalking Headビデオを生成します。
## 特徴
- 高品質なリップシンク
- 自然な表情と頭部の動き
- TensorRTによる高速推論
- 自動モデルダウンロード機能
## 使い方
1. **音声ファイル**(WAV形式)をアップロード
2. **ソース画像**(PNG/JPG形式)をアップロード
3. **生成**ボタンをクリック
## 技術仕様
- **GPU**: NVIDIA A100(推奨)
- **フレームワーク**: PyTorch
- **モデル**: DittoTalkingHead (PyTorch版)
- **モデルサイズ**: 約2.5GB
## 注意事項
- 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分)
- GPU(A100)環境での実行を推奨します
- 音声ファイルは16kHz WAV形式が推奨です
## モデルソース
モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。
## ライセンス
Apache License 2.0 |