|
--- |
|
title: DittoTalkingHead |
|
emoji: 🗣️ |
|
colorFrom: blue |
|
colorTo: purple |
|
sdk: gradio |
|
sdk_version: 4.19.0 |
|
app_file: app.py |
|
pinned: false |
|
license: apache-2.0 |
|
hardware: a100-large |
|
preload_from_hub: |
|
- digital-avatar/ditto-talkinghead |
|
--- |
|
|
|
|
|
# DittoTalkingHead - Talking Head Generation |
|
|
|
音声とソース画像から、リアルなTalking Headビデオを生成します。 |
|
|
|
## 特徴 |
|
|
|
- 高品質なリップシンク |
|
- 自然な表情と頭部の動き |
|
- TensorRTによる高速推論 |
|
- 自動モデルダウンロード機能 |
|
|
|
## 使い方 |
|
|
|
1. **音声ファイル**(WAV形式)をアップロード |
|
2. **ソース画像**(PNG/JPG形式)をアップロード |
|
3. **生成**ボタンをクリック |
|
|
|
## 技術仕様 |
|
|
|
- **GPU**: NVIDIA A100(推奨) |
|
- **フレームワーク**: PyTorch |
|
- **モデル**: DittoTalkingHead (PyTorch版) |
|
- **モデルサイズ**: 約2.5GB |
|
|
|
## 注意事項 |
|
|
|
- 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分) |
|
- GPU(A100)環境での実行を推奨します |
|
- 音声ファイルは16kHz WAV形式が推奨です |
|
|
|
## モデルソース |
|
|
|
モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。 |
|
|
|
## ライセンス |
|
|
|
Apache License 2.0 |