talkingAvater_bgk / README_hf_space.md
oKen38461's picture
Phase1クリア
8768811
|
raw
history blame
1.33 kB
---
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
- digital-avatar/ditto-talkinghead
---
# DittoTalkingHead - Talking Head Generation
音声とソース画像から、リアルなTalking Headビデオを生成します。
## 特徴
- 高品質なリップシンク
- 自然な表情と頭部の動き
- TensorRTによる高速推論
- 自動モデルダウンロード機能
## 使い方
1. **音声ファイル**(WAV形式)をアップロード
2. **ソース画像**(PNG/JPG形式)をアップロード
3. **生成**ボタンをクリック
## 技術仕様
- **GPU**: NVIDIA A100(推奨)
- **フレームワーク**: PyTorch
- **モデル**: DittoTalkingHead (PyTorch版)
- **モデルサイズ**: 約2.5GB
## 注意事項
- 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分)
- GPU(A100)環境での実行を推奨します
- 音声ファイルは16kHz WAV形式が推奨です
## モデルソース
モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。
## ライセンス
Apache License 2.0