File size: 1,331 Bytes
43f5a2b
 
 
 
 
 
 
 
 
 
 
78c995a
 
43f5a2b
 
8768811
43f5a2b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
  - digital-avatar/ditto-talkinghead
---


# DittoTalkingHead - Talking Head Generation

音声とソース画像から、リアルなTalking Headビデオを生成します。

## 特徴

- 高品質なリップシンク
- 自然な表情と頭部の動き
- TensorRTによる高速推論
- 自動モデルダウンロード機能

## 使い方

1. **音声ファイル**(WAV形式)をアップロード
2. **ソース画像**(PNG/JPG形式)をアップロード
3. **生成**ボタンをクリック

## 技術仕様

- **GPU**: NVIDIA A100(推奨)
- **フレームワーク**: PyTorch
- **モデル**: DittoTalkingHead (PyTorch版)
- **モデルサイズ**: 約2.5GB

## 注意事項

- 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分)
- GPU(A100)環境での実行を推奨します
- 音声ファイルは16kHz WAV形式が推奨です

## モデルソース

モデルは[digital-avatar/ditto-talkinghead](https://huggingface.co/digital-avatar/ditto-talkinghead)から自動的にダウンロードされます。

## ライセンス

Apache License 2.0