Spaces:
Running
on
Zero
Running
on
Zero
A newer version of the Gradio SDK is available:
5.5.0
20240121 μ λ°μ΄νΈ
config
μis_share
λ₯Ό μΆκ°νμ΅λλ€. Colabκ³Ό κ°μ μλ리μ€μμλ μ΄ κ°μTrue
λ‘ μ€μ νμ¬ WebUIλ₯Ό κ³΅κ° λ€νΈμν¬μ 맀νν μ μμ΅λλ€.- WebUIμ μμ΄ μμ€ν λ²μ μ§μμ μΆκ°νμ΅λλ€.
cmd-asr
μ΄ FunASR λͺ¨λΈμ΄ ν¬ν¨λμ΄ μλμ§ μλμΌλ‘ κ°μ§ν©λλ€; κΈ°λ³Έ λλ ν 리μμ μ°Ύμ μ μμΌλ©΄ ModelScopeμμ λ€μ΄λ‘λλ©λλ€.- Issue 79μμ λ³΄κ³ λ SoVITS νλ ¨μ ZeroDivisionErrorλ₯Ό νν°λ§ μν λ±μΌλ‘ ν΄κ²°νλ €κ³ μλνμ΅λλ€.
TEMP
ν΄λμ μΊμλ μ€λμ€ νμΌ λ° κΈ°ν νμΌμ μ 리νμ΅λλ€.- μ°Έμ‘° μ€λμ€μ λμ΄ ν¬ν¨λ ν©μ± μ€λμ€ λ¬Έμ λ₯Ό ν¬κ² μ€μμ΅λλ€.
20240122 μ λ°μ΄νΈ
- μ§λμΉκ² 짧μ μΆλ ₯ νμΌλ‘ μΈν΄ μ°Έμ‘° μ€λμ€κ° λ°λ³΅λλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- μμ΄ λ° μΌλ³Έμ΄ νλ ¨μ λ€μ΄ν°λΈ μ§μμ ν μ€νΈνμ΅λλ€ (μΌλ³Έμ΄ νλ ¨ μ λ£¨νΈ λλ ν 리μ λΉμμ΄ νΉμ λ¬Έμκ° μμ΄μΌ ν©λλ€).
- μ€λμ€ κ²½λ‘ νμΈμ κ°μ νμ΅λλ€. μλͺ»λ μ λ ₯ κ²½λ‘μμ μ½μΌλ €λ μλκ° μμ κ²½μ°, ffmpeg μ€λ₯ λμ κ²½λ‘κ° μ‘΄μ¬νμ§ μλλ€κ³ λ³΄κ³ ν©λλ€.
20240123 μ λ°μ΄νΈ
- Hubert μΆμΆλ‘ μΈν΄ NaN μ€λ₯κ° λ°μνμ¬ SoVITS/GPT νλ ¨μμ ZeroDivisionErrorκ° λ°μνλ λ¬Έμ λ₯Ό ν΄κ²°νμ΅λλ€.
- μΆλ‘ WebUIμμ λΉ λ₯Έ λͺ¨λΈ μ ν μ§μμ μΆκ°νμ΅λλ€.
- λͺ¨λΈ νμΌ μ λ ¬ λ‘μ§μ μ΅μ ννμ΅λλ€.
- μ€κ΅μ΄ λ¨μ΄ λΆν μ μν΄
jieba
λ₯Όjieba_fast
λ‘ κ΅μ²΄νμ΅λλ€.
20240126 μ λ°μ΄νΈ
- μ€κ΅μ΄-μμ΄ νΌν© λ° μΌλ³Έμ΄-μμ΄ νΌν© μΆλ ₯ ν μ€νΈλ₯Ό μ§μν©λλ€.
- μΆλ ₯μ λν μ νμ λΆν λͺ¨λλ₯Ό μΆκ°νμ΅λλ€.
- UVR5 μ½κΈ° λ¬Έμ λ° λλ ν 리 μλ νμΆ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- μΆλ‘ μ€λ₯λ₯Ό μΌμΌν€λ μ¬λ¬ μ€ λ°κΏ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- μΆλ‘ WebUI μμ μ€λ³΅ λ‘κ·Έλ₯Ό μ κ±°νμ΅λλ€.
- Macμμ νλ ¨ λ° μΆλ‘ μ μ§μν©λλ€.
- μ λ° μ λ°λλ₯Ό μ§μνμ§ μλ GPUμ λν΄ μλμΌλ‘ λ¨μ λ°λλ₯Ό κ°μ νλ©°, CPU μΆλ‘ μ λ¨μ λ°λλ₯Ό μ μ©ν©λλ€.
20240128 μ λ°μ΄νΈ
- μ«μμ λ°μμ΄ μ€κ΅μ΄ λ¬Έμλ‘ λ³νλλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- λ¬Έμ₯ μμ λΆλΆμμ λͺ κ°μ λ¬Έμκ° λλ½λλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- λΉν©λ¦¬μ μΈ μ°Έμ‘° μ€λμ€ κΈΈμ΄λ₯Ό μ€μ νμ¬ μ μΈνμ΅λλ€.
- GPT νλ ¨ μ 체ν¬ν¬μΈνΈκ° μ μ₯λμ§ μλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- Dockerfile μμ λͺ¨λΈ λ€μ΄λ‘λ νλ‘μΈμ€λ₯Ό μλ£νμ΅λλ€.
20240129 μ λ°μ΄νΈ
- μ λ° μ λ°λ νλ ¨μ λ¬Έμ κ° μλ 16 μ리μ¦μ κ°μ GPUμ νλ ¨ ꡬμ±μ λ¨μ λ°λλ‘ λ³κ²½νμ΅λλ€.
- μ¬μ© κ°λ₯ν Colab λ²μ μ ν μ€νΈνκ³ μ λ°μ΄νΈνμ΅λλ€.
- μ΄μ λ²μ μ FunASR λ‘ μΈν΄ μΈν°νμ΄μ€ μ λ ¬ μ€λ₯κ° λ°μνλ ModelScope FunASR μ μ₯μμ git ν΄λ‘λ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
20240130 μ λ°μ΄νΈ
- λͺ¨λ κ²½λ‘ κ΄λ ¨ νλͺ©μμ μ΄μ€ λ°μ΄νλ₯Ό μλμΌλ‘ μ κ±°νμ¬ μ΄λ³΄μκ° μ΄μ€ λ°μ΄νκ° ν¬ν¨λ κ²½λ‘λ₯Ό 볡μ¬νλ μ€λ₯λ₯Ό λ°©μ§νμ΅λλ€.
- μ€κ΅μ΄ λ° μμ΄ λ¬Έμ₯ λΆνΈ λΆν λ¬Έμ λ₯Ό μμ νκ³ λ¬Έμ₯ μμκ³Ό λμ λΆνΈλ₯Ό μΆκ°νμ΅λλ€.
- λΆνΈμ μν λΆν μ μΆκ°νμ΅λλ€.
20240201 μ λ°μ΄νΈ
- λΆλ¦¬ μ€ν¨λ₯Ό μΌμΌν¨ UVR5 νμ μ½κΈ° μ€λ₯λ₯Ό μμ νμ΅λλ€.
- νΌν©λ μ€κ΅μ΄-μΌλ³Έμ΄-μμ΄ ν μ€νΈμ λν μλ λΆν λ° μΈμ΄ μΈμμ μ§μν©λλ€.
20240202 μ λ°μ΄νΈ
/
λ‘ λλλ ASR κ²½λ‘κ° νμΌ μ΄λ¦ μ μ₯ μ μ€λ₯λ₯Ό λ°μμν€λ λ¬Έμ λ₯Ό μμ νμ΅λλ€.- PR 377 μμλ PaddleSpeech μ Normalizer λ₯Ό λμ νμ¬ "xx.xx%" (λ°±λΆμ¨ κΈ°νΈ)μ "ε /ε¨"μ΄ "ε ε¨"μΌλ‘ μ½νλ λ¬Έμ λ₯Ό "ε ζ―ε¨"μΌλ‘ μμ νκ³ , λ°μ€ μ€λ₯λ₯Ό μμ νμ΅λλ€.
20240207 μ λ°μ΄νΈ
- Issue 391 μμ λ³΄κ³ λ μ€κ΅μ΄ μΆλ‘ νμ§ μ νλ₯Ό μΌμΌν¨ μΈμ΄ 맀κ°λ³μ νΌλμ μμ νμ΅λλ€.
- PR 403 μμλ UVR5 λ₯Ό λμ λ²μ μ librosaμ λ§κ² μ‘°μ νμ΅λλ€.
- Commit 14a2851μμλ
is_half
맀κ°λ³μκ° λΆλ¦¬μΈμΌλ‘ λ³νλμ§ μμ λ°μν UVR5inf
μ€λ₯λ₯Ό μμ νμ΅λλ€. μ΄λ‘ μΈν΄ 16 μλ¦¬μ¦ GPUμμinf
κ° λ°μνμ΅λλ€. - μμ΄ ν μ€νΈ νλ‘ νΈμλλ₯Ό μ΅μ ννμ΅λλ€.
- Gradio μ’ μμ± λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- λ°μ΄ν°μ
μ€λΉ μ λ£¨νΈ λλ ν 리λ₯Ό λΉμλλ©΄
.list
μ 체 κ²½λ‘λ₯Ό μλμΌλ‘ μ½λλ‘ μ§μν©λλ€. - μΌλ³Έμ΄μ μμ΄μ λν Faster Whisper ASRμ ν΅ν©νμ΅λλ€.
20240208 μ λ°μ΄νΈ
- Commit 59f35adμμλ Windows 10 1909μ Issue 232 (μ ν΅ μ€κ΅μ΄ μμ€ν μΈμ΄)μμ GPT νλ ¨ λ©μΆ€ λ¬Έμ λ₯Ό μμ νλ €κ³ νμ΅λλ€.
20240212 μ λ°μ΄νΈ
- Faster Whisperμ FunASRμ λ‘μ§μ μ΅μ ννκ³ , Faster Whisperλ₯Ό λ―Έλ¬ λ€μ΄λ‘λλ‘ μ ννμ¬ Hugging Face μ°κ²° λ¬Έμ λ₯Ό νΌνμ΅λλ€.
- PR 457μ DPO Loss μ€νμ νλ ¨ μ΅μ μ νμ±ννμ¬ GPTμ λ°λ³΅ λ° λ¬Έμ λλ½ λ¬Έμ λ₯Ό μννκ³ , νλ ¨ μ€ λΆμ μνμ ꡬμ±νλ©° μ¬λ¬ μΆλ‘ 맀κ°λ³μλ₯Ό μΆλ‘ WebUIμμ μ¬μ©ν μ μκ² νμ΅λλ€.
20240214 μ λ°μ΄νΈ
- νλ ¨ μ μ€κ΅μ΄ μ€ν μ΄λ¦μ μ§μν©λλ€ (μ΄μ μλ μ€λ₯κ° λ°μνμ΅λλ€).
- DPO νλ ¨μ νμ κΈ°λ₯ λμ μ νμ κΈ°λ₯μΌλ‘ λ³κ²½νμ΅λλ€. μ ν μ, λ°°μΉ ν¬κΈ°κ° μλμΌλ‘ μ λ°μΌλ‘ μ€μ΄λλλ€. μΆλ‘ WebUIμμ μλ‘μ΄ λ§€κ°λ³μκ° μ λ¬λμ§ μλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
20240216 μ λ°μ΄νΈ
- μ°Έμ‘° ν μ€νΈ μμ΄ μ λ ₯μ μ§μν©λλ€.
- Issue 475μμ λ³΄κ³ λ μ€κ΅μ΄ νλ‘ νΈμλμ λ²κ·Έλ₯Ό μμ νμ΅λλ€.
20240221 μ λ°μ΄νΈ
- λ°μ΄ν° μ²λ¦¬ μ€ λ Έμ΄μ¦ κ°μ μ΅μ μ μΆκ°νμ΅λλ€ (λ Έμ΄μ¦ κ°μλ 16kHz μνλ§ λΉμ¨λ§ λ¨κΉλλ€; λ°°κ²½ λ Έμ΄μ¦κ° μ¬ν κ²½μ°μλ§ μ¬μ©νμμμ€).
- PR 559, PR 556, PR 532, PR 507, PR 509 μ€κ΅μ΄ λ° μΌλ³Έμ΄ νλ‘ νΈμλ μ²λ¦¬λ₯Ό μ΅μ ννμ΅λλ€.
- Mac CPU μΆλ‘ μ MPS λμ CPUλ₯Ό μ¬μ©νλλ‘ μ ννμ¬ μ±λ₯μ ν₯μμμΌ°μ΅λλ€.
- Colab κ³΅κ° URL λ¬Έμ λ₯Ό μμ νμ΅λλ€.
20240306 μ λ°μ΄νΈ
- PR 672λ μΆλ‘ μλλ₯Ό 50% κ°μννμ΅λλ€ (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39μμ ν μ€νΈλ¨).
- Faster Whisperμ λΉμ€κ΅μ΄ ASRμ μ¬μ©ν λ μ€κ΅μ΄ FunASR λͺ¨λΈμ λ¨Όμ λ€μ΄λ‘λν νμκ° μμ΅λλ€.
- PR 610μ UVR5 리λ²λΈ μ κ±° λͺ¨λΈμμ μ€μ μ΄ λ°λλ‘ λμ΄ μλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- PR 675λ CUDAκ° μλ κ²½μ° Faster Whisperμ μλ CPU μΆλ‘ μ κ°λ₯νκ² νμ΅λλ€.
- PR 573μ Macμμ μ¬λ°λ₯Έ CPU μΆλ‘ μ 보μ₯νκΈ° μν΄
is_half
체ν¬λ₯Ό μμ νμ΅λλ€.
202403/202404/202405 μ λ°μ΄νΈ
μ¬μν μμ :
- μ°Έμ‘° ν μ€νΈ μλ λͺ¨λμ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- μ€κ΅μ΄ λ° μμ΄ ν μ€νΈ νλ‘ νΈμλλ₯Ό μ΅μ ννμ΅λλ€.
- API νμμ κ°μ νμ΅λλ€.
- CMD νμ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- νλ ¨ λ°μ΄ν° μ²λ¦¬ μ€ μ§μλμ§ μλ μΈμ΄μ λν μ€λ₯ ν둬ννΈλ₯Ό μΆκ°νμ΅λλ€.
- Hubert μΆμΆμ λ²κ·Έλ₯Ό μμ νμ΅λλ€.
μ£Όμ μμ :
- VQλ₯Ό κ³ μ νμ§ μκ³ SoVITS νλ ¨μ λ¬Έμ λ₯Ό μμ νμ΅λλ€(νμ§ μ νλ₯Ό μΌμΌν¬ μ μμ).
- λΉ λ₯Έ μΆλ‘ λΆκΈ°λ₯Ό μΆκ°νμ΅λλ€.
20240610 μ λ°μ΄νΈ
μ¬μν μμ :
- PR 1168 & PR 1169 μμ ꡬλμ λ° λ€μ€ ꡬλμ ν μ€νΈ μ λ ₯ λ‘μ§μ κ°μ νμ΅λλ€.
- Commit 501a74a UVR5μμ MDXNet λλ¬λ²λΈλ₯Ό μν CMD νμμ μμ νκ³ κ³΅λ°±μ΄ μλ κ²½λ‘λ₯Ό μ§μνμ΅λλ€.
- PR 1159
s2_train.py
μμ SoVITS νλ ¨μ μν μ§νλ₯ νμμ€ λ‘μ§μ μμ νμ΅λλ€.
μ£Όμ μμ :
- Commit 99f09c8 WebUIμ GPT λ―ΈμΈ μ‘°μ μ΄ μ€κ΅μ΄ μ λ ₯ ν μ€νΈμ BERT κΈ°λ₯μ μ½μ§ μμ μΆλ‘ κ³Ό λΆμΌμΉ λ° μ μ¬μ νμ§ μ νλ₯Ό μΌμΌν€λ λ¬Έμ λ₯Ό μμ νμ΅λλ€. μ£Όμ: μ΄μ μ λ§μ μμ λ°μ΄ν°λ‘ λ―ΈμΈ μ‘°μ ν κ²½μ° νμ§μ ν₯μμν€κΈ° μν΄ λͺ¨λΈμ λ€μ μ‘°μ νλ κ²μ΄ μ’μ΅λλ€.
20240706 μ λ°μ΄νΈ
μ¬μν μμ :
- Commit 1250670 CPU μΆλ‘ μμ κΈ°λ³Έ λ°°μΉ ν¬κΈ° μμμ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- PR 1258, PR 1265, PR 1267 λ Έμ΄μ¦ μ κ±° λλ ASRμ΄ μμΈλ₯Ό λ§λλ©΄ λͺ¨λ 보λ₯ μ€μΈ μ€λμ€ νμΌμ΄ μ’ λ£λλ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- PR 1253 ꡬλμ μΌλ‘ λΆν ν λ μμμ λΆν λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- Commit a208698 λ€μ€ GPU νλ ¨μ μν λ€μ€ νλ‘μΈμ€ μ μ₯ λ‘μ§μ μμ νμ΅λλ€.
- PR 1251 λΆνμν
my_utils
λ₯Ό μ κ±°νμ΅λλ€.
μ£Όμ μμ :
- PR 672μ κ°μ μΆλ‘ μ½λκ° κ²μ¦λμ΄ λ©μΈ λΈλμΉμ λ³ν©λμμΌλ©°, κΈ°λ³Έκ³Ό μΌκ΄λ μΆλ‘ ν¨κ³Όλ₯Ό 보μ₯ν©λλ€. λν μ°Έμ‘° ν μ€νΈ μλ λͺ¨λμμ κ°μ μΆλ‘ μ μ§μν©λλ€.
ν₯ν μ
λ°μ΄νΈμμλ fast_inference
λΈλμΉμ λ³κ²½ μ¬νμ μΌκ΄μ±μ κ³μ κ²μ¦ν κ²μ
λλ€.
20240727 μ λ°μ΄νΈ
μ¬μν μμ :
- PR 1298 λΆνμν i18n μ½λλ₯Ό μ 리νμ΅λλ€.
- PR 1299 μ¬μ©μ νμΌ κ²½λ‘μ νν μ¬λμκ° λͺ λ Ήμ€ μ€λ₯λ₯Ό μΌμΌν€λ λ¬Έμ λ₯Ό μμ νμ΅λλ€.
- PR 756 GPT νλ ¨μ λ¨κ³ κ³μ° λ‘μ§μ μμ νμ΅λλ€.
μ£Όμ μμ :
- Commit 9588a3c ν©μ±μ μν μμ± μλ μ‘°μ μ μ§μνμ΅λλ€. μμ± μλλ§ μ‘°μ νλ©΄μ 무μμμ±μ κ³ μ ν μ μμ΅λλ€.
20240806 μ λ°μ΄νΈ
- PR 1306, PR 1356 BS RoFormer 보컬 λ°μ£Ό λΆλ¦¬ λͺ¨λΈμ λν μ§μμ μΆκ°νμ΅λλ€. Commit e62e965 FP16 μΆλ‘ μ νμ±ννμ΅λλ€.
- μ€κ΅μ΄ ν μ€νΈ νλ‘ νΈμλλ₯Ό κ°μ νμ΅λλ€.
- PR 1355 WebUI μμ μ€λμ€λ₯Ό μ²λ¦¬ν λ κ²½λ‘λ₯Ό μλμΌλ‘ μ±μ μ΅λλ€.
- Commit bce451a, Commit 4c8b761 GPU μΈμ λ‘μ§μ μ΅μ ννμ΅λλ€.
- Commit 8a10147 κ΄λμ΄ ASR μ§μμ μΆκ°νμ΅λλ€.
- GPT-SoVITS v2 μ§μμ μΆκ°νμ΅λλ€.
- PR 1387 νμ΄λ° λ‘μ§μ μ΅μ ννμ΅λλ€.