Audio - a zhidong-gao Collection

zhidong-gao 's Collections

Medical

Video

3D

SD

Audio

Attack

LLMs

dataset

align

Agent

Audio

updated Aug 15, 2024

NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models

Paper • 2403.03100 • Published Mar 5, 2024 • 38
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads

Paper • 2408.05101 • Published Aug 9, 2024 • 8