jishengpeng's picture

4 4 5

jishengpeng

novateur

·

https://novateurjsp.github.io

jishengpeng

AI & ML interests

speech language model, discrete codec, text to speech

Organizations

upvoted a paper 3 months ago

WavReward: Spoken Dialogue Models With Generalist Reward Evaluators

Paper • 2505.09558 • Published May 14 • 11

upvoted a paper 6 months ago

LLMVoX: Autoregressive Streaming Text-to-Speech Model for Any LLM

Paper • 2503.04724 • Published Mar 6 • 72

upvoted a collection 12 months ago

WavTokenizer-Medium-Large

https://arxiv.org/abs/2408.16532 • 4 items • Updated Feb 25 • 12

upvoted a paper 12 months ago

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

Paper • 2408.16532 • Published Aug 29, 2024 • 52