Audio Course documentation

补充阅读和资源

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

补充阅读和资源

如果你想进一步了解不同的Transformer结构并学习它们在语音处理中的各种应用,请查看这篇最近的论文:

Transformers in Speech Processing: A Survey

作者:Siddique Latif, Aun Zaidi, Heriberto Cuayahuitl, Fahad Shamshad, Moazzam Shoukat, Junaid Qadir

“Transformer在自然语言处理领域的显著成功引起了语音处理界的兴趣,从而探索了它们在语音序列中建模长距离依赖性的潜力。最近,Transformer在各种与语音相关的领域中获得了突出的地位,包括自动语音识别、语音合成、语音翻译、语音语言学、语音增强、口语对话系统和众多多模态应用。在本文中,我们提出了一份综合调查报告,旨在桥接语音技术中不同子领域的研究成果。通过整合语音技术领域的研究成果,我们为那些有兴趣利用Transformer的力量推动该领域发展的研究人员提供了宝贵的资源。我们指出了Transformer在语音处理中遇到的挑战,同时也提供了解决这些问题的潜在解决方案。”

arxiv.org/abs/2303.11607