编码验证数据集
语音数据集
训练数据集
https://github.com/mispchallenge/MISP2021-AVSR
测试
数据集中的每一条都包含了一组独立 MP3 录音及相应的文本文件。数据集所记录的 26,119 小时的录音中,有许多条数据同时包含了年龄、性别、口音等人口统计元数据,能够训练语音识别引擎提升其准确性。 该数据集当前有 17,127 小时,104 种语言的语音数据,但我们在持续添加更多的语音数据和更多的语言。前往我们的语言页请求加入更多的语言或开始做出贡献。
naxida的语音
用于diffsvc训练
LJSpeech
只是空数据集
Libri2Mix for GPU Training
librimix
语音分离数据集
Libri2Mix_minidata