大规模(1000小时)阅读英语语音的语料库。 http://www.openslr.org/12/
大型数据集,其中包含来自50个不同城市的街道场景中记录的各种立体声视频序列集,此外,还有较大的20000个弱注释帧集以及5000个帧的高质量像素级注释。 https://www.cityscapes-dataset.com/
语音数据集
Dcase2020 task1A 训练集
valid数据集
二语音混合
播客商业就是这样
识别
无
由Librispeech数据生成的语音分离数据集
CSTR VCTK语料库包括110名英语使用者使用不同口音发出的语音数据。每个演讲者朗读大约400个句子,这些句子选自一份报纸、rainbow文章和一段用于语音重音档案的启发段落。
ATIS(航空公司陆行信息系统)数据集[77]被广泛用于 SLU 研究.数据集包含预定航班的人员的录音.另外一个数据集 Snips 是从 Snips 个人语音助手收集来的,该数据集每个意图类型的样本数量大致相同.
新闻实验室音频
测试数据集
NLP论文数据集
wu
Voxceleb2,超过一百万条语音,总时长2000+,约240G
audio recording
tt
声纹识别数据集
语音分离数据集
voice
LibriSpeech_test