foreverYoung
  • Joined on Jul 10, 2022

Datasets

librimix-3mix
speech coding speech processing 5

关于数据集 LibriMix是用于在嘈杂环境中进行源分离的开源数据集。 它来自LibriSpeech信号(干净的子集)和WHAM噪声。 它提供了WHAM数据集的免费替代品并对其进行了补充。 它还将启用跨数据集实验。 生成LibriMix 要生成LibriMix,librimix-3mix主要用于三个人语音的分离。

Updated 1 year ago

Airlines_Delay
text annotation computer vision 8

Airlines Dataset 灵感来自 Elena Ikonomovska 的回归数据集。 任务是根据预定起飞时间的信息预测给定航班是否会延误。

Updated 1 year ago

wsj0
speech coding speech processing 53

数据集全名叫CSR-I (WSJ0) Complete。1991 年,DARPA 口语项目开始计划建立一个新的语料库,以支持对大词汇量连续语音识别 (CSR) 系统的研究。前两个 CSR 语料库主要由阅读语音组成,其文本来自华尔街日报新闻文本的机器可读语料库,因此通常被称为 WSJ0 和 WSJ1。 语料库的文本属于 WSJ 文本语料库的 5,000 字或 20,000 字子集。 除了朗读的演讲外,还包括一些自发的听写。 听写部分是使用口述假设新闻文章的记者收集的。 整个过程中使用了两个麦克风:一个近距离的 Sennheiser HMD414 和一个辅助麦克风,辅助麦克风可能会有所不同。 语料库以三种配置提供:来自 Sennheiser 的语音、来自另一个麦克风的语音以及来自两者的语音; 这三组包括所有转录、测试、文档等。

Updated 1 year ago

valid
speech synthesis computer vision 10

编码验证数据集

Updated 1 year ago

librimix-2mix
speech coding speech processing 8

关于数据集 LibriMix是用于在嘈杂环境中进行源分离的开源数据集。 它来自LibriSpeech信号(干净的子集)和WHAM噪声。 它提供了WHAM数据集的免费替代品并对其进行了补充。 它还将启用跨数据集实验。 生成LibriMix 要生成LibriMix,librimix-2mix主要用于两个人语音的分离

Updated 1 year ago

week
image classification computer vision 9

训练数据集

Updated 1 year ago

haiyue
language modeling computer vision 2

训练数据集

Updated 1 year ago

new
information retrieval natural language processing 8

测试数据集

Updated 1 year ago

mcn
speech enhancement computer vision 4

训练数据集

Updated 1 year ago

toy
information retrieval computer vision 5

测试数据集

Updated 1 year ago

xunlian
speech synthesis speech processing 5

训练数据集

Updated 1 year ago

librimix
speech synthesis speech processing 10

语音数据集

Updated 1 year ago