仅显示平台推荐
librimix-2mix
${starItems[0]}

关于数据集 LibriMix是用于在嘈杂环境中进行源分离的开源数据集。 它来自LibriSpeech信号(干净的子集)和WHAM噪声。 它提供了WHAM数据集的免费替代品并对其进行了补充。 它还将启用跨数据集实验。 生成LibriMix 要生成LibriMix,librimix-2mix主要用于两个人语音的分离

2023-02-11 0 0
new
${starItems[1]}

训练数据集

2023-01-31 0 0
heitiane
${starItems[2]}

训练数据集

2023-01-14 0 0
test
${starItems[3]}

测试数据集

2022-10-20 23 1
speech
${starItems[4]}

训练数据集

2023-02-10 0 0
tr
${starItems[5]}

语音模型训练数据集

2022-10-14 13 4
librimix-3mix
${starItems[6]}

关于数据集 LibriMix是用于在嘈杂环境中进行源分离的开源数据集。 它来自LibriSpeech信号(干净的子集)和WHAM噪声。 它提供了WHAM数据集的免费替代品并对其进行了补充。 它还将启用跨数据集实验。 生成LibriMix 要生成LibriMix,librimix-3mix主要用于三个人语音的分离。

2023-02-11 1 0
electricity
${starItems[7]}

Abstract: Measurements of electric power consumption in one household with a one-minute sampling rate over a period of almost 4 years. Different electrical quantities and some sub-metering values are available.

2023-03-15 0 0
AMWD22_WEBSHELL
${starItems[8]}

近几年随着攻防对抗不断升级,防御的挑战越来越大,在对抗的过程中,逐步发展出了静态检测引擎+AI检测引擎+动态沙箱执行检测引擎等多种综合手段,有效地提高了攻击者绕过的门槛和成本,缓解了恶意程序/恶意代码攻击问题。 本赛题数据就是在这样的背景下产生的,数据集来源于“AMWD 2022:阿里云安全WEBSHELL文本检测”挑战赛的训练集: https://tianchi.aliyun.com/competition/entrance/532035/introduction

2023-03-14 0 0
wsj0
${starItems[9]}

数据集全名叫CSR-I (WSJ0) Complete。1991 年,DARPA 口语项目开始计划建立一个新的语料库,以支持对大词汇量连续语音识别 (CSR) 系统的研究。前两个 CSR 语料库主要由阅读语音组成,其文本来自华尔街日报新闻文本的机器可读语料库,因此通常被称为 WSJ0 和 WSJ1。 语料库的文本属于 WSJ 文本语料库的 5,000 字或 20,000 字子集。 除了朗读的演讲外,还包括一些自发的听写。 听写部分是使用口述假设新闻文章的记者收集的。 整个过程中使用了两个麦克风:一个近距离的 Sennheiser HMD414 和一个辅助麦克风,辅助麦克风可能会有所不同。 语料库以三种配置提供:来自 Sennheiser 的语音、来自另一个麦克风的语音以及来自两者的语音; 这三组包括所有转录、测试、文档等。

2023-02-12 1 0
juice
${starItems[10]}

训练数据集

2023-01-24 0 0
GenshinVoice
${starItems[11]}

w4123

2023-01-24 52 28
wsjj
${starItems[12]}

语音分离数据及

2022-11-15 0 0
audio
${starItems[13]}

声纹识别数据

2022-07-30 0 0
2022-07-24 0 2