AISHELL-NER

${num_stars} Modify
命名实体识别(NER)作为一项基础的自然语言处理任务,旨在将命名实体提取到预定义的类别中,例如人名、地名、组织名等。NER 在传统上作为一个序列标注任务,通常只处理文本数据。而如何提升 NER 在语音输入下的效果尚未被深入研究。基于在学术研究中被广泛使用的中文 ASR 开源数据集 AISHELL-1,我们构建了语音 NER 数据集 AISHELL-NER。训练集样本120,098条,验证集样本14,326条,测试集样本7,176条。
File Name
Size
Available Clusters
Status
Creator
Upload Time
Operate
9.1 MiB
CPU/GPU
Private Public
2023-03-05 20:05:42