仅显示平台推荐
GoEmotions
${starItems[0]}

情感类别包括钦佩、娱乐、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、不赞成、厌恶、尴尬、兴奋、恐惧、感激、悲伤、喜悦、爱、紧张、乐观、骄傲、实现、解脱、悔恨、悲伤、惊

2020-11-18 0 11
DBPediaAmazonYelpYahooSogouAG
${starItems[1]}

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

2021-01-04 5 10
SNLI
${starItems[2]}

SNLI语料库(1.0版)是一组570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,带有包含,矛盾和中立的标签,支持NLI(RTE)。https://nlp.stanford.edu/projects/snli/

2020-11-09 0 0
CNNandDailyMailSummarization
${starItems[3]}

使用新闻文章进行问答研究的两个数据集。 每个数据集包含许多文档(每个90k和197k),每个文档平均约有4个问题。 https://cs.nyu.edu/~kcho/DMQA/

2020-12-07 0 3
BillionWords
${starItems[4]}

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

2020-11-09 0 4
LargeMovieReviewDataset
${starItems[5]}

用于二进制情感分类的数据集,提供了25,000张极地电影评论供培训,25,000张用于测试也有其他未标记的数据可供使用。 http://ai.stanford.edu/~amaas/data/sentiment/

2020-11-02 0 3
StanfordSentimentTreebank
${starItems[6]}

用于情感分析的数据集,其中包含11855个句子的语法分析树中215154个短语的细粒度情感标签,并为情感组成提出了新挑战。https://nlp.stanford.edu/sentiment/code.html

2020-11-09 113 2
AVID
${starItems[7]}

AViD数据集:来自不同国家的匿名视频,AViD是一个大型视频数据集,包含467k个视频和887个动作类。所收集的视频具有知识共享许可证。 https://github.com/piergiaj/AViD

2020-10-27 1 4
DynaQuestions
${starItems[8]}

构建了面向军事领域的动态知识图谱 DynaBase,并发布了KBQA 数据集 DynaQuestions。DynaQuestions 包含了2829 条问答对, 其中针对动态知识的问题600条,每个问答对标注了问题类型、Cypher 语句以及答案,能够从新的复杂维度对问答系统的表现进行评价。DynaQuestions 中的问题类型更加多样,其中静态类型的问题能够评测传统问答模型。

2021-05-25 0 42
icdm2022
${starItems[9]}

icdm2022预测风险

2022-07-12 128 6
redata
${starItems[10]}

redata

2022-06-06 36 3
nothing
${starItems[11]}

nothing but for test

2022-09-14 47 1
2022-11-01 58 1
icdm2022_pyg_data
${starItems[13]}

pyg的预处理数据集

2022-07-27 20 10
pyg_session1
${starItems[14]}

session1

2022-07-25 63 2
deepfm
${starItems[15]}

表格数据

2022-11-27 2 0
NLP_data_list_0715.csv
${starItems[16]}

零基础入门NLP - 新闻文本分类A榜训练集+测试集+提交样例

2022-11-24 0 0
bert_mindrecord_128
${starItems[17]}

bert-mindrecord格式 128的长度

2022-11-21 0 0
CorNet-Dataset
${starItems[18]}

用于大规模多标签文本分类的数据集1

2022-11-15 112 2
Pangu_dataset
${starItems[19]}

盘古训练数据和模型

2022-10-13 306 1
bert
${starItems[20]}

bert数据集

2022-11-03 57 1
MIND
${starItems[21]}

推荐系统

2022-11-04 2 0
models
${starItems[22]}

盘古系列模型

2022-07-26 205 39
CoNLL04
${starItems[23]}

dataset

2022-10-30 3 0
ChnSentiCorp_htl_all
${starItems[24]}

ChnSentiCorp_htl_all

2022-10-15 10 0
MAVEN-ACE2005
${starItems[25]}

公开的MAVEN数据集和私有的ACE2005数据集

2022-08-22 25 1
atd_data
${starItems[26]}

atd_data

2022-08-13 0 1
auto-Exploit
${starItems[27]}

自动化渗透测试数据集

2022-08-12 0 0
2022-08-11 0 0
icdm2022_session1
${starItems[29]}

session1初赛

2022-08-11 0 1