unicorn
  • Joined on May 14, 2022

Datasets

Serendipity_2018
emotion analysis computer vision and natural language processing 9

“基于真实用户反馈调查推荐系统中的意外发现”的数据集

Updated 1 year ago

Jester
text annotation natural language processing 20

加州大学伯克利分校的 Ken Goldberg 也发布了 Jester Joke Recommender System 的数据集。 该数据集包含来自 73,496 名用户的 100 个笑话的 410 万个连续评分(-10.00 到 +10.00)。

Updated 1 year ago

Personality_2018
emotion analysis natural language processing 6

“用户个性和用户对推荐系统的满意度”的数据集

Updated 1 year ago

Last.FM
information retrieval natural language processing 8

第二届推荐系统信息异质性和融合国际研讨会 (HetRec 2011, http://ir.ii.uam.es/hetrec2011) 发布了来自 Delicious、Last.fm Web 2.0、MovieLens、IMDb 和 Rotten Tomatoes 的数据集。 这些数据集包含来自大约 2,000 名用户的社交网络、标签和资源消耗(网页书签和音乐艺术家收听)信息。 数据集由马德里自治大学 (http://ir.ii.uam.es) 的信息检索小组生成。

Updated 1 year ago

test
information extraction natural language processing 6

测试数据集

Updated 1 year ago

wsj0
speech recognition speech processing 20

语音数据集

Updated 1 year ago

Bookmarks
information retrieval natural language processing 2

第二届推荐系统信息异质性和融合国际研讨会 (HetRec 2011, http://ir.ii.uam.es/hetrec2011) 发布了来自 Delicious、Last.fm Web 2.0、MovieLens、IMDb 和 Rotten Tomatoes 的数据集。 这些数据集包含来自大约 2,000 名用户的社交网络、标签和资源消耗(网页书签和音乐艺术家收听)信息。 数据集由马德里自治大学 (http://ir.ii.uam.es) 的信息检索小组生成。

Updated 1 year ago

Book-Crossing
language modeling natural language processing 3

BookCrossing (BX) 数据集由 Cai-Nicolas Ziegler 在 Humankind Systems 首席技术官 Ron Hornbaker 的许可下从 Book-Crossing 社区收集,为期 4 周(2004 年 8 月/9 月)。 它包含 278,858 名用户(匿名但具有人口统计信息),对 271,379 本书提供 1,149,780 次评分(明确/隐含)。

Updated 1 year ago

WikiLens
language modeling natural language processing 1

WikiLens 是一个通用的协作推荐系统,允许其社区定义项目类型(例如啤酒)和类别(例如微酿啤酒、淡啤酒、烈性黑啤酒),然后对项目进行评分并获得推荐。该数据集提取于 2008 年 2 月。

Updated 1 year ago

MovieLens_Tag_GenomeDataset_2014
information retrieval natural language processing 2

从应用于 10,000 部电影的 1,100 个标签池中计算出 1,100 万个标签-电影相关性分数。 2014 年 3 月发布。还可以考虑使用 MovieLens 20M 或最新数据集,其中还包含(更新的)标签基因组数据或 Tag Genome 2021 数据集。

Updated 1 year ago

MovieLens_100K
information retrieval computer vision 1

MovieLens 100K 电影评级。 稳定的基准数据集。 1000 位用户对 1700 部电影的 100,000 次评分。 1998 年 4 月发行。

Updated 1 year ago

MovieLens_1M
information retrieval natural language processing 4

MovieLens 100 万电影评级。 稳定的基准数据集。 6000 个用户对 4000 部电影的 100 万个评分。 2/2003 年发行。

Updated 1 year ago

ml-10m
information retrieval computer vision 22

MovieLens 1000 万电影评级。 稳定的基准数据集。 72,000 名用户对 10,000 部电影进行了 1000 万次评分和 100,000 次标签应用。 发布于 1/2009。

Updated 1 year ago

MovieLens-25M
information retrieval natural language processing 2

MovieLens 2500 万电影评级。 稳定的基准数据集。 162,000 名用户对 62,000 部电影进行了 2500 万次评分和 100 万次标签应用。 包括在 1,129 个标签中具有 1,500 万个相关分数的标签基因组数据。 12/2019 发布

Updated 1 year ago

master
target detection computer vision 13

测试数据集

Updated 1 year ago