Wan_

Datasets

welding_seam
image processing computer vision 1

焊缝分割数据集 本数据集包含焊缝图像192张,并使用伪彩色标注进行训练,下面对数据集各文件夹进行说明: 1、annotations_Hui:里面包含灰度标注图像192张 2、annotations_Wei: 里面包含伪彩色标注图像192张 3、Hui_txt: 使用该目录下的txt将使用灰度标注图像进行训练 4、Wei_txt: 使用该目录下的txt将使用伪彩色标注图像进行训练 5、images: 原图所在文件夹 6、label.txt: 数据集标签 7、coco.json: 使用EISeg交互式分割标注工具标注生成的json文件 8、*.py皆为组建数据集所使用的.py文件,使用步骤依次运行rename.py、list.py、create.py、最后view.py可为数据集可视化

Updated 1 year ago

Inspired
question answering system natural language processing 0

电影推荐对话数据集 MNLP 2020 论文 "INSPIRED: Toward Sociable Recommendation Dialogue Systems"的数据集 带注释的对话框(train.tsv、dev.tsv、test.tsv)在data/dialog_data. 调查结果在下data/survey_data。 电影数据库在data/movie_database.tsv.

Updated 1 year ago

drug-target-interaction
knowledge graph natural language processing 3

此数据集包含从 DrugBank、KEGG Drug、DCDB 和 Matador 收集的药物和目标之间的相互作用。它最初由Perlman 等人收集。它包含 315 种药物、250 个靶点、1,306 种药物-靶点相互作用、5 种药物-药物相似性以及 3 种类型的靶点-靶点相似性。药物-药物相似性包括基于化学、基于配体、基于表达、基于副作用和基于注释的相似性。目标-目标相似性包括基于序列、基于蛋白质-蛋白质相互作用网络和基于基因本体的相似性。数据集的原始任务是根据网络中不同类型的相似性来预测药物和目标之间的新相互作用。

Updated 1 year ago

Diabetes_Knowledge_Graph
knowledge graph natural language processing 4

瑞金医院MMC人工智能辅助构建知识图谱数据 本数据集来源于41篇中文糖尿病领域专家共识,数据包括基础研究、临床研究、药物使用、临床病例、诊治方法等多个方面,时间跨度达到7年,涵盖了近年来糖尿病领域最广泛的研究内容和热点。数据集的标注者都具有医学背景,共标注了22,050个医学实体和6,890对实体关系。依托于该数据集,包括医生、科研人员、企业开发者就能开展用于临床诊断的知识库,知识图谱,辅助诊断等产品开发,进一步探索研究糖尿病的奥秘。

Updated 1 year ago

Tuberculosis-Image
medical image analysis computer vision 3

结核病图像数据集 带有注释的结核病图像数据集。结核病 (TB) 是一种传染病,通常由结核分枝杆菌 (MTB) 细菌引起。结核病通常会影响肺部,但也会影响身体的其他部位。大多数感染没有症状,在这种情况下,它被称为潜伏性结核病。数据集它包含 928 个痰图像,边界框为 3734 个杆菌。 XML 文件中包含图像的边界框详细信息。

Updated 1 year ago

Instacart_Market_Basket_Analysis
information extraction natural language processing 0

此数据集是一组描述客户订单随时间变化的关系文件。可以用来预测用户下一次订购的产品。该数据集是匿名的,包含来自20多万Instacart用户的300多万份杂货订单样本。对于每个用户,提供了4到100个订单,以及每个订单中购买的产品序列。数据集还提供下订单的星期和时间,以及订单之间的相对时间度量。

Updated 1 year ago

Google-Landmarks
image search computer vision 1

该数据集包含可在线公开途径获取图像 URL(可以通过Python 脚本下载图像)。请注意,不会发布任何图像数据,只会发布 URL。 数据集包含测试图像、训练图像和索引图像。 测试图像用于两个任务:对于识别任务,可以为每个测试图像预测一个地标标签; 对于检索任务,可以为每个测试图像检索相关索引图像。训练图像与地标标签相关联,可用于训练模型以应对识别和检索挑战。 索引图像用于检索任务,构成应从中检索图像的集合。

Updated 1 year ago

Unity-Answers
question answering system natural language processing 0

该数据集专门针对 NLP/NLU 问题。该集合的主要目的是创建一个面向领域的对话系统,用于回答与 Unity3D 和游戏开发相关的问题。数据的其他用途是文本分类和论坛问题 EDA。 数据注解 数据集包含两个单独的文件: headers.csv - 每个问题的 Web 预览,其中包含问题的标题、作者的匿名 ID、问题的回复和投票评级、问题状态(评论、发布、回答、编辑、提问); best_answers.json - 已回答的问题(回复大于 0),其中包含问题的标题、问题的回复和投票评分、与问题相关的标签、对应的 Markdown 符号格式的最佳答案;

Updated 1 year ago

webkb
text categorization natural language processing 2

WebKB 数据集包含 877 份科学出版物,分为五类。引文网络由 1608 个链接组成。数据集中的每个出版物都由一个 0/​​1 值的词向量描述,表示字典中相应词的缺失/存在。该词典包含 1703 个独特的单词

Updated 1 year ago

social-spammer
text categorization natural language processing 1

这个匿名数据集是从 Tagged.com 社交网络网站收集的。它包含 560 万用户和他们之间的 8.58 亿个链接。每个用户都有 4 个特征,并被手动标记为“垃圾邮件发送者”或“不是垃圾邮件发送者”。每个链接代表两个用户之间的一个动作,包括一个时间戳和一个类型。该网络包含 7 种匿名类型的链接。数据集的原始任务是根据他们的关系和非关系特征识别(即分类)垃圾邮件发送者用户。

Updated 1 year ago

Clipart1k
target detection computer vision 48

在 Clipart1k 中,要检测的目标域类与源域中的目标域类相同。剪贴画域的所有图像都是从一个数据集(即CMPlaces)和两个图像搜索引擎(即Openclipart2和Pixabay3)收集的。使用的搜索查询是 CMPlaces 中使用的 205 个场景类(例如牧场),用于收集具有复杂背景的各种对象和场景。

Updated 1 year ago

FireAndSmoke
target detection computer vision 5

该数据集由早期火灾和烟雾数据集的图像组成。数据集由在真实场景中使用手机捕获的早期火灾和烟雾图像组成。图像是在各种照明条件(室内和室外场景)、天气等下拍摄的。此数据集非常适合早期火灾和烟雾检测。数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景,如垃圾焚烧、纸塑焚烧、大田作物焚烧、家庭烹饪等。

Updated 1 year ago

GIGN
target detection computer vision 6

Garbage In Images (GINI) Dataset 包含2561张图像,956张图像包含垃圾,其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

Updated 1 year ago

ShanghaiTech
target detection computer vision 3

上海科技数据集是一个大规模的人群计数数据集。它由 1198 张带注释的人群图像组成。数据集分为两部分,A 部分包含 482 张图像,B 部分包含 716 张图像。A部分分为分别由300张和182张图像组成的训练子集和测试子集。B部分分为训练和测试子集,由400张和316张图像组成。人群图像中的每个人都用靠近头部中心的一个点进行注释。该数据集总共由 330165 名带注释的人组成。A部分的图像是从互联网上收集的,而B部分的图像是在上海繁忙的街道上收集的。

Updated 1 year ago

Image_Super-resolution_Dataset
image processing computer vision 32

一些常用的图像超分辨率数据集: Set5、Set14、Urban100、Sun-Hays 80、Manga109、historical、General100、T91、BSD100、BSD200、BSD300、BSD500

Updated 1 year ago