Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
xiaoxiong 36109504ba | 1 year ago | |
---|---|---|
README.md | 1 year ago |
DuEE1.0是百度发布的中文事件抽取数据集,包含65个事件类型的1.7万个具有事件信息的句子(2万个事件)。事件类型根据百度风云榜的热点榜单选取确定,具有较强的代表性。65个事件类型中不仅包含「结婚」、「辞职」、「地震」等传统事件抽取评测中常见的事件类型,还包含了「点赞」等极具时代特征的事件类型。数据集中的句子来自百度信息流资讯文本,相比传统的新闻资讯,文本表达自由度更高,事件抽取的难度也更大。
该任务的目标是对于给定的自然语言句子,根据预先指定的事件类型和论元角色,识别句子中所有目标事件类型的事件,并根据相应的论元角色集合抽取事件所对应的论元。其中目标事件类型 (event_type) 和论元角色 (role) 限定了抽取的范围,例如 (event_type:胜负,role:时间,胜者,败者,赛事名称)、(event_type:夺冠,role:夺冠事件,夺冠赛事,冠军)。
句子级事件抽取输入/输出:
输入:包含事件信息的一个或多个连续完整句子。
输出:属于预先定义的事件类型、论元角色的事件论元。
输入示例:
{
"text": "历经4小时51分钟的体力、意志力鏖战,北京时间9月9日上午纳达尔在亚瑟·阿什球场,以7比5、6比3、5比7、4比6和6比4击败赛会5号种子俄罗斯球员梅德韦杰夫,夺得了2019年美国网球公开赛男单冠军。",
"id": "6a10824fe9c7b2aa776aa7e3de35d45d"
}
输出示例:
{
"id": "6a10824fe9c7b2aa776aa7e3de35d45d",
"event_list": [
{
"event_type": "竞赛行为-胜负",
"arguments": [
{
"role": "时间",
"argument": "北京时间9月9日上午"
},
{
"role": "胜者",
"argument": "纳达尔"
},
{
"role": "败者",
"argument": "5号种子俄罗斯球员梅德韦杰夫"
},
{
"role": "赛事名称",
"argument": "2019年美国网球公开赛"
}
]
},
{
"event_type": "竞赛行为-夺冠",
"arguments": [
{
"role": "时间",
"argument": "北京时间9月9日上午"
},
{
"role": "夺冠赛事",
"argument": "2019年美国网球公开赛"
},
{
"role": "冠军",
"argument": "纳达尔"
}
]
}
]
}
如在学术论文中使用该数据集,请添加相关引用说明,具体如下:
Li, X., et al.: DuEE: a large-scale dataset for Chinese event extraction in real-world scenarios. In: Zhu, X., Zhang, M., Hong, Yu., He, R. (eds.) NLPCC 2020. LNCS (LNAI), vol. 12431, pp. 534–545. Springer, Cham (2020).论文地址
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》