CDConv

${num_stars} Modify
CDConv是第一个高质量中文对话一致性检测数据集,包含12K对话Session,覆盖多轮对话中的句内冲突、角色混淆、历史冲突等全面丰富的对话冲突类型。该数据采用一系列方法,通过模拟常见的用户行为来自动触发聊天机器人产生对话冲突,然后由人工标注得到具体冲突类型。聊天机器人采用领先的中文对话机器人百度PLATO和清华EVA。该数据集关注多轮对话中的内部冲突,更符合对话任务特点,可用于对话冲突检测和对话质量改善等相关研究。
File Name
Size
Available Clusters
Status
Creator
Upload Time
Operate
642 KiB
CPU/GPU
Private Public
2023-01-29 12:59:49