3861

微软顺序问题解答(SQA)数据集

Microsoft Research Sequential Question Answering (SQA) Dataset

计算机科学

用于回答问题的语义解析的最新工作集中于冗长而复杂的问题,如果在两个人之间的正常对话中提出问题,其中许多问题似乎是不自然的。

免积分下载
数据集市
2020年06月23日

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

为了探索对话式质量检查环境,我们提出了一个更为现实的任务:回答一系列简单但相互关联的问题。

我们通过要求众包工作者分解WikiTableQuestions(WTQ)中的2,022个问题来创建SQA,其中包含来自Wikipedia的表格的高度复杂的问题。

我们让三名工作人员分解每个WTQ问题,从而产生了6,066个序列的数据集,总共包含17,553个问题。

每个问题还与表格中单元格位置形式的答案相关联。

相关论文:

https://www.microsoft.com/en-us/research/wp-content/uploads/2017/05/acl17-dynsp.pdf

还没有任何文件记录.