3603

微软软研究院问答语料库

Microsoft Research Question-Answering Corpus

语料 问答 微软研究院

微软研究院问答语料库

免积分下载
数据集市
2020年06月23日

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

此下载仅包含以下数据:一个文本文件,其中包含针对Encarta 98文本的1.4K问题、Encarta 98的全文以及一组识别Encarta中完全或部分回答问题的文本片段的人工注释。

这些注释还指定了关于匹配的精确性质的信息,例如问题和答案的语言形式是否相似。

注释数据被分成两种不同的方式,以促进不同的算法训练方法:

1)10个文件,每个文件包含原始1.4K问题的10%,以及每个问题的完整答案集;

2)10个文件,每个文件包含10K+问题/答案对的完整集合的10%。

还没有任何文件记录.