4495

开放信息提取语料库(OPIEC)

OPIEC

OPIEC 语料库 维基百科 英语语料 文本数据集

OPIEC是一个开放信息提取(OIE)语料库,由整个英语维基百科构建而成。它包含超过3.41亿个三元组。

免积分下载
数据集市
2019年12月16日
~67 GB

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

OPIEC是一个开放信息抽取(OIE)语料库,构建自整个英语维基百科。它含有超过3.41亿个三元组。语料库中的每个三元组都由丰富的元数据组成:subj/obj/rel中的每个标记以及NLP注释(POS tag,NER tag,…)、出处语句(以及它的依赖性解析、相对于文章的句子顺序)、维基百科文章中包含的原始链接、空间/时间。

数据规格

语料来源 维基百科
发布时间 2019年
还没有任何文件记录.