OPIEC是一个开放信息提取(OIE)语料库,由整个英语维基百科构建而成。它包含超过3.41亿个三元组。
OPIEC是一个开放信息抽取(OIE)语料库,构建自整个英语维基百科。它含有超过3.41亿个三元组。语料库中的每个三元组都由丰富的元数据组成:subj/obj/rel中的每个标记以及NLP注释(POS tag,NER tag,…)、出处语句(以及它的依赖性解析、相对于文章的句子顺序)、维基百科文章中包含的原始链接、空间/时间。