4038

维基百科中英语-西班牙语术语向量的数据集

Data Set of English-Spanish Term Vectors from Wikipedia

该数据集包含从2009年采样的60,730维基百科的英语文章及其可比较的西班牙文章中提取的术语向量。

免积分下载
数据集市
2020年06月24日

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

该数据集包含从2009年采样的60,730维基百科的英语文章及其可比较的西班牙文章中提取的术语向量。

我们使用此数据集来测试用于创建跨语言文档表示的各种模型,这些工作发表在[Platt et al。EMNLP-2010]和[Yih等。CoNLL-2011]。

此数据集的更多详细信息可以在自述文件中找到。

数据下载地址:

https://www.microsoft.com/en-us/download/details.aspx?id=52596

还没有任何文件记录.