排序方式:默认,数量:447
机器翻译数据集

机器翻译数据集

Machine Translation of Various Languages
5676 15 GB

约30,000,000个句子及其翻译

2020-11-30 (47月前) 免积分下载
实体专有名词数据集

实体专有名词数据集

JRC Names
3638 756.00Mb

JRC Names 是一个跨语言实体名称语料库,该语料库包含了大量跨语言人名和组织名称(称之为“实体”),包括不同语言的实体名称,包括汉语、英语、拉丁语、希腊语、阿拉伯语、斯拉夫语、日本语等。

2020-11-30 (47月前) 免积分下载
Elektra自动驾驶数据集

Elektra自动驾驶数据集

Elektra
5061

Elektra 是一个自动驾驶汽车项目,由 CVC 研究中心以及 UAB 和 UPC 大学的研究小组开发。

2020-11-30 (47月前) 免积分下载
中国传统山水画数据集

中国传统山水画数据集

Chinese-Landscape-Painting-Dataset
6904

2192幅高质量中国传统山水画组成的新数据集,这些山水画来自普林斯顿艺术博物馆藏品。

2020-11-30 (47月前) 免积分下载
AVA数据集

AVA数据集

atomic visual actions
4482

第一个大规模的美学质量评估数据库

2020-11-30 (47月前) 免积分下载
WDW数据集

WDW数据集

Who-did-What Dataset
3471 26 GB

一个阅读理解数据集

2020-11-30 (47月前) 免积分下载
三字经文本数据集

三字经文本数据集

Three-Character Classic
4024 0MB

三字经中文带拼音对照文本数据集,包含中文以及拼音,同时包含了每段的解释和启示。

2020-10-31 (48月前) 5
圣经中英对照文本数据集

圣经中英对照文本数据集

Biblical Chinese English text dataset
3826 3MB

这是一个文本数据集;包含圣经旧约和新约的中英文对照内容。

2020-10-31 (48月前) 50
Jeopardy数据集

Jeopardy数据集

200000_jeopardy_questions
3728 53MB

包含216,930个危险问题。

2020-10-31 (48月前) 免积分下载
语义关系分类数据集SemEval2007 -Task4

语义关系分类数据集SemEval2007 -Task4

SemEval2007 -Task4
3753 491 KB

小型数据集,包含 7 种关系类型和总共 1529 个注释示例。

2020-10-31 (48月前) 免积分下载
Project Gutenberg 语言模型数据集

Project Gutenberg 语言模型数据集

Project Gutenberg
4064

该数据集包含超过57,000种免费电子书。

2020-10-31 (48月前) 免积分下载
康奈尔大学(Cornell)提供的影评数据集数据集

康奈尔大学(Cornell)提供的影评数据集数据集

Cornell Movie Review Data
4591

由电影评论组成,其中持肯定和否定态度的各1,000 篇;另外还有标注了褒贬极性的句子各5,331 句,标注了主客观标签的句子各5,000 句。

2020-10-31 (48月前) 免积分下载
共 38 页,当前第 3 页。