排序方式:默认,数量:23
中文作文数据集

中文作文数据集

chinese composition dataset
1543 290MB

从互联网爬取的46万篇中文作文。

2021-01-24 (8月前) 100
20万中国诗词大全数据集

20万中国诗词大全数据集

chinese poem dataset
1952 92MB

采集自互联网的古诗词数据集,包含20万左右的诗词记录。

2021-01-17 (8月前) 20
英语单词数据集

英语单词数据集

english-words
664

包含超过 466k 个英语单词的文本文件。

2020-12-31 (9月前) 免积分下载
AI2科学问答数据集(多选)

AI2科学问答数据集(多选)

AI2 Science Questions
536 56MB

来自学生评估的 2707 个多选科学题

2020-10-31 (11月前) 免积分下载
通用知识图谱数据集

通用知识图谱数据集

ownthink
1606

ownthink致力于最大的中文开放知识图谱,目前已经对两千五百多万实体进行了融合,拥有亿级别的实体属性关系,知识还在不断更新中。

2020-05-19 (16月前) 免积分下载
搜狐读书类别数据

搜狐读书类别数据

sohu_book
1139 2.2 GB

该数据集是搜狐的读书类别的历史文章数据,大小为2.2G,可以选择性使用地来探索汽车领域的相关数据,例如文本分类,情感分析等。

2020-05-01 (17月前) 免积分下载
中华新华字典数据库

中华新华字典数据库

chinese-xinhua
1459

中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。

2020-04-21 (17月前) 免积分下载
俄语手写字母分类数据集

俄语手写字母分类数据集

Classification of Handwritten Letters
1030 442MB

俄语手写字母分类数据集手写的俄文小写字母照片制作数据库。

2020-04-21 (17月前) 免积分下载
僧伽罗语多语种TTS语料库

僧伽罗语多语种TTS语料库

Sinhala TTS
1123 699M

该数据集包含僧伽罗语的多扬声器高质量转录音频数据,由斯里兰卡的Google收集。

2020-04-17 (17月前) 免积分下载
机器之心开放人工智能词库

机器之心开放人工智能词库

Artificial-Intelligence-Terminology
841

我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识高效、广泛地传播(第二版)。

2020-04-17 (17月前) 免积分下载
180种鸟类图片数据集

180种鸟类图片数据集

100-bird-species
1538 2GB

180种鸟类的数据集。24497个训练图像,900个测试图像(每个物种5个)和900个验证图像(每个物种5个)。

2020-04-11 (17月前) 免积分下载
10种猴子图片数据集

10种猴子图片数据集

10-monkey-species
1796 554MB

用于细粒度分类的图像数据集

2020-04-11 (17月前) 免积分下载
共 2 页,当前第 1 页。