排序方式:默认,数量:19
通用知识图谱数据集

通用知识图谱数据集

ownthink
193

ownthink致力于最大的中文开放知识图谱,目前已经对两千五百多万实体进行了融合,拥有亿级别的实体属性关系,知识还在不断更新中。

2020-05-19 (3月前) 免积分下载
搜狐读书类别数据

搜狐读书类别数据

sohu_book
431 2.2 GB

该数据集是搜狐的读书类别的历史文章数据,大小为2.2G,可以选择性使用地来探索汽车领域的相关数据,例如文本分类,情感分析等。

2020-05-01 (3月前) 免积分下载
中华新华字典数据库

中华新华字典数据库

chinese-xinhua
465

中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。

2020-04-21 (4月前) 免积分下载
俄语手写字母分类数据集

俄语手写字母分类数据集

Classification of Handwritten Letters
347 442MB

俄语手写字母分类数据集手写的俄文小写字母照片制作数据库。

2020-04-21 (4月前) 免积分下载
僧伽罗语多语种TTS语料库

僧伽罗语多语种TTS语料库

Sinhala TTS
270 699M

该数据集包含僧伽罗语的多扬声器高质量转录音频数据,由斯里兰卡的Google收集。

2020-04-17 (4月前) 免积分下载
机器之心开放人工智能词库

机器之心开放人工智能词库

Artificial-Intelligence-Terminology
227

我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识高效、广泛地传播(第二版)。

2020-04-17 (4月前) 免积分下载
180种鸟类图片数据集

180种鸟类图片数据集

100-bird-species
530 2GB

180种鸟类的数据集。24497个训练图像,900个测试图像(每个物种5个)和900个验证图像(每个物种5个)。

2020-04-11 (4月前) 免积分下载
10种猴子图片数据集

10种猴子图片数据集

10-monkey-species
489 554MB

用于细粒度分类的图像数据集

2020-04-11 (4月前) 免积分下载
维基百科阅读数据

维基百科阅读数据

WikiReading
367

来自谷歌研究院的超大自然语言文本语料数据集。 许可:

2020-04-07 (4月前) 免积分下载
维基链接数据集

维基链接数据集

wiki-links
395

谷歌发布的大型数据集合Wikilinks 可让程序更好地理解人类语言,该数据集包含超过3百万个实体的4000万个提及。

2020-04-07 (4月前) 免积分下载
NIPS论文数据集

NIPS论文数据集

nips papers
307 408MB

该数据集包括迄今为止所有NIPS论文的标题,作者,摘要和摘录的文本(范围从1987年第一次会议到2016年会议)。

2020-04-07 (4月前) 免积分下载
腾讯AI实验室汉字词句嵌入语料库

腾讯AI实验室汉字词句嵌入语料库

Tencent_AILab_ChineseEmbedding
664 6.3GB

关于汉语单词和短语的连续分布表示的语料库。

2020-04-07 (4月前) 免积分下载
共 2 页,当前第 1 页。