3414

Project Gutenberg 语言模型数据集

Project Gutenberg

Gutenberg 免费 电子书 文本数据集

该数据集包含超过57,000种免费电子书。

免积分下载
数据集市
2020年10月31日

相关数据

新浪微博用户关系数据
新浪微博用户关系数据
数据集中包括用户320个,用户间关系526条 免积分下载
中文文本分类数据集THUCNews
中文文本分类数据集THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~201... 免积分下载
2012年综合选举推文
2012年综合选举推文
该数据集标识了收集到的3800万条推文,用于分析与2012年... 免积分下载

数据介绍

该数据集包含超过57,000种免费电子书。可供选择epub、kindle,plainText格式,带图片和不带图片选项下载或在线阅读。包含众多的世界伟大的文学,特别是版权已过期的旧作品。在数千名志愿者的帮助下对其进行了数字化和认真校对。

文件

类型:epub、kindle、txt文本 数量:57000本免费电子书

相关论文

1.Kim Y. Convolutional Neural Networks for Sentence Classification[J]. Eprint Arxiv, 2014. 2.Joulin A, Grave E, Bojanowski P, et al. Bag of Tricks for Efficient Text Classification[J]. 2016:427-431. 3.Zhang Y, Wallace B. A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification[J]. Computer Science, 2015. 4.Ji Y L, Dernoncourt F. Sequential Short-Text Classification with Recurrent and Convolutional Neural Networks[J]. 2016:515-520. 5.Chen G, Ye D, Xing Z, et al. Ensemble application of convolutional and recurrent neural networks for multi-label text categorization[C]// International Joint Conference on Neural Networks. IEEE, 2017:2377-2383.

还没有任何文件记录.