搜狗实验室提供,来自若干新闻站点2012年6月—7月期间国内...
采集自互联网的古诗词数据集,包含20万左右的诗词记录。
语文电子教材图片数据集,包含:北师大版,苏教版,人教版三个版本。
从互联网爬取的457个看图猜成语数据,包含图片。
从互联网爬取的46万篇中文作文。