搜狗实验室提供,来自若干新闻站点2012年6月—7月期间国内...
这是一个文本数据集;包含圣经旧约和新约的中英文对照内容。
采集自互联网的古诗词数据集,包含20万左右的诗词记录。
三字经中文带拼音对照文本数据集,包含中文以及拼音,同时包含了每段的解释和启示。
从互联网收集的食谱数据,数据量大约20万条左右,数据集中包含食谱图片链接。
语文电子教材图片数据集,包含:北师大版,苏教版,人教版三个版本。
COVID-19 口罩佩戴数据集
从网上收集的表情包数据集,数据量总计:10412套,图片总数量:85100张。
驾驶员理论考试试题数据集,包含科目一和科目四理论考试涉及的到的所有试题。
从互联网爬取的457个看图猜成语数据,包含图片。
国家标准库基本信息数据集,包含47091条记录。
包含 4916 条全球港口信息数据集,包含港口名称、港口代码、港口英文、所属国家、航线、介绍信息等。
从互联网爬取的46万篇中文作文。