Chars74K数据集是一个经典的字符识别数据集,主要包括了英文字符与坎那达语(Kannada)字符,数据集一共有74000张图像,所以叫Chars74K。
该情感分析数据集 包含1,578,627条分类推文,每行标记为1表示积极情绪,0表示负面情绪。
SMS Spam Corpus v.0.1是一组SMS短信标签消息,已收集用于SMS Spam研究。它包含两个英文短信息集合,包含1084和1319条消息,标记为合法或垃圾邮件。
多领域情感数据集包含从Amazon.com获取的部分产品评论,评论包含星级(1至5星)。
数据集来源于中文糖尿病领域权威期刊,数据包括基础研究、临床研究、药物使用、临床病例、诊治方法等多个方面,时间跨度达到7年,涵盖了近年来糖尿病领域最广泛的研究内容和热点。
2018年7月主板上市企业长生生物假疫苗事件震惊全国,之后有网友从政府各级网站收集了将近两年的疫苗流向数据进行了分析统计。
2019未来杯房产租金预测比赛数据
MagicData中文手机录音音频语料库包含755小时的中文普通话朗读语音数据
WIDER FACE共包括3万多张图片近40万个人脸,是目前国际上规模最大、场景最为复杂、难度和挑战性最高的人脸检测公开数据集。