生活日常数据集-数据集市-免费数据资源共享网

行业数据

全部

机器学习训练数据

热门数据集

全网新闻数据(SogouCA) 2012版

搜狗实验室提供，来自若干新闻站点2012年6月—7月期间国内...

免积分下载

排序方式：默认，数量：52

2018年中国行政区省市县区乡镇四级名称数据集

2018 china area data

4311 287.6kb

2018年中国行政区省/市/县区/乡镇四级名称数据集。

2019-11-03 （67月前）免积分下载

乌云网公开漏洞信息数据集

wooyun dataset

4313 11.1MB

包含乌云已确认漏洞和已公开漏洞的状态、厂商、Rank等数据用于分析哪些是良心厂商。

2019-11-03 （67月前）免积分下载

20W微博用户的数据

Data of 200000 weibo users

4769 34.8MB

2015年收集了20W新浪微博用户的公开数据。

2019-11-03 （67月前）免积分下载

三国人物结构化数据

Characters of the Three Kingdoms

7867

来自github的一个三国人物信息数据集；数据主要整理自维基百科、百度百科和其他网络资源。

2019-11-03 （67月前）免积分下载

亚马逊网上联合采购关系数据集

Amazon product co-purchasing network metadata

4555 201.04 MB

从亚马逊网站上抓取的 548552 个商品的信息数据；数据采集自 2006 年夏天，数据集于 2007 年由斯坦福大学发布。

2019-10-16 （67月前）免积分下载

亚马逊食品评论数据集

Amazon Fine Food Reviews

4799 642MB

来自亚马逊的精美食品的评论组成的数据集，包含截止 2012 年 10 月份在 Amazon 网站上 568454 条食品评论数据，包括用户、评论内容、评论食品、食品评分等数据。

2019-10-16 （67月前）免积分下载

巴黎圣母院大教堂图像重建数据集

Notre Dame Dataset

4543 1.8GB

Notre Dame 数据集是巴黎圣母院大教堂的 715 张图像重建的数据集，于 2006 年由 Photo Tourism group 发布。

2019-10-16 （67月前）免积分下载

垃圾邮件数据集 Social-Spammer

Social-Spammer

5398 6.78GB

Social-Spammer-Heterogeneous 数据集是从名为 Tagged 的社交软件上收录的，它包含五百六十万的用户和八千五百万用户间的联系。

2019-10-16 （67月前）免积分下载

人脸年龄检测数据集Adience

Adience dataset

8604 2GB

Adience数据集用于促进年龄和性别识别的研究。总共图像26580张年龄分布在0-60之间。这个数据集的目标是正确的预测年龄和性别。

2019-10-10 （68月前）免积分下载

亚马逊开源的最大社交对话数据集Topical Chat

Topical Chat

4465 约80MB

亚马逊在GitHub上发布了超470万单词21万句子的语料库，并声称这个数据集支持“高质量”和“可重复”的对话系统研究，将成为研究界公开可用的最大的基于知识的社交对话数据集。

2019-10-10 （68月前）免积分下载

频率最高的9933个最常用汉字数据集

most_frequent_chinese

4645 1MB

数据的收集源于reddit用户areyde的一个简单的问题：“学习所有汉字意味着什么？”可以简化为“您可以为学习汉字制定什么目标？”

2019-09-30 （68月前）免积分下载

垃圾分类数据集

WASTE CLASSIFICATION

12167 225MB

面对五花八门的生活垃圾，完全搞明白它们的最终归属并不容易，我们可以借助数据的力量，尝试建立分类模型。

2019-09-24 （68月前）免积分下载