全部数据集-数据集市-免费数据资源共享网

行业数据

全部

机器学习训练数据

热门数据集

全网新闻数据(SogouCA) 2012版

搜狗实验室提供，来自若干新闻站点2012年6月—7月期间国内...

免积分下载

排序方式：默认，数量：447

超分辨率图像数据集Urban100

Urban100

5673 183.59 MB

一个用于超分辨率和图像重建的数据集

2019-10-23 （68月前）免积分下载

海伦人脸图像数据集

Helen dataset

6018 522.8MB

使用带标注信息的Flickr图像构建了一个新的人脸图像数据集，标注格式和PUT数据集一致，包含：眼睛，鼻子，嘴巴，眉毛和下巴。

2019-10-16 （69月前）免积分下载

亚马逊网上联合采购关系数据集

Amazon product co-purchasing network metadata

4624 201.04 MB

从亚马逊网站上抓取的 548552 个商品的信息数据；数据采集自 2006 年夏天，数据集于 2007 年由斯坦福大学发布。

2019-10-16 （69月前）免积分下载

亚马逊食品评论数据集

Amazon Fine Food Reviews

4849 642MB

来自亚马逊的精美食品的评论组成的数据集，包含截止 2012 年 10 月份在 Amazon 网站上 568454 条食品评论数据，包括用户、评论内容、评论食品、食品评分等数据。

2019-10-16 （69月前）免积分下载

TWDNE 二次元头像数据集

TWDNE

7578 12.39GB

TWDNE（This Waifu Does Not Exist）包含 10 万+二次元动漫头像及通过 StyleGAN 训练的模型

2019-10-16 （69月前）免积分下载

巴黎圣母院大教堂图像重建数据集

Notre Dame Dataset

4600 1.8GB

Notre Dame 数据集是巴黎圣母院大教堂的 715 张图像重建的数据集，于 2006 年由 Photo Tourism group 发布。

2019-10-16 （69月前）免积分下载

垃圾邮件数据集 Social-Spammer

Social-Spammer

5450 6.78GB

Social-Spammer-Heterogeneous 数据集是从名为 Tagged 的社交软件上收录的，它包含五百六十万的用户和八千五百万用户间的联系。

2019-10-16 （69月前）免积分下载

中文繁体字分词数据集 UD-Chinese-GSD

UD-Chinese-GSD

5122 400.69 MB

UD-Chinese-GSD 数据集是中文繁体自然语言处理数据集，用以中文分词等工作的训练，也可用作多语言编译器开发及跨语言研究。

2019-10-16 （69月前）免积分下载

航空图像中目标检测的大规模数据集DOTA

DOTA: A Large-scale Dataset for Object Detection in Aerial Images

11018 35.38GB

DOTA 数据集是用于航拍图像中的目标检测的大型图像数据集。它可用于发现和评估航拍图像中的物体。DOTA-v1.0 包含来自不同传感器和平台的 2806 幅航拍图像。

2019-10-16 （69月前）免积分下载

人脸年龄检测数据集Adience

Adience dataset

8684 2GB

Adience数据集用于促进年龄和性别识别的研究。总共图像26580张年龄分布在0-60之间。这个数据集的目标是正确的预测年龄和性别。

2019-10-10 （69月前）免积分下载

亚马逊开源的最大社交对话数据集Topical Chat

Topical Chat

4545 约80MB

亚马逊在GitHub上发布了超470万单词21万句子的语料库，并声称这个数据集支持“高质量”和“可重复”的对话系统研究，将成为研究界公开可用的最大的基于知识的社交对话数据集。

2019-10-10 （69月前）免积分下载

自动驾驶数据集NuScenes

NuScenes

5460

首个包括5个雷达，1个激光雷达，6个摄像头，IMU和GPS在内的完整传感器套件的数据集；比KITTI数据集多出7倍和100倍的图像，涵盖23个类别，包括不同类型的车辆，行人，移动设备及其他对象。

2019-10-10 （69月前）免积分下载