使用带标注信息的Flickr图像构建了一个新的人脸图像数据集,标注格式和PUT数据集一致,包含:眼睛,鼻子,嘴巴,眉毛和下巴。
从亚马逊网站上抓取的 548552 个 商品的信息数据;数据采集自 2006 年夏天,数据集于 2007 年由斯坦福大学发布。
来自亚马逊的精美食品的评论组成的数据集,包含截止 2012 年 10 月份在 Amazon 网站上 568454 条食品评论数据,包括用户、评论内容、评论食品、食品评分等数据。
TWDNE(This Waifu Does Not Exist)包含 10 万+二次元动漫头像及通过 StyleGAN 训练的模型
Notre Dame 数据集是巴黎圣母院大教堂的 715 张图像重建的数据集,于 2006 年由 Photo Tourism group 发布。
Social-Spammer-Heterogeneous 数据集是从名为 Tagged 的社交软件上收录的,它包含五百六十万的用户和八千五百万用户间的联系。
UD-Chinese-GSD 数据集是中文繁体 自然语言处理 数据集,用以中文分词等工作的训练,也可用作多语言编译器开发及跨语言研究。
DOTA 数据集是用于航拍图像中的目标检测的大型图像数据集。 它可用于发现和评估航拍图像中的物体。DOTA-v1.0 包含来自不同传感器和平台的 2806 幅航拍图像。
Adience数据集用于促进年龄和性别识别的研究。总共图像26580张年龄分布在0-60之间。这个数据集的目标是正确的预测年龄和性别。
亚马逊在GitHub上发布了超470万单词21万句子的语料库 , 并声称这个数据集支持“高质量”和“可重复”的对话系统研究 , 将成为研究界公开可用的最大的基于知识的社交对话数据集 。
首个包括5个雷达,1个激光雷达,6个摄像头,IMU和GPS在内的完整传感器套件的数据集;比KITTI数据集多出7倍和100倍的图像,涵盖23个类别,包括不同类型的车辆,行人,移动设备及其他对象。