Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的机器视觉领域内最具权威性和专业性的图像分割数据集之一。
TIMIT数据集的语音采样频率为16kHz,共包含6300个句子,由来自美国八个主要方言地区的630人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。
这是一个从通过爬虫爬取的谷歌应用商店的APP信息数据集,包含超过10万个APP信息;
包含 7708 个书面表达以及 5507 个口语表达数据。该数据集内容覆盖了六个生活领域,包括:订购披萨,创建汽车维修预约,设置租车,订购电影票,订购咖啡饮料和预订餐厅。
谷歌开放全新自然语言数据集,该数据集中有超过 500 个电影偏好对话,表达了 10,000 多个偏好。
你可以利用这个数据集,通过TensorFlow训练图像识别模型,用以以查找有关的任何内容图片和视频。
数据集由两个文件组成,即训练和验证。每个文件夹包含10个标记为n0~n9的类目,每个类目对应一种猴子图谱。图像为400x300像素或更大,JPEG格式(近1400张图像)。
气象数据要素包括1942年07月以来气温、气压、露点、风向风速、云量、降水量。气象数据来自美国国家气候数据中心(NCDC),每年更新。
空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI;全国空气质量数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。
一个大规模细粒度词汇集标记数据集,该数据集针对超过 1000 类物体进行了约 200 万个高质量的实例分割标注,包含 164k 大小的图像。
从互联网收集的公开消息通知类短信数据集,大约有1百万条短信记录。