该数据集中的X射线图像来自美国马里兰州蒙哥马利县卫生与人类服务部的结核病控制计划。该组包含138个后 - 前X射线,其中80个X射线是正常的,58个X射线是异常的,具有结核病的表现。
该数据集中的X射线图像已由中国广东省深圳市深圳市第三医院收集。X射线是深圳医院常规护理的一部分。该集包含JPEG格式的图像。有340例正常X射线和275例异常X射线显示结核病的各种表现。
该数据库是PhysioBank项目的一个子数据库,是第一套用于评估心律失常检测器的通用标准测试材料,并已用于此目的以及全球500多个地点的心脏动力学基础研究。
DiaRetDB1是一个公共数据库,用于评估和评估糖尿病视网膜病变检测算法。该数据库包含眼底的数字图像和几个着名的糖尿病眼底病变(硬性渗出物,软性渗出物,微动脉瘤和出血)的专家基础真实标注。
数据集中包含了1000万张图片,是世界上最大的公开数据集。
公开数据集中最常用的英文语料,其中包含了1000小时的16kHz有声书录音,并且经过切割和整理成每条10秒左右的、经过文本标注的音频文件,非常适合入门使用。
FMA 是音乐分析数据集,由整首 HQ 音频、预计算的特征,以及音轨和用户级元数据组成。它是一个公开数据集,用于评估 MIR 中的多项任务。
VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。
VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。
VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。
MSMARCO数据集包含微软BING搜索的query以及query对应的top 10的搜索结果。超过人类的意思就是说,给定query和top 10搜索结果,机器找出的答案比普通人找的更准。