排序方式:默认,数量:445
中文作文数据集

中文作文数据集

chinese composition dataset
396 290MB

从互联网爬取的46万篇中文作文。

2021-01-24 (1月前) 100
20万中国诗词大全数据集

20万中国诗词大全数据集

chinese poem dataset
505 92MB

采集自互联网的古诗词数据集,包含20万左右的诗词记录。

2021-01-17 (2月前) 20
抗hiv活性分子

抗hiv活性分子

anti hiv molecular
752

整理自pubchem的10000多个针对hiv病毒的活性实验。包括13622和活性分子和369406个非分子的便准话smiles分子式。

2021-01-02 (2月前) 免积分下载
全球港口信息数据集

全球港口信息数据集

Port Information Dataset
700 2MB

包含 4916 条全球港口信息数据集,包含港口名称、港口代码、港口英文、所属国家、航线、介绍信息等。

2020-12-31 (2月前) 5
英语词汇数据库

英语词汇数据库

WordNet
595

WordNet是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。

2020-12-31 (2月前) 免积分下载
WHAM 噪音数据集

WHAM 噪音数据集

WHAM
690

人工混合的噪音数据集;

2020-12-31 (2月前) 免积分下载
VoxForge 语音库

VoxForge 语音库

VoxForge
419 12.6GB

VoxForge 创建的初衷是为免费和开源的语音识别引擎收集标注录音.

2020-12-31 (2月前) 免积分下载
RIDER Lung CT 肺癌 CT 影像数据集

RIDER Lung CT 肺癌 CT 影像数据集

RIDER Lung CT
338 7.55GB

RIDER Lung CT Dataset 是用于评估非小细胞肺癌患者 CT 扫描图像的肿瘤变异性数据集,其包含 15419 张图片。

2020-12-31 (2月前) 免积分下载
公共领域声音备份

公共领域声音备份

Public Domain Sounds Backup
175 525MB

这是 2009 年 4 月之前提交给 pdsounds.org 635 个无版权录音的备份。

2020-12-31 (2月前) 免积分下载
musdb18曲目数据集

musdb18曲目数据集

musdb18
185 4.4GB

musdb18是一个数据集,包括150首不同流派的全长音乐曲目(约10小时的持续时间),以及它们各自独立的鼓、低音、人声和其他词干。

2020-12-31 (2月前) 免积分下载
博世公司车道标记数据集

博世公司车道标记数据集

llamas
206

使用激光雷达贴图自动添加注释的车道标记。

2020-12-31 (2月前) 免积分下载
Libri-Light语音数据集

Libri-Light语音数据集

Libri-Light
160 3.5TB

Libri-Light 提供 60 k 小时以上的无标签语音、用于有限监督的小型培训集(10 小时、1 小时或 10 分钟的标签语音)

2020-12-31 (2月前) 免积分下载
共 38 页,当前第 1 页。