构建一个城市区域功能分类模型(居住区 、学校 、工业园区 、火车站 、飞机场 、公园 、商业区 、政务区、医院等),对给定的地理区域,输入区域的遥感影像和用户的到访数据,预测区域的功能类别
2019“一带一路”国际大数据竞赛-初赛数据集
赛题:基于遥感影像和用户行为的城市区域功能分类
初赛阶段提供5万样本:每个样本对应一个城市功能区域,每个区域提供一张高分辨率遥感影像和一份脱敏后用户的到访记录。
训练集 train_image.tar.gz 包含40000张遥感影像,每张影像的像素为100*100,分辨率为1m。文件命名格式: AreaID_CategoryID.jpg。 例如000001_001.jpg,表示该图片为区域000001的遥感影像,该区域的功能类别为居住区 train_visit.tar.gz 包含40000个文件,每个文件记录一个区域的用户的到访记录。文件命名格式: AreaID_CategoryID.txt。例如000001_001.txt,表示该文件记录区域为000001的用户到访行为,该区域的功能类别为居住区。文件格式为: USERID \t day_a&hour_x|hour_y|..., day_b&hour_x|hour_z|... 例如:aff296a485010219 \t 20190129&21|22,20190218&19|20|21 表示用户aff296a485010219在2019年01月29日的21点、22点, 2019年02月18日的19点、20点和21点到访过该区域
测试集 test_image.tar.gz 包含10000张遥感影像,每张影像的像素为100*100,分辨率为1m。文件命名格式: AreaID.jpg。 例如000001.jpg,表示该图片为区域000001的遥感影像 test_visit.tar.gz 包含10000个文件,每个文件记录一个区域的用户的到访记录。文件命名格式: AreaID.txt。例如000001.txt,表示该文件记录区域为000001的用户到访行为。数据格式同train_visit.tar.gz
选手需要提交的数据(result_data) 选手需要对测试集中的每个区域的功能进行分类,提供的文件格式为: AreaID \t CategoryID …
遥感影像 | 50000张 |
影像大小 | 100*100 |
分辨率 | 1米 |
发布时间 | 2019-04-30 |