谷歌发布的地标识别数据集;
您是否曾经浏览过您的度假照片并问自己:我在中国造访的这座寺庙叫什么名字?谁创造了我在法国看到的这座纪念碑?地标识别可以帮助您!这项技术可以直接从图像像素预测地标标签,以帮助人们更好地理解和组织照片集。如今,地标识别研究的一大障碍是缺少大型的带注释的数据集。这促使我们发布了Google-Landmarks(迄今为止最大的全球数据集),以促进这一问题的发展。
数据集分为两组图像,以评估两个不同的计算机视觉任务:识别和检索。数据最初在[1]中进行了描述,并作为Google Landmark Recognition Challenge和Google Landmark Retrieval Challenge的一部分发布。 此外,为了刺激这一领域的研究,我们开放了深度局部特征(DELF),这是一个我们认为特别适合此类任务的细心局部特征描述符。通过此链接可以在github上找到DELF的代码。
更新:我们现在还提供了Google Landmark Boxes数据集,其中包含86,000个边界框。
如果您在研究中使用Google Landmarks数据集,请考虑引用:
H. Noh, A. Araujo, J. Sim, T. Weyand, B. Han, "Large-Scale Image Retrieval with Attentive Deep Local Features", Proc. ICCV'17
如果您在研究中使用Google Landmark Boxes数据集,请考虑引用:
M. Teichmann*, A. Araujo*, M. Zhu and J. Sim, “Detect-to-Retrieve: Efficient Regional Aggregation for Image Search”, Proc. CVPR'19
许可协议
此数据集中列出的图像可在网络上公开获得,并且可能具有不同的许可证。Google不拥有其版权。
如需已下载图片的数据集(8GB):
https://drive.google.com/drive/folders/1_cQXGzqzbF5eL_UmITdZqlEAM7_rgI4c