Select Language

AI社区

公开数据集

Google-Landmarks 用于地标识别和图像恢复实验的数据集

Google-Landmarks 用于地标识别和图像恢复实验的数据集

592.7G
592 浏览
0 喜欢
5 次下载
0 条讨论
Environment,Vehicle,Environment Classification

你有没有浏览过你的假期照片并问自己:我在中国参观的这座寺庙叫什么名字?谁创造了我在法国看到的这座纪念碑?地标识别可以提供......

数据结构 ? 592.7G

    README.md

    你有没有浏览过你的假期照片并问自己:我在中国参观的这座寺庙叫什么名字?谁创造了我在法国看到的这座纪念碑?地标识别可以提供帮助!该技术可以直接从图像像素预测地标标签,以帮助人们更好地理解和组织他们的照片集。今天,地标识别研究的一大障碍是缺乏大型注释数据集。这促使我们发布了迄今为止最大的全球数据集 Google-Landmarks,以促进在这个问题上取得进展。

    Google Landmarks Dataset v2 是用于地标识别和图像恢复实验的数据集,其中包含人造和自然地标的标签注释图像,该版本的数据集包含约 500 万张图像,并分为训练、索引和测试 3 组。

    Content

    数据集包含在线公开可用的图像 URL(此 Python 脚本可能对下载图像有用)。请注意,没有发布图像数据,只有 URL。

    数据集包含测试图像、训练图像和索引图像。测试图像用于两个任务:对于识别任务,可以为每个测试图像预测一个地标标签;对于检索任务,可以为每个测试图像检索相关索引图像。训练图像与地标标签相关联,可用于训练模型以应对识别和检索挑战(有关训练图像地理分布的可视化,请参见 [3])。索引图像用于检索任务,构成应从中检索图像的集合。

    请注意,识别和检索任务的测试集是相同的,以鼓励研究人员对两者进行试验。我们还鼓励参与者使用来自识别任务的训练数据来训练可能对检索任务有用的模型。但是请注意,这两个任务的训练/索引集之间没有共同的界标。

    数据集中列出的图像不受我们的直接控制,因此它们的可用性可能会随着时间的推移而变化,并且数据集文件可能会更新以删除不再有效的 URL。

    Dataset construction

    训练和索引集是通过使用类似于 [4] 中描述的算法的算法对照片的地理位置和视觉相似性进行聚类来构建的。使用局部特征匹配建立训练图像之间的匹配。请注意,每个地标可能有多个集群,它们通常对应于地标的不同视图或不同部分。为了避免偏见,没有使用计算机视觉算法来生成地面实况。相反,我们使用人工注释器在测试图像和地标之间建立了地面实况对应关系。

    License

    The images listed in this dataset are publicly available on the web, and may have different licenses. Google does not own their copyright.

    References

    [1] H. Noh, A. Araujo, J. Sim, T. Weyand, B. Han, "Large-Scale Image Retrieval with Attentive Deep Local Features", Proc. ICCV'17

    [2] M. Teichmann, A. Araujo, M. Zhu and J. Sim, “Detect-to-Retrieve: Efficient Regional Aggregation for Image Search”, Proc. CVPR'19

    [3] A. Araujo, T. Weyand, "Google-Landmarks: A New Dataset and Challenge for Landmark Recognition", Google Research blog post, available online here

    [4] Y.-T. Zheng, M. Zhao, Y. Song, H. Adam, U. Buddemeier, A. Bissacco, F. Brucher T.-S. Chua, H. Neven, “Tour the World: Building a Web-Scale Landmark Recognition Engine,” Proc. CVPR’09


    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:40 去赚积分?
    • 592浏览
    • 5下载
    • 0点赞
    • 收藏
    • 分享