Select Language

AI社区

公开数据集

Visual Question Answering V2.0  一个针对图像内容进行自然语言问答的数据集

Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集

30.7G
559 浏览
0 喜欢
1 次下载
0 条讨论
NLP Text

Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容......

数据结构 ? 30.7G

    README.md

    Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 25 万张图像,每张图片 3 个自然语言描述的问题,每个问题 10 个标准答案,3 个近似答案。

    • 265,016张图像(COCO和抽象场景)

    • 每张图片至少3个问题(平均5.4个问题)

    • 每个问题10个基本事实答案

    • 每个问题3个合理(但可能不正确)的答案

    • 自动评估指标

     


    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:30 去赚积分?
    • 559浏览
    • 1下载
    • 0点赞
    • 收藏
    • 分享