Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集

NLP

Text

Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集前往PC端下载数据

Description

Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集，其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 25 万张图像，每张图片 3 个自然语言描述的问题，每个问题 10 个标准答案，3 个近似答案。

版权信息