Select Language

AI社区

公开数据集

AI2推理挑战赛(ARC)2018数据集

AI2推理挑战赛(ARC)2018数据集

649.3M
358 浏览
0 喜欢
2 次下载
0 条讨论
MNIST Classification

ARC数据集包含从各种来源提取的7,787项科学考试问题,包括由AI2附属研究合作伙伴授权提供的科学问题。这些是纯文本的英语考试题......

数据结构 ? 649.3M

  Data Structure ?

  * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

  README.md

  ARC数据集包含从各种来源提取的7,787项科学考试问题,包括由AI2附属研究合作伙伴授权提供的科学问题。这些是纯文本的英语考试题,涵盖了文件中指示的多个年级。每个问题都有一个选择结构(通常有4个答案选项)。这些问题分为2590个“难题”挑战题集(检索和共现方法均无法正确回答的问题)和5197个简单题集。每个都预先分为训练,开发和测试集,如下所示:

  • 难题训练集:1,119

  • 难题开发集:299

  • 难题测试集:1,172

  • 简易训练集:2,251

  • 简易开发集:570

  • 简易测试集:2,376

  每一套都以CSV和JSON两种格式提供。CSV文件在一个单元格中包含问题的全文及其答案选项。JSON文件包含问题的拆分版本,其中问题文本已通过编程与答案选项分开。

  ARC语料库

  ARC语料库包含1400万无序,与科学相关的句子,包括与ARC相关的知识,并作为应对挑战的起点。语料库包含以下句子:从Web下载的与科学有关的文档;Wiktionary的词典定义以及Simple Wikipedia的被标记为科学的文章。有关其构造的详细信息,请参阅(Clark et al。,2018)。请注意,对“挑战”使用语料库是完全可选的,并且系统不限于此语料库。请参阅下载中包含的自述文件,以获取更多信息和该语料库的使用条款。


  ×

  帕依提提提温馨提示

  该数据集正在整理中,为您准备了其他渠道,请您使用

  注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
  暂无相关内容。
  暂无相关内容。
  • 分享你的想法
  去分享你的想法~~

  全部内容

   欢迎交流分享
   开始分享您的观点和意见,和大家一起交流分享.
  所需积分:9 去赚积分?
  • 358浏览
  • 2下载
  • 0点赞
  • 收藏
  • 分享