Select Language

AI社区

公开数据集

AI2推理挑战赛(ARC)2018数据集

AI2推理挑战赛(ARC)2018数据集

649.3M
336 浏览
0 喜欢
2 次下载
0 条讨论
MNIST Classification

ARC数据集包含从各种来源提取的7,787项科学考试问题,包括由AI2附属研究合作伙伴授权提供的科学问题。这些是纯文本的英语考试题......

数据结构 ? 649.3M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    ARC数据集包含从各种来源提取的7,787项科学考试问题,包括由AI2附属研究合作伙伴授权提供的科学问题。这些是纯文本的英语考试题,涵盖了文件中指示的多个年级。每个问题都有一个选择结构(通常有4个答案选项)。这些问题分为2590个“难题”挑战题集(检索和共现方法均无法正确回答的问题)和5197个简单题集。每个都预先分为训练,开发和测试集,如下所示:

    • 难题训练集:1,119

    • 难题开发集:299

    • 难题测试集:1,172

    • 简易训练集:2,251

    • 简易开发集:570

    • 简易测试集:2,376

    每一套都以CSV和JSON两种格式提供。CSV文件在一个单元格中包含问题的全文及其答案选项。JSON文件包含问题的拆分版本,其中问题文本已通过编程与答案选项分开。

    ARC语料库

    ARC语料库包含1400万无序,与科学相关的句子,包括与ARC相关的知识,并作为应对挑战的起点。语料库包含以下句子:从Web下载的与科学有关的文档;Wiktionary的词典定义以及Simple Wikipedia的被标记为科学的文章。有关其构造的详细信息,请参阅(Clark et al。,2018)。请注意,对“挑战”使用语料库是完全可选的,并且系统不限于此语料库。请参阅下载中包含的自述文件,以获取更多信息和该语料库的使用条款。


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:9 去赚积分?
    • 336浏览
    • 2下载
    • 0点赞
    • 收藏
    • 分享