Select Language

公开数据集

微软WikiQA语料库

微软WikiQA语料库

Scene:

MNIST

Data Type:

Classification
所需积分:0 去赚积分?
  • 239浏览
  • 2下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

Microsoft

微软(Microsoft)是一家美国跨国科技企业,以研发、制造、授权和提供广泛的电脑软件服务业务为主。

Data Preview ? 0M

    Data Structure ?

    *数据结构实际以真实数据为准

    WikiQA语料库是一组新的公开可用的问题和句子对,它们被收集并注释以用于开放域问题解答的研究。

    为了反映普通用户的真实信息需求,我们使用了Bing查询日志作为问题源。每个问题都链接到可能具有答案的Wikipedia页面。由于Wikipedia页面的摘要部分提供了有关该主题的基本且通常是最重要的信息,因此我们在此部分中使用句子作为候选答案。

    在众包的帮助下,我们在数据集中包含了3,047个问题和29,258个句子,其中1,473个句子被标记为对应问题的答案句子。

    有关该语料库的更多详细信息,请参见我们的EMNLP-2015论文“ WikiQA:开放域问答的挑战数据集” [Yang等。2015]。

    此外,此下载还包括论文中的实验结果,用于判断“答案触发”任务的评估脚本以及论文作者所标记的答案短语。

    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。