Select Language

AI社区

公开数据集

Quora 问答数据集

Quora 问答数据集

381.2M
563 浏览
0 喜欢
2 次下载
0 条讨论
NLP,MNIST Classification

Quora 是一个获取和分享知识的问答平台,它能够促进人们互相学习,以更好地认识这个世界。每个月有超过 1 亿的人访问 Quora,所......

数据结构 ? 381.2M

  Data Structure ?

  * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

  README.md

  Quora 是一个获取和分享知识的问答平台,它能够促进人们互相学习,以更好地认识这个世界。每个月有超过 1 亿的人访问 Quora,所以有许多人可能提出相似的问题。然而这些具有相似意图的问题可能会使得寻求者需要花费更多的时间,才能找到所需的最佳答案,而答题者可能也会觉得很多问题存在重复。

  为了更好地发掘那些具有相似意图的问题,以帮助用户更快地找到问题的高质量答案,提高用户使用体验,Quora 在 Kaggle 上举办了本次竞赛: Quora Question Pairs。

  本次比赛的目标是预测所提供的问题对中哪一个问题包含两个具有相同含义的问题。地面真相是人类专家提供的一套标签。理由真理标签本质上是主观的,因为句子的真正含义永远不能确切地知道。人的标签也是一个"嘈杂"的过程,理性的人会不同意。因此,此数据集上的基础真实标签应视为"知情",但不应 100% 准确,并且可能包括不正确的标签。我们认为,总体而言,标签代表一种合理的共识,但根据数据集中的各个项目的情况,这通常并非如此。

  **请注意:**作为一种反作弊措施,Kaggle 已经用计算机生成的问题对补充了测试集。这些行不是来自 Quora,也不计入评分。训练集中的所有问题都是Quora的真实例子。

  字段描述:

  • ID - 训练集问题对的 ID

  • qid1, qid2 - 每个问题的唯一 ID(仅在火车.csv 中提供)

  • 问题1,问题2 - 每个问题的全文

  • is_duplicate - 目标变量,如果问题1和问题2的含义基本相同,则设置为 1,否则为 0。

  ×

  帕依提提提温馨提示

  该数据集正在整理中,为您准备了其他渠道,请您使用

  注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
  暂无相关内容。
  暂无相关内容。
  • 分享你的想法
  去分享你的想法~~

  全部内容

   欢迎交流分享
   开始分享您的观点和意见,和大家一起交流分享.
  所需积分:13 去赚积分?
  • 563浏览
  • 2下载
  • 0点赞
  • 收藏
  • 分享