Select Language

公开数据集

YouTube喜剧大满贯偏好数据集

YouTube喜剧大满贯偏好数据集

Scene:

Movies and TV Shows

Data Type:

Classification
所需积分:15 去赚积分?
 • 342浏览
 • 2下载
 • 1点赞
 • 收藏
 • 分享

Data Preview ? 6.7M

  Data Structure ?

  *数据结构实际以真实数据为准

  YouTube喜剧Slam是一个视频发现实验,在2011年和2012年在YouTube版本的实验室(称为TestTube)上运行了几个月。在这个实验中,一对视频被展示给用户,用户被要求为他们觉得更有趣的视频投票。视频的左/右位置在呈现给用户之前是随机选择的,以消除位置偏差。视频是从每周更新的大量视频中挑选出来的。

  这个实验的结果之一是一个训练数据集,用于自动预测使用各种功能的用户认为哪个视频更有趣。例如,uploader提供的元数据和/或这些视频的观看页面上的用户评论可以用作功能。有关更多详细信息,请参阅[Web链接]。所附的数据集包括大约170万张优惠票。投票按时间顺序记录。前80%作为培训数据集提供,其余20%作为测试数据集。此数据集中的每一行对应于一对YouTube视频的一票。每个视频都由其YouTube视频ID表示。例如,视频ID“txqiwrbYGrs”的观看页面URL为。用户对一对视频的偏好以字符串的形式呈现?如果左边的视频被认为更有趣,而右边的是?否则此用户投票应作为培训和测试的基本事实。评估应基于预测此偏好的平均准确性,而不是测试分区(提供)。未提供有关投票的任何其他信息(例如用户ID)。

  Attribute Information:

  此文本文件中的每一行代表一个匿名用户投票。每行包含三个逗号分隔的字段。前两个字段是YouTube视频ID。第三个字段是“左”或“右”。左表示这对搭档的第一个视频被选为比第二个更有趣的视频。右表示相反的首选项。  0相关评论
  ×

  帕依提提提温馨提示

  该数据集正在整理中,为您准备了其他渠道,请您使用

  注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。