Select Language

公开数据集

Sports-1M 体育运动数据集

Sports-1M 体育运动数据集

Scene:

Person

Data Type:

Classification
所需积分:10 去赚积分?
  • 427浏览
  • 6下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

Stanford University

A place for learning, discovery, innovation, expression and discourse

Data Preview ? 53M

    Data Structure ?

    *数据结构实际以真实数据为准

    Sports-1M 数据集在知识共享 3.0 下获得许可,包含 1,133,158 个视频 URL,这些 URL 使用 YouTube 主题 API 用 487 个体育标签自动注释。要下载数据集,请查看我们的 Github 存储库,或者直接使用:

    $ git clone https://github.com/gtoderici/sports-1m-dataset.git

    然后查看随附的 README 以了解详细信息。这是 487 个类(7MB html 页面)中每个类的一些缩略图的可视化。JSON 格式的所有视频的详细信息 (53MB zip)。示例条目:

    {
      "stitle": "Improving Sprint Start Technique", 
      "label487": [ 205 ], 
      "thumbnail": "https://i1.ytimg.com/vi/Drdm1WsRQwA/hqdefault.jpg", 
      "width": 640, 
      "duration": 86, 
      "height": 360, 
      "id": "Drdm1WsRQwA", 
      "source487": "train"
    },

    一个常见的问题是如何管理这种规模的数据。我们要注意的是,我们发布的 JSON 信息包含所有视频的时长,因此可以过滤到仅低于某个时长阈值的视频。另一个想法是立即从视频中采样帧/片段,而不是存储完整的原始文件,或者甚至在空间分辨率下立即将它们进一步调整为 227x277。因此,大部分数据集 (90%+) 最多可以达到几个 TB。

    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。