Select Language

公开数据集

HARRISON 社交媒体图像数据集

HARRISON 社交媒体图像数据集

Scene:

Image Data

Data Type:

Classification
所需积分:30 去赚积分?
  • 368浏览
  • 0下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 5.58G

    Data Structure ?

    *数据结构实际以真实数据为准

    HARRISON 是一个对 Facebook、Twitter、Instagram 社交媒体中的图片进行标签标注(tag)的图像数据集,包括 57383 张图片,每张图片平均 4.5 个标签标注,标签标注来自出现频率最高的 1000 个单词。
     

    主题标签定义为附加在前缀字符“#”上的任何单词,该单词在在线社交网络服务(SNS)(例如Facebook,Twitter和Instagram)中使用。随着在线社交网络的增长,标签通常用于总结用户帖子的内容并吸引关注者的注意。在社交媒体时代,推荐适当的标签是一项非常有趣和有用的任务。

    我们介绍了用于图像主题标签推荐的新颖基准,称为HARRISON,或针对社交网络中的真实世界图像的HAshtag建议。HARRISON数据集是一个现实的数据集,由来自Instagram的57,383张照片和每张照片的平均4.5个相关主题标签(最少1个,最多10个)组成。每个图像的地面真相标签由1,000个最常用的标签组成,并根据频率排名结果以数字进行编码。





    0相关评论