Select Language

公开数据集

Twitter-dataset 数据集

Twitter-dataset 数据集

Scene:

NLP

Data Type:

Text
所需积分:10 去赚积分?
  • 543浏览
  • 15下载
  • 1点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 311.27M

    Data Structure ?

    *数据结构实际以真实数据为准

    ICWSM 2010论文中的数据可从以下链接获得。我们的数据集已匿名化,以保护用户自己的隐私。我们只发布有关Twitter链接结构的信息。

    数据集

    • 链接列表:

      此文件包含我们在2009年9月根据Twitter网络快照从Twitter抓取的所有用户到用户链接的列表。该文件包含1,963,263,821个定向社交链接。


      格式: Gzip压缩包。每行包含两个用户标识符,暗示从第一个用户到第二个用户观察到链接(第一个用户跟随第二个用户)。


      数据:Twitter关注链接(10.73GB)

    • 转发公约的时间序列:

      此文件包含每天7种不同转发变体(RT,via,转发,转发,HT,R / T和回收符号)的新采用者数。


      格式:   xlsx。   每行对应一个转发变体,其中第一列给出了变体的名称,后续列给出了每天新采用者的数量,从2007-03-16(使用第一次转发变体的那天)开始。


      数据:转发会议时间序列(<1MB)

    我们还在此图中共享一组垃圾邮件发送者节点,这些节点来自Twitter中关于链接耕作的相关项目 。 

    如果您想引用我们的工作,请使用以下BibTeX条目。 

    对于Twitter拓扑:

    @inproceedings {icwsm10cha,
      作者= {Meeyoung Cha和Hamed Haddadi和Fabricio Benevenuto和Krishna P. Gummadi},
      title = {{衡量用户对Twitter的影响:百万追随者谬误}},
      booktitle = {第四届国际AAAI网络日志和社交媒体会议论文集(ICWSM)}},
      month = {May},
      年= {2010},
      地址= {华盛顿特区,美国}
    }


    对于转发惯例:

    @inproceedings {icwsm12kooti,
      作者= {Farshad Kooti和Haeryun Yang和Meeyoung Cha和Krishna P. Gummadi和Winter A. Mason},
      title = {{在线社交网络中的公约的出现}},
      booktitle = {第六届国际AAAI网络日志和社交媒体会议论文集(ICWSM)}},
      月= {六月},
      年= {2012},
      地址= {都柏林,爱尔兰}
    }


    0相关评论