Select Language

公开数据集

Multi-Domain Sentiment Dataset--多域情感数据集

Multi-Domain Sentiment Dataset--多域情感数据集

Scene:

NLP

Data Type:

Text
所需积分:10 去赚积分?
  • 524浏览
  • 40下载
  • 1点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 1.53M

    Data Structure ?

    *数据结构实际以真实数据为准

    多域情感数据集包含从Amazon.com获取的许多产品类型(域)的产品评论。一些域名(书籍和DVD)有成千上万的评论。其他(乐器)只有几百个。评论包含星级(1至5星),如果需要可以转换为二进制标签。此页面包含有关数据的一些说明。
    关于数据集的一些注释。
    1)unprocessed.tar.gz包含原始数据。
    2)processed.acl.tar.gz包含预处理和平衡的数据。也就是说,Blitzer等人的格式。(ACL 2007)
    3)processed.realvalued.tar.gz包含预处理和平衡的数据,但具有星数,而不仅仅是正数或负数。也就是说,Mansour等人的格式。(NIPS 2009)
    预处理数据是每个文档一行,每行格式为:
    feature:

    0相关评论