Select Language

AI社区

公开数据集

Multi-Domain Sentiment Dataset--多域情感数据集

Multi-Domain Sentiment Dataset--多域情感数据集

1.53M
775 浏览
1 喜欢
49 次下载
0 条讨论
NLP Text

多域情感数据集包含从Amazon.com获取的许多产品类型(域)的产品评论。一些域名(书籍和DVD)有成千上万的评论。其他(乐器)只......

数据结构 ? 1.53M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    多域情感数据集包含从Amazon.com获取的许多产品类型(域)的产品评论。一些域名(书籍和DVD)有成千上万的评论。其他(乐器)只有几百个。评论包含星级(1至5星),如果需要可以转换为二进制标签。此页面包含有关数据的一些说明。
    关于数据集的一些注释。
    1)unprocessed.tar.gz包含原始数据。
    2)processed.acl.tar.gz包含预处理和平衡的数据。也就是说,Blitzer等人的格式。(ACL 2007)
    3)processed.realvalued.tar.gz包含预处理和平衡的数据,但具有星数,而不仅仅是正数或负数。也就是说,Mansour等人的格式。(NIPS 2009)
    预处理数据是每个文档一行,每行格式为:
    feature:

    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 775浏览
    • 49下载
    • 1点赞
    • 收藏
    • 分享