Select Language

公开数据集

亚马逊用户评论数据集

亚马逊用户评论数据集

Scene:

Business

Data Type:

Classification
所需积分:15 去赚积分?
  • 336浏览
  • 4下载
  • 0点赞
  • 收藏
  • 分享

Data Preview ? 2.1M

    Data Structure ?

    *数据结构实际以真实数据为准

    Data Set Information:

    数据集来自亚马逊商业网站上查看作者身份识别。以前的大多数研究都对两到十位作者进行了鉴定实验。但在在线环境下,待识别的评论通常有更多的潜在作者,通常分类算法不适合大量的目标类。为了检验分类算法的稳健性,我们确定了50个最活跃的用户(由唯一的ID和用户名表示),他们经常在这些新闻组中发布评论。我们为每位作者收集的评论数量为30篇。


    Attribute Information:

    归因包括作者的语言风格,如数字的使用、标点符号的使用、单词和句子的长度以及单词的使用频率等


    Relevant Papers:

    Sanya Liu, Zhi Liu, Jianwen Sun, Lin Liu, 'Application of Synergetic Neural Network in online Writeprint Identification', JDCTA: International Journal of Digital Content Technology and its Applications, Vol. 5, No. 3, pp. 126 ~ 135, 2011
    Jianwen Sun, Zongkai Yang, Pei Wang, Sanya Liu, 'Variable Length Character N-Gram Approach for online Writeprint Identification,' mines, pp.486-490, 2010 International Conference on Multimedia Information Networking and Security, 2010


    Citation Request:

    Please refer to the Machine Learning Repository's citation policy

    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。