Select Language

AI社区

公开数据集

亚马逊用户评论数据集

亚马逊用户评论数据集

2.1M
747 浏览
0 喜欢
4 次下载
0 条讨论
Business Classification

Data Set Information:数据集来自亚马逊商业网站上查看作者身份识别。以前的大多数研究都对两到十位作者进行了鉴定实验。但在在......

数据结构 ? 2.1M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Data Set Information:

    数据集来自亚马逊商业网站上查看作者身份识别。以前的大多数研究都对两到十位作者进行了鉴定实验。但在在线环境下,待识别的评论通常有更多的潜在作者,通常分类算法不适合大量的目标类。为了检验分类算法的稳健性,我们确定了50个最活跃的用户(由唯一的ID和用户名表示),他们经常在这些新闻组中发布评论。我们为每位作者收集的评论数量为30篇。


    Attribute Information:

    归因包括作者的语言风格,如数字的使用、标点符号的使用、单词和句子的长度以及单词的使用频率等


    Relevant Papers:

    Sanya Liu, Zhi Liu, Jianwen Sun, Lin Liu, 'Application of Synergetic Neural Network in online Writeprint Identification', JDCTA: International Journal of Digital Content Technology and its Applications, Vol. 5, No. 3, pp. 126 ~ 135, 2011
    Jianwen Sun, Zongkai Yang, Pei Wang, Sanya Liu, 'Variable Length Character N-Gram Approach for online Writeprint Identification,' mines, pp.486-490, 2010 International Conference on Multimedia Information Networking and Security, 2010


    Citation Request:

    Please refer to the Machine Learning Repository's citation policy

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:15 去赚积分?
    • 747浏览
    • 4下载
    • 0点赞
    • 收藏
    • 分享