Select Language

公开数据集

纯文本文件数据集

纯文本文件数据集

Scene:

Software,Music,Literature

Data Type:

Classification
所需积分:4 去赚积分?
  • 167浏览
  • 0下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

AI数据员

AI数据集研究与分析

Data Preview ? 3.85M

    Data Structure ?

    *数据结构实际以真实数据为准

    上下文


    我喜欢读浪漫小说,所以我觉得用小说进行文本挖掘非常有趣。我也认为这是从定量的角度看待文学作品并获得一些新见解的好方法。




    所容纳之物


    该数据集包括玛格丽特·米切尔(Margaret Mitchell)的《乱世佳人》一书的纯文本文件和Microsoft Word文件。UTF-8存在一些问题,因此需要进行更多清洁。




    致谢


    我将这个数据集从Don Lainson创建的书的完整PDF文件转换而来dlainson@sympatico.ca,由澳大利亚古腾堡项目电子书赞助。http://campbellmgold.com/archive_ebooks/gone_with_the_wind_mitchell.pdf




    灵感


    我已经开始了一些基于章节号和人物的情绪分析。这部经典的总体风格是什么?哪一章最令人沮丧?哪些词与思嘉最有关联?瑞德·巴特勒?对这场战争有什么看法?那废除呢?


    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。