Select Language

公开数据集

250万Reddit帖子数据

250万Reddit帖子数据

Scene:

NLP

Data Type:

Text
所需积分:10 去赚积分?
  • 393浏览
  • 0下载
  • 2点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 452.85M

    Data Structure ?

    *数据结构实际以真实数据为准

    这是来自订阅者的前2500个子目录中的前1000个帖子的历史数据集,该数据是在2013年8月15日至20日之间从reddit中提取的。这是reddit上热门帖子的数据集。它包含来自2500个顶级分类的最高1,000个历史职位,因此共有250万个职位。顶级子reddit由订户数量确定,并且位于清单文件中。

    该数据是在2013年8月15日至20日之间提取的。

    每个文件都是一个CSV文件,带有相关的subreddit作为文件名。每个CSV文件都包含一个标题行。

    0相关评论