Select Language

AI社区

公开数据集

包含多个的文本分类数据集

包含多个的文本分类数据集

328 浏览
0 喜欢
3 次下载
0 条讨论
MNIST Classification

数据结构 ? 0M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Text Classification Datasets:一个文本分类数据集,包含8个可用于文本分类的子数据集,样本大小从120K到3.6M,问题范围从2级到14级,数据来源于 DBPedia、Amazon、Yelp、Yahoo!、Sogou 和 AG。

    文件

    需要翻墙,访问:Google driver

    包含8个文件,文件名和大小分别如下:

    ag_news_csv.tar.gz 11MB
    amazon_review_full_csv.tar.gz 614MB
    amazon_review_polarity_csv.tar.gz 656MB
    DBPedia_csv.tar.gz 65MB
    sogou_news_csv.tar.gz 366MB
    yahoo_answers_csv.tar.gz 187MB
    yelp_review_polarity_csv.tar.gz 159MB

    相关论文

    1.Joachims T. Transductive Inference for Text Classification using Support Vector Machines[C]// Sixteenth International Conference on Machine Learning. Morgan Kaufmann Publishers Inc. 1999:200-209. 2.Joulin A, Grave E, Bojanowski P, et al. Bag of Tricks for Efficient Text Classification[J]. 2016:427-431. 3.Zhang Y, Wallace B. A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classification[J]. Computer Science, 2015. 4.Ji Y L, Dernoncourt F. Sequential Short-Text Classification with Recurrent and Convolutional Neural Networks[J]. 2016:515-520. 5.Chen G, Ye D, Xing Z, et al. Ensemble application of convolutional and recurrent neural networks for multi-label text categorization[C]// International Joint Conference on Neural Networks. IEEE, 2017:2377-2383.

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:0 去赚积分?
    • 328浏览
    • 3下载
    • 0点赞
    • 收藏
    • 分享