NLP
  • 实体专有名词数据集

    756M

    1599

    2

    MNIST

    实体专有名词数据集
    Classification
    robot
  • 机器翻译数据集

    15G

    1056

    8

    MNIST

    机器翻译数据集
    Classification
    robot
  • 包含多个的文本分类数据集

    0M

    1025

    3

    MNIST

    包含多个的文本分类数据集
    Classification
    robot
  • 基于单词级别的英语曲线文本检测数据集(TOTAL-TEXT)

    441M

    1208

    1

    NLP

    基于单词级别的英语曲线文本检测数据集(TOTAL-TEXT)
    Classification
    robot
  • TTC-3600:土耳其文本分类数据集的基准数据集

    2.5M

    1362

    1

    Computer

    TTC-3600:土耳其文本分类数据集的基准数据集
    Classification
    University of California, Irvine
  • 句子分类数据集

    2.9M

    1129

    0

    N/A

    句子分类数据集
    Classification
    University of California, Irvine
  • 路透社21578文本分类收集数据集

    7.8M

    3687

    41

    Agriculture

    路透社21578文本分类收集数据集
    Classification
    University of California, Irvine
  • 手写数字数据集的笔式识别

    1.58M

    1087

    4

    NLP

    手写数字数据集的笔式识别
    Classification
    University of California, Irvine
  • 54个不同的文档分类数据集

    103K

    952

    3

    Computer

    54个不同的文档分类数据集
    Classification
    University of California, Irvine
  • NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析

    17.5M

    930

    6

    NLP,Social

    NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析
    Clustering
    University of California, Irvine
  • 荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集

    4.93M

    1693

    2

    Computer

    荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集
    Classification
    University of California, Irvine
  • 26个大写字母识别数据集

    366K

    1279

    2

    NLP

    26个大写字母识别数据集
    Classification
    University of California, Irvine
  • KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)

    853K

    911

    2

    Computer

    KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)
    Classification
    University of California, Irvine
  • facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集

    0.89M

    887

    0

    NLP,Health,Multiclass Classification

    facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集
    Classification
    Renan Renger
  • 用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库

    2.21M

    888

    1

    Business,Arts and Entertainment,Literature,Languages

    用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库
    Classification
    Alexander Kovalev
  • Jester Jokes数据集  一个数据集,包含超过一百万行以及每行的评级

    44.46M

    714

    0

    NLP,Text Data

    Jester Jokes数据集 一个数据集,包含超过一百万行以及每行的评级
    Classification
    Sameer Dev
  • ELMo为NLP预先训练的选项文件

    0M

    617

    0

    NLP

    ELMo为NLP预先训练的选项文件
    Classification
    Itoku Lau
  • 伯特大全字掩蔽

    2559.42M

    683

    0

    Internet,Software,NLP

    伯特大全字掩蔽
    Classification
    bilal2vec
  • 来自Goodreads的2018年最佳图书数据

    81.57M

    1171

    0

    NLP,Image Data,Tabular Data,Literature

    来自Goodreads的2018年最佳图书数据
    Classification
    Naren
  • 文献计量学

    9.78M

    499

    1

    NLP

    文献计量学
    Classification
    Daniel S. Hain