自然语言处理
  • 用户分析和滥用语言检测数据集数据集

    3.2M

    956

    0

    Computer

    用户分析和滥用语言检测数据集数据集
    Classification
    University of California, Irvine
  • UJI笔字符(第2版)数据集

    2.03M

    1055

    0

    Computer

    UJI笔字符(第2版)数据集
    Classification
    University of California, Irvine
  • TTC-3600:土耳其文本分类数据集的基准数据集

    2.5M

    1115

    0

    Computer

    TTC-3600:土耳其文本分类数据集的基准数据集
    Classification
    University of California, Irvine
  • 句子分类数据集

    2.9M

    966

    0

    N/A

    句子分类数据集
    Classification
    University of California, Irvine
  • Semeion手写数字数据集

    2.8M

    1771

    1

    Computer

    Semeion手写数字数据集
    Classification
    University of California, Irvine
  • 路透社21578文本分类收集数据集

    7.8M

    3182

    40

    Agriculture

    路透社21578文本分类收集数据集
    Classification
    University of California, Irvine
  • 手写数字数据集的笔式识别

    1.58M

    935

    4

    NLP

    手写数字数据集的笔式识别
    Classification
    University of California, Irvine
  • 54个不同的文档分类数据集

    103K

    809

    3

    Computer

    54个不同的文档分类数据集
    Classification
    University of California, Irvine
  • NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析

    17.5M

    762

    5

    NLP,Social

    NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析
    Clustering
    University of California, Irvine
  • 荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集

    4.93M

    1390

    2

    Computer

    荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集
    Classification
    University of California, Irvine
  • 26个大写字母识别数据集

    366K

    1113

    2

    NLP

    26个大写字母识别数据集
    Classification
    University of California, Irvine
  • KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)

    853K

    770

    2

    Computer

    KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康)
    Classification
    University of California, Irvine
  • 语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点)

    19.2M

    858

    1

    NLP

    语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点)
    Classification
    University of California, Irvine
  • OCR图像数据集,可用于OCR系统分类算法的基准测试

    76.7M

    995

    2

    NLP

    OCR图像数据集,可用于OCR系统分类算法的基准测试
    Classification
    University of California, Irvine
  • Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法

    175K

    1031

    1

    N/A

    Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法
    N/A
    University of California, Irvine
  • facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集

    0.89M

    759

    0

    NLP,Health,Multiclass Classification

    facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集
    Classification
    Renan Renger
  • Google News vectors negative

    3.64G

    534

    0

    Clothing and Accessories

    Google News vectors negative
    Classification
    ymtoo
  • 词袋模型的描述数据

    208.03M

    569

    0

    NLP,Business

    词袋模型的描述数据
    Classification
    VictorHBD
  • NLP用于判断用户说脏话的词库数据

    3K

    750

    2

    Others

    NLP用于判断用户说脏话的词库数据
    Classification
    Adrien
  • 预训练的 word2vec 模型,英语维基百科数据

    3.2G

    538

    0

    Others

    预训练的 word2vec 模型,英语维基百科数据
    Classification
    RabidBear