自然语言处理
  • fastText 预训练词向量数据集

    8.49G

    630

    0

    Others

    fastText 预训练词向量数据集
    Classification
    kambarakun
  • 用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库

    2.21M

    757

    1

    Business,Arts and Entertainment,Literature,Languages

    用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库
    Classification
    Alexander Kovalev
  • Jester Jokes数据集  一个数据集,包含超过一百万行以及每行的评级

    44.46M

    601

    0

    NLP,Text Data

    Jester Jokes数据集 一个数据集,包含超过一百万行以及每行的评级
    Classification
    Sameer Dev
  • ELMo为NLP预先训练的选项文件

    0M

    552

    0

    NLP

    ELMo为NLP预先训练的选项文件
    Classification
    Itoku Lau
  • 伯特大全字掩蔽

    2559.42M

    612

    0

    Internet,Software,NLP

    伯特大全字掩蔽
    Classification
    bilal2vec
  • 来自Goodreads的2018年最佳图书数据

    81.57M

    996

    0

    NLP,Image Data,Tabular Data,Literature

    来自Goodreads的2018年最佳图书数据
    Classification
    Naren
  • 文献计量学

    9.78M

    470

    1

    NLP

    文献计量学
    Classification
    Daniel S. Hain
  • 孟加拉手写数字(dot npz格式)

    268.7M

    793

    1

    Image Data

    孟加拉手写数字(dot npz格式)
    Classification
    Yakin
  • ATIS数据集清洁重新点燃,ATIS数据集的清理和平衡分割

    1.02M

    675

    0

    NLP,Classification,Earth and Nature,Computer Science,Health

    ATIS数据集清洁重新点燃,ATIS数据集的清理和平衡分割
    Classification
    kpe
  • Dmoztools分类数据, 包含艺术、商业、计算机、游戏、健康、科学购物、社会等

    279.6M

    620

    0

    NLP,Text Mining,Websites

    Dmoztools分类数据, 包含艺术、商业、计算机、游戏、健康、科学购物、社会等
    Classification
    Patanjali Chintalapati
  • Machado de Assis的116部小说和其他文本数据

    40.38M

    987

    0

    NLP,Business,Literature,Art,Brazil

    Machado de Assis的116部小说和其他文本数据
    Classification
    Luiz Amaral
  • 命名实体识别(NER)从临床提取感兴趣的实体(例如,疾病名称、药物名称

    249.01M

    582

    0

    NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence

    命名实体识别(NER)从临床提取感兴趣的实体(例如,疾病名称、药物名称
    Classification
    Ramashankar Nayak
  • 用无衬线谷歌字体书写的字母图像数据集

    768M

    674

    0

    NLP,Image Data

    用无衬线谷歌字体书写的字母图像数据集
    Classification
    CheaperThanTires
  • CoNLL003 命名实体识别(NER)问题的注释数据集

    4.63M

    723

    0

    NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining

    CoNLL003 命名实体识别(NER)问题的注释数据集
    Classification
    AlaaKhaled
  • 有毒嵌入物,拼图有毒评论挑战中的通用句子编码文本

    610.81M

    911

    0

    NLP,Deep Learning,Earth and Nature

    有毒嵌入物,拼图有毒评论挑战中的通用句子编码文本
    Classification
    Liling Tan
  • 英语词频,⅓ 百万网络上最常见的英语单词

    4.73M

    909

    2

    Languages

    英语词频,⅓ 百万网络上最常见的英语单词
    Classification
    Rachael Tatman
  • 斯坦福自然语言推理 (SNLI) 语料库的 Jsonl 格式

    483.45M

    666

    0

    Languages

    斯坦福自然语言推理 (SNLI) 语料库的 Jsonl 格式
    Classification
    John S. Hudzina
  • NPS聊天,NPS 聊天语料库

    2.46M

    524

    2

    Computer Science,Online Communities

    NPS聊天,NPS 聊天语料库
    Classification
    NLTK Data
  • Mac Morpho,带有词性标签的巴西葡萄牙语新闻文本

    10.43M

    1060

    1

    Earth and Nature

    Mac Morpho,带有词性标签的巴西葡萄牙语新闻文本
    Classification
    NLTK Data
  • 越南语地址手写数据集

    423.81M

    540

    0

    MNIST

    越南语地址手写数据集
    Classification
    Mike Truong