自然语言处理
  • 有毒嵌入物,拼图有毒评论挑战中的通用句子编码文本

    610.81M

    913

    0

    NLP,Deep Learning,Earth and Nature

    有毒嵌入物,拼图有毒评论挑战中的通用句子编码文本
    Classification
    Liling Tan
  • CoNLL003 命名实体识别(NER)问题的注释数据集

    4.63M

    725

    0

    NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining

    CoNLL003 命名实体识别(NER)问题的注释数据集
    Classification
    AlaaKhaled
  • 用无衬线谷歌字体书写的字母图像数据集

    768M

    674

    0

    NLP,Image Data

    用无衬线谷歌字体书写的字母图像数据集
    Classification
    CheaperThanTires
  • 命名实体识别(NER)从临床提取感兴趣的实体(例如,疾病名称、药物名称

    249.01M

    583

    0

    NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence

    命名实体识别(NER)从临床提取感兴趣的实体(例如,疾病名称、药物名称
    Classification
    Ramashankar Nayak
  • Machado de Assis的116部小说和其他文本数据

    40.38M

    990

    0

    NLP,Business,Literature,Art,Brazil

    Machado de Assis的116部小说和其他文本数据
    Classification
    Luiz Amaral
  • Dmoztools分类数据, 包含艺术、商业、计算机、游戏、健康、科学购物、社会等

    279.6M

    622

    0

    NLP,Text Mining,Websites

    Dmoztools分类数据, 包含艺术、商业、计算机、游戏、健康、科学购物、社会等
    Classification
    Patanjali Chintalapati
  • ATIS数据集清洁重新点燃,ATIS数据集的清理和平衡分割

    1.02M

    677

    0

    NLP,Classification,Earth and Nature,Computer Science,Health

    ATIS数据集清洁重新点燃,ATIS数据集的清理和平衡分割
    Classification
    kpe
  • 孟加拉手写数字(dot npz格式)

    268.7M

    795

    1

    Image Data

    孟加拉手写数字(dot npz格式)
    Classification
    Yakin
  • 文献计量学

    9.78M

    470

    1

    NLP

    文献计量学
    Classification
    Daniel S. Hain
  • 来自Goodreads的2018年最佳图书数据

    81.57M

    998

    0

    NLP,Image Data,Tabular Data,Literature

    来自Goodreads的2018年最佳图书数据
    Classification
    Naren
  • 伯特大全字掩蔽

    2559.42M

    612

    0

    Internet,Software,NLP

    伯特大全字掩蔽
    Classification
    bilal2vec
  • ELMo为NLP预先训练的选项文件

    0M

    553

    0

    NLP

    ELMo为NLP预先训练的选项文件
    Classification
    Itoku Lau
  • Jester Jokes数据集  一个数据集,包含超过一百万行以及每行的评级

    44.46M

    602

    0

    NLP,Text Data

    Jester Jokes数据集 一个数据集,包含超过一百万行以及每行的评级
    Classification
    Sameer Dev
  • 用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库

    2.21M

    759

    1

    Business,Arts and Entertainment,Literature,Languages

    用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库
    Classification
    Alexander Kovalev
  • fastText 预训练词向量数据集

    8.49G

    630

    0

    Others

    fastText 预训练词向量数据集
    Classification
    kambarakun
  • 预训练的 word2vec 模型,英语维基百科数据

    3.2G

    538

    0

    Others

    预训练的 word2vec 模型,英语维基百科数据
    Classification
    RabidBear
  • NLP用于判断用户说脏话的词库数据

    3K

    759

    2

    Others

    NLP用于判断用户说脏话的词库数据
    Classification
    Adrien
  • 词袋模型的描述数据

    208.03M

    569

    0

    NLP,Business

    词袋模型的描述数据
    Classification
    VictorHBD
  • Google News vectors negative

    3.64G

    535

    0

    Clothing and Accessories

    Google News vectors negative
    Classification
    ymtoo
  • facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集

    0.89M

    761

    0

    NLP,Health,Multiclass Classification

    facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集
    Classification
    Renan Renger