NLP
  • 英语,法语

    18.33M

    588

    0

    NLP,Text Data,Languages

    英语,法语
    Classification
    SAI HARISH REDDY GUNDA
  • SMS   Spam  Ham  Prediction

    0.48M

    370

    0

    Business,Earth and Nature,Internet,Economics,NLP

    SMS Spam Ham Prediction
    Classification
    Lampu
  • Warframe Steam 星际战甲用户评论数据

    20.22M

    388

    0

    NLP,Video Games

    Warframe Steam 星际战甲用户评论数据
    Classification
    Jiaxu Zhang
  • 斯坦福GloVe 200d数据集,转化为word2vec格式数据

    661.31M

    952

    0

    NLP,Computer Science

    斯坦福GloVe 200d数据集,转化为word2vec格式数据
    Classification
    the kwisatz haderach
  • 确定代词解析数据集

    143K

    491

    0

    NLP

    确定代词解析数据集
    Classification
    Ariba Siddiqui
  • Reddit 评论分数预测,使用 NLP 预测评论分数

    1.8G

    441

    0

    NLP,Computer Science,Social Science

    Reddit 评论分数预测,使用 NLP 预测评论分数
    Classification
    Evan Hallmark
  • 维基百科的句子,英语维基百科转储中收集了780万个句子

    891.28M

    504

    0

    NLP,Text Mining

    维基百科的句子,英语维基百科转储中收集了780万个句子
    Classification
    Mike Ortman
  • 《辛普森一家》的台词

    8.94M

    874

    0

    Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation

    《辛普森一家》的台词
    Classification
    Pierre Megret
  • 带注释的GMB语料库,GMB文本语料库的注释子集

    1.52M

    475

    0

    NLP,Exploratory Data Analysis,Classification,Random Forest

    带注释的GMB语料库,GMB文本语料库的注释子集
    Classification
    Shoumik
  • ConceptNet Numberbatch 向量,来自 ConceptNet 的词向量

    899.91M

    419

    0

    NLP

    ConceptNet Numberbatch 向量,来自 ConceptNet 的词向量
    Classification
    Nohman
  • 假新闻分类

    142.92M

    983

    0

    News,NLP

    假新闻分类
    Classification
    Bytedance WSDM Cup 2019
  • Allennlp包

    715.44M

    446

    0

    Computer Science,NLP

    Allennlp包
    Classification
    bilal2vec
  • 韩国极端主义网站Womad仇恨言论数据

    0.16M

    410

    3

    NLP,Classification

    韩国极端主义网站Womad仇恨言论数据
    Classification
    Yoo Beyoung Woo(???)
  • Kaggle工作

    0.27M

    352

    0

    Computer Science,Education,NLP,Recommender Systems,Search Engines

    Kaggle工作
    Classification
    AbdullahAli
  • 阿拉伯ULMFiT模型,基于Ar Wikipedia语料库的阿拉伯语模型

    160.13M

    1020

    0

    NLP,Transfer Learning,Languages

    阿拉伯ULMFiT模型,基于Ar Wikipedia语料库的阿拉伯语模型
    Classification
    Abed Khooli
  • 印度政治新闻2018

    57.35M

    339

    0

    Politics,NLP,Text Data,Linguistics,India

    印度政治新闻2018
    Classification
    Xen.m.rph
  • SComedy

    2.99M

    555

    0

    Earth and Nature,NLP,Text Data,Text Mining

    SComedy
    Classification
    Eduardo Reis
  • NLTK路透社新闻文件,NLTK路透社语料库中的所有文件

    3.3M

    1078

    1

    NLP,Computer Science,News,Text Data,Text Mining

    NLTK路透社新闻文件,NLTK路透社语料库中的所有文件
    Classification
    Brad Boldenow
  • reddit自我发布分类任务,包含1000 多个精心挑选的类别

    839.37M

    496

    0

    NLP,Classification,Computer Science,Multiclass Classification

    reddit自我发布分类任务,包含1000 多个精心挑选的类别
    Classification
    Mike Swarbrick Jones
  • 医学成绩单,从mtsamples获取的医学转录数据

    16.22M

    515

    0

    NLP,Health,Medicine

    医学成绩单,从mtsamples获取的医学转录数据
    Classification
    Tara Boyle