自然语言处理
  • 《辛普森一家》的台词

    8.94M

    699

    0

    Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation

    《辛普森一家》的台词
    Classification
    Pierre Megret
  • 维基百科的句子,英语维基百科转储中收集了780万个句子

    891.28M

    436

    0

    NLP,Text Mining

    维基百科的句子,英语维基百科转储中收集了780万个句子
    Classification
    Mike Ortman
  • Reddit 评论分数预测,使用 NLP 预测评论分数

    1.8G

    372

    0

    NLP,Computer Science,Social Science

    Reddit 评论分数预测,使用 NLP 预测评论分数
    Classification
    Evan Hallmark
  • SMILES OCR数据集,包含超过 90 万个 SMILES 格式的单一产品反应

    175M

    1033

    0

    NLP,Chemistry

    SMILES OCR数据集,包含超过 90 万个 SMILES 格式的单一产品反应
    Classification
    Elahi
  • 确定代词解析数据集

    143K

    424

    0

    NLP

    确定代词解析数据集
    Classification
    Ariba Siddiqui
  • 斯坦福GloVe 200d数据集,转化为word2vec格式数据

    661.31M

    796

    0

    NLP,Computer Science

    斯坦福GloVe 200d数据集,转化为word2vec格式数据
    Classification
    the kwisatz haderach
  • Warframe Steam 星际战甲用户评论数据

    20.22M

    365

    0

    NLP,Video Games

    Warframe Steam 星际战甲用户评论数据
    Classification
    Jiaxu Zhang
  • SMS   Spam  Ham  Prediction

    0.48M

    333

    0

    Business,Earth and Nature,Internet,Economics,NLP

    SMS Spam Ham Prediction
    Classification
    Lampu
  • 英语,法语

    18.33M

    417

    0

    NLP,Text Data,Languages

    英语,法语
    Classification
    SAI HARISH REDDY GUNDA
  • 用于NLP的文本数据集

    6.49G

    877

    0

    NLP,Earth and Nature,Education

    用于NLP的文本数据集
    Classification
    Florian Peters
  • Taptap  reviews

    3.6M

    335

    1

    Games,Video Games,NLP,Deep Learning

    Taptap reviews
    Classification
    Zero Leon
  • FastText 一个用于学习词嵌入和文本分类的库

    6.6G

    934

    0

    NLP,Computer Science

    FastText 一个用于学习词嵌入和文本分类的库
    Classification
    Jia Yang
  • 伯特小一阶

    837.78M

    729

    0

    Arts and Entertainment,NLP

    伯特小一阶
    Classification
    MengYe
  • Trump  Tweet.csv

    0.07M

    318

    0

    NLP,Text Data

    Trump Tweet.csv
    Classification
    Shivam Mehta
  • 简单的LSTM(长短期记忆人工神经网络)模型,输出数据集

    6.32G

    298

    0

    NLP

    简单的LSTM(长短期记忆人工神经网络)模型,输出数据集
    Classification
    Bo Wang
  • 英国癌症的文本挖掘和分析,英国癌症的自然语言处理

    4.33M

    342

    1

    NLP,Biology,Text Data,Health Conditions

    英国癌症的文本挖掘和分析,英国癌症的自然语言处理
    Classification
    Moamen Ibrahim
  • Facebook 发布的300维预训练,在 Common Crawl 上训练的200万个词向量

    650M

    531

    0

    NLP,Arts and Entertainment

    Facebook 发布的300维预训练,在 Common Crawl 上训练的200万个词向量
    Classification
    Manish Maharjan
  • 基于Reddit评论的单词表示法的全局矢量数据集

    19.1G

    452

    3

    NLP

    基于Reddit评论的单词表示法的全局矢量数据集
    Classification
    Leigh
  • Reddit机器人使用NLP来反击负面评论

    0M

    347

    0

    Computer Science,Programming,NLP

    Reddit机器人使用NLP来反击负面评论
    Classification
    osbornep
  • 标记为 ML/DL/AI 的中型文章,文章描述、标题、作者和其他元数据

    55.49K

    751

    0

    NLP,Education,Online Communities,Artificial Intelligence

    标记为 ML/DL/AI 的中型文章,文章描述、标题、作者和其他元数据
    Classification
    Sangarshanan