NLP
  • FakeNewsNet 假新闻研究数据收集,假新闻、虚假信息、数据挖掘

    72.61M

    1783

    210

    NLP,News,Social Science,Social Networks

    FakeNewsNet 假新闻研究数据收集,假新闻、虚假信息、数据挖掘
    Classification
    Deepak Mahudeswaran
  • Strongbad邮件

    0.11M

    374

    0

    Business,NLP,Text Data

    Strongbad邮件
    Classification
    Nolan Conaway
  • 科学流行评论删除

    74.17M

    353

    1

    Business,NLP,Text Data,Binary Classification,Bigquery

    科学流行评论删除
    Classification
    areeves87
  • Medium Articles 包含标记为AI、机器学习、数据科学或人工智能的帖子,以及用户信息

    1.8G

    549

    2

    NLP,Text Data,Literature

    Medium Articles 包含标记为AI、机器学习、数据科学或人工智能的帖子,以及用户信息
    Classification
    AiswaryaRamachandran
  • 实体提取从Pitchfork评论

    14.49M

    981

    0

    Business,Arts and Entertainment,Music,Retail and Shopping,NLP,Popular Culture

    实体提取从Pitchfork评论
    Classification
    Justin K
  • 圣诞节的食谱

    2.51M

    898

    0

    Religion and Belief Systems,NLP,Cooking and Recipes,Holidays and Cultural Events

    圣诞节的食谱
    Classification
    Gary Broughton
  • 数以千计的关于爱情的问题,该数据集包含来自QA服务的爱情类问题和答案

    176.23M

    345

    1

    NLP,Education,Text Data,Languages

    数以千计的关于爱情的问题,该数据集包含来自QA服务的爱情类问题和答案
    Classification
    Boris Zubarev
  • 普莱诺斯总督  埃里总统2018年

    16.5M

    858

    0

    NLP,Brazil

    普莱诺斯总督 埃里总统2018年
    Classification
    Luiz Amaral
  • ACL论文选集,论文数据来自ACL选集

    1.14M

    363

    0

    NLP,Education,Literature

    ACL论文选集,论文数据来自ACL选集
    Classification
    Takahiro Kubo
  • 电子邮件垃圾邮件

    12.08M

    428

    1

    NLP,Classification,Software,Email and Messaging

    电子邮件垃圾邮件
    Classification
    Wessel van Lit
  • curationCorpus 策展语料库

    123.13M

    632

    10

    NLP

    curationCorpus 策展语料库
    Text
    Henry Dashwood
  • MJSynth  Synthetic Word Dataset 合成词数据集

    9.95G

    1975

    32

    NLP

    MJSynth Synthetic Word Dataset 合成词数据集
    Classification
    Visual Geometry Group
  • ICDAR 2013 数据集

    172.61M

    1874

    6

    NLP

    ICDAR 2013 数据集
    Text
    Computational Intelligence Laboratory Institute of Informatics and Telecommunications National Center for Scientific Research