自然语言处理
  • IMBD情绪分类数据集,用spacy标记并以JSON格式存储

    104.31M

    353

    0

    NLP,Beginner,Earth and Nature,Movies and TV Shows,Text Data,Binary Classification,spaCy

    IMBD情绪分类数据集,用spacy标记并以JSON格式存储
    Classification
    Manoj Patra
  • Zeki MFC;任15E;ark131;SF6;zleri |歌词

    0.33M

    307

    0

    Music,NLP,Artificial Intelligence,LSTM

    Zeki MFC;任15E;ark131;SF6;zleri |歌词
    Classification
    ferhatmetin34
  • 线缆  19 QA

    23.62M

    327

    4

    Coronavirus,NLP

    线缆 19 QA
    Classification
    David Mezzetti
  • 芬兰动词的补语格

    1.56M

    278

    0

    NLP

    芬兰动词的补语格
    Classification
    Mika H?m?l?inen
  • Stackoverflow问题分类挑战

    6.37M

    828

    0

    NLP

    Stackoverflow问题分类挑战
    Classification
    Nasser Boan
  • 大型影评数据集

    63.18M

    262

    1

    NLP,Arts and Entertainment,Movies and TV Shows

    大型影评数据集
    Classification
    George
  • 多种语言

    0.23M

    814

    0

    Software,NLP,Deep Learning

    多种语言
    Classification
    欧阳逸云
  • 1994  2009年Arxiv量子物理学论文

    92.19M

    352

    0

    Education,NLP,Physics

    1994 2009年Arxiv量子物理学论文
    Classification
    Loulou
  • 来自印度快报的新闻文章数据集

    63.24M

    354

    0

    Business,Arts and Entertainment,News,NLP,Classification,Deep Learning,Linguistics,Recommender Systems

    来自印度快报的新闻文章数据集
    Classification
    Pulkit Komal
  • 标记化器

    14.88M

    339

    0

    NLP

    标记化器
    Classification
    xan
  • 泰米尔二进制分类1K tweets标签V1

    0.38M

    322

    0

    NLP,Classification

    泰米尔二进制分类1K tweets标签V1
    Classification
    kracekumar
  • 海得拉巴Zomato餐厅

    3.44M

    778

    0

    NLP,Ratings and Reviews,Cooking and Recipes,spaCy

    海得拉巴Zomato餐厅
    Classification
    Chirag_ISB
  • NERu数据集

    14.5M

    272

    0

    NLP,Text Data,LSTM

    NERu数据集
    Classification
    Naman Jaswani
  • ELI5记分器训练数据原型816000例,用于创建评分模型

    672.61M

    365

    1

    NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers

    ELI5记分器训练数据原型816000例,用于创建评分模型
    Classification
    Neuron Engineer
  • 古腾堡

    14.25M

    306

    0

    Education,Software,NLP,Text Data

    古腾堡
    Classification
    palak sood
  • 日语-英语字幕语料库(JESC)[CLEANED],由280万个句子组成的大型语料库

    220.08M

    403

    0

    NLP,Business,Computer Science,Languages

    日语-英语字幕语料库(JESC)[CLEANED],由280万个句子组成的大型语料库
    Classification
    Wahyu Setianto
  • IMDB摘要

    93.03M

    341

    0

    Arts and Entertainment,Movies and TV Shows,NLP,Text Data

    IMDB摘要
    Classification
    Igor Kirko
  • 来自wallstreetbets等的Subreddit数据,用于后验量化交易算法的情绪分析

    1.49G

    352

    0

    NLP,Online Communities,Investing

    来自wallstreetbets等的Subreddit数据,用于后验量化交易算法的情绪分析
    Classification
    Sheridan Green
  • 媒体文章集2020版

    1.63M

    411

    0

    Arts and Entertainment,Computer Science,Education,NLP

    媒体文章集2020版
    Classification
    KAUSTUBH1828
  • 印度Subreddit数据

    4.41M

    333

    0

    Social Networks,NLP

    印度Subreddit数据
    Classification
    Pranay Reddy