NLP
  • Septuagint

    7.39M

    381

    0

    Earth and Nature,Religion and Belief Systems,NLP,Text Data,Languages

    Septuagint
    Classification
    Abbrivia
  • 28种语言中的停止词,自然语言处理中的文本预处理

    0.09M

    1117

    0

    NLP,Computer Science,Text Data,Languages

    28种语言中的停止词,自然语言处理中的文本预处理
    Classification
    Heeral Dedhia
  • 拼图竞赛数据集,包含翻译成英语的文本

    664.76M

    446

    0

    NLP

    拼图竞赛数据集,包含翻译成英语的文本
    Classification
    Pavel Peskov
  • 访谈

    4.37M

    410

    0

    NLP,Exploratory Data Analysis,Data Cleaning,Feature Engineering,Employment

    访谈
    Classification
    Rahul
  • 英语缩略语列表

    0M

    385

    0

    NLP,Text Mining

    英语缩略语列表
    Classification
    Ouassim Adnane
  • 仇恨言语罗马乌尔都语(HS  RU  20)

    0.49M

    895

    0

    NLP,Artificial Intelligence

    仇恨言语罗马乌尔都语(HS RU 20)
    Classification
    Dr. Khurram Shahzad
  • 消费者投诉-金融产品,该数据集包括消费者对金融产品的投诉和文本

    243.79M

    592

    0

    NLP,Beginner,Text Data,Banking,Text Mining,Lending

    消费者投诉-金融产品,该数据集包括消费者对金融产品的投诉和文本
    Classification
    Ashwini Kumar
  • 击败鲍比·弗莱:300集的结果

    0.06M

    387

    0

    Movies and TV Shows,Food,NLP,Classification,Cooking and Recipes

    击败鲍比·弗莱:300集的结果
    Classification
    Jeffrey Braun
  • 泰米尔语歌词数据集

    26.23M

    366

    1

    Arts and Entertainment,Computer Science,Music,NLP

    泰米尔语歌词数据集
    Classification
    Adithya Balaji
  • 所有专辑的阿姆歌词

    1.77M

    494

    0

    Arts and Entertainment,Music,NLP,Text Data,Text Mining,RNN

    所有专辑的阿姆歌词
    Classification
    Thaddeus Segura
  • 印度Subreddit数据

    4.41M

    377

    0

    Social Networks,NLP

    印度Subreddit数据
    Classification
    Pranay Reddy
  • 媒体文章集2020版

    1.63M

    482

    0

    Arts and Entertainment,Computer Science,Education,NLP

    媒体文章集2020版
    Classification
    KAUSTUBH1828
  • 来自wallstreetbets等的Subreddit数据,用于后验量化交易算法的情绪分析

    1.49G

    445

    0

    NLP,Online Communities,Investing

    来自wallstreetbets等的Subreddit数据,用于后验量化交易算法的情绪分析
    Classification
    Sheridan Green
  • IMDB摘要

    93.03M

    384

    0

    Arts and Entertainment,Movies and TV Shows,NLP,Text Data

    IMDB摘要
    Classification
    Igor Kirko
  • 日语-英语字幕语料库(JESC)[CLEANED],由280万个句子组成的大型语料库

    220.08M

    455

    0

    NLP,Business,Computer Science,Languages

    日语-英语字幕语料库(JESC)[CLEANED],由280万个句子组成的大型语料库
    Classification
    Wahyu Setianto
  • 古腾堡

    14.25M

    359

    0

    Education,Software,NLP,Text Data

    古腾堡
    Classification
    palak sood
  • ELI5记分器训练数据原型816000例,用于创建评分模型

    672.61M

    439

    1

    NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers

    ELI5记分器训练数据原型816000例,用于创建评分模型
    Classification
    Neuron Engineer
  • NERu数据集

    14.5M

    307

    0

    NLP,Text Data,LSTM

    NERu数据集
    Classification
    Naman Jaswani
  • 海得拉巴Zomato餐厅

    3.44M

    1018

    0

    NLP,Ratings and Reviews,Cooking and Recipes,spaCy

    海得拉巴Zomato餐厅
    Classification
    Chirag_ISB
  • 泰米尔二进制分类1K tweets标签V1

    0.38M

    371

    0

    NLP,Classification

    泰米尔二进制分类1K tweets标签V1
    Classification
    kracekumar