GPT 训练语料
  • ChatGPT情绪分析,ChatGPT推文分类一个月

    35.27M

    1963

    203

    NLP

    ChatGPT情绪分析,ChatGPT推文分类一个月
    Classification
    Charuni SA
  • ChatGPT Twitter数据集

    0.4M

    1809

    9

    NLP

    ChatGPT Twitter数据集
    Classification
    Muhammad Tariq
  • Tweets on ChatGPT 数据集包ChatGPT上的推文

    133.86M

    1138

    13

    NLP

    Tweets on ChatGPT 数据集包ChatGPT上的推文
    Classification
    Manisha Bhattacharjee
  • LFQA患者医生对话数据

    433.32M

    778

    4

    NLP,Medical

    LFQA患者医生对话数据
    Classification
    Ahmed
  • 蔬菜(谷歌Word2Sec新闻)

    3.73M

    806

    0

    NLP,News

    蔬菜(谷歌Word2Sec新闻)
    Classification
    Liling Tan
  • 维基百科Word2Vec,Apache Spark word2vec由200K维基百科页面培训

    132.74M

    481

    0

    NLP,Business,Earth and Nature,Text Mining

    维基百科Word2Vec,Apache Spark word2vec由200K维基百科页面培训
    Classification
    Maziyar
  • Word2vec在维基百科上训练数据(单字母+双字母),以捕捉unigram和bigram

    8.62G

    506

    0

    NLP,Computer Science,Software,Programming,Neural Networks

    Word2vec在维基百科上训练数据(单字母+双字母),以捕捉unigram和bigram
    Classification
    aintnosunshine
  • 预测Reddit社区参与度数据集,GDELT帖子分类以及Sirocco文本分析(意见和实体提取)

    174.09M

    535

    0

    NLP,Computer Science,Online Communities

    预测Reddit社区参与度数据集,GDELT帖子分类以及Sirocco文本分析(意见和实体提取)
    Classification
    Sergei Sokolenko
  • 纽约时报评论,对《纽约时报》发表文章的评论,超过200万条评论

    1.55G

    492

    0

    NLP,Computer Science,Programming,News

    纽约时报评论,对《纽约时报》发表文章的评论,超过200万条评论
    Classification
    Aashita Kesarwani
  • Facebook发布的300维预训练FastText英语单词向量

    4.52G

    438

    0

    NLP,Arts and Entertainment,Games

    Facebook发布的300维预训练FastText英语单词向量
    Classification
    Vladimir Demidov
  • NLP  Word2Vec 现有的word2vec嵌入,包括手套和谷歌新闻,用于被训练来重建单词的语言上下文

    5.89G

    453

    0

    NLP,Computer Science

    NLP Word2Vec 现有的word2vec嵌入,包括手套和谷歌新闻,用于被训练来重建单词的语言上下文
    Classification
    pkugoodspeed
  • EmojifyData数据集:1800万条英文推文,全部包含表情符号

    2.58G

    737

    3

    NLP,Online Communities,Text Data,Social Networks

    EmojifyData数据集:1800万条英文推文,全部包含表情符号
    Classification
    Daniil Larionov
  • 语言生成数据集:2亿个样本,用于语言生成的已处理Amazon Review数据集

    20.51G

    488

    0

    NLP,Business,Deep Learning,Classification,Artificial Intelligence

    语言生成数据集:2亿个样本,用于语言生成的已处理Amazon Review数据集
    Classification
    Abhishek Chatterjee