Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
路透社RCV1 RCV2多语言、多视图文本分类测试收集数据集 Massih-Reza AminiUniversit?? Joseph FourierLaboratoire d'Informatique de GrenobleEmail : Massih-Reza.Amini '@...Life Classification
159M 581
NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析 Data Set Information:Documents are first obtained via a Web search using AMIEI: an integrated platform for delivering en...NLP,Social Clustering
17.5M 335
KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康) Data Set Information:该数据集最重要的特点是其使用简单且有良好的文档记录,可广泛用于有关库尔德索拉尼新闻和文章的各种文本...Computer Classification
853K 365
亚洲宗教圣经文本数据集研究 这个数据集中的大部分神圣文本都是从古腾堡计划收集的。我们在此提供原始文本以及预处理的文档术语矩阵(DTM)。Attribute Infor...Social Classification
629K 440
文本文件数据集 上下文我喜欢读浪漫小说,所以我觉得用小说进行文本挖掘非常有趣。我也认为这是从定量的角度看待文学作品并获得一些新见解的好方...Software,Music,Literature Classification
3.85M 274
玩转文字分类广告,文本分类广告的分类数据集 ContextWe need to categorize ads automatically sinse many times it is not provided by external data sources.Contentcatid...Business,Real Estate Classification
250.73M 342
RIP Harambe Text Data Classification
0.26M 289
# TravelTuesday Online Communities,Social Networks,Text Data,Text Mining Classification
19.05M 229
YouTube上的粤语评论 Text Data Classification
9.94M 231
SNA黑客马拉松2019 -文本 Text Data,Binary Classification Classification
2190.56M 250
Machado de Assis的116部小说和其他文本数据 este repositório estão contidas 116 obras de ficção e outros textos de Machado de Assis nos formatos pdf e txt nas c...NLP,Business,Literature,Art,Brazil Classification
40.38M 319
老式Runescape轮询数据 Business,Online Communities,Investing,Video Games,Text Data,Text Mining Classification
0.22M 355
冻结文本检测 Others Classification
92.18M 193
快速文本中文 Others Classification
1917.77M 333
歌词 Music,Text Data Classification
6.47M 155
有毒嵌入物,拼图有毒评论挑战中的通用句子编码文本 There's no need for everyone to encode the same text with the Universal Sentence EmbeddingThis data set contains the...NLP,Deep Learning,Earth and Nature Classification
610.81M 269
来自新闻网站的文本 Business,Email and Messaging,Websites Classification
3.1M 185
文本 Computer Science,Literature Classification
116.79M 151
Mac Morpho,带有词性标签的巴西葡萄牙语新闻文本 The canonical metadata on NLTK:packageid=mac_morphoname=MAC-MORPHO:BrazilianPortuguesenewstextwithpart-of-speechtagswebp...Earth and Nature Classification
10.43M 384
癌症数据文本分类 # DatasetThis dataset was created by Kamlesh Kumar# ContentsIt contains the following files:...Cancer Classification
391K 217