公开数据集

Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法 该数据集是由Terry Sejnowski,现在在索尔克研究所和加利福尼亚大学圣地亚哥的基准集合。该数据集是与普林斯顿大学的查尔斯·罗...N/A N/A
175K 1138
OCR图像数据集,可用于OCR系统分类算法的基准测试 Data Set Information:Data Type: GrayScale Image The image dataset can be used to benchmark classification algorithm for...NLP Classification
76.7M 1099
语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点) Data Set Information:面部表情的自动分析已广泛应用于不同的研究领域,如生物特征识别或情感分析。手语领域特别重视面部表情,...NLP Classification
19.2M 944
KDC-4007文本数据集(体育、宗教、艺术、经济、教育、社会、风格和健康) Data Set Information:该数据集最重要的特点是其使用简单且有良好的文档记录,可广泛用于有关库尔德索拉尼新闻和文章的各种文本...Computer Classification
853K 853
26个大写字母识别数据集 Data Set Information:The objective is to identify each of a large number of black-and-white rectangular pixel displays a...NLP Classification
366K 1221
荷兰实用地图集合中提取的手写数字(`0'--`9')的特征数据集 Data Set Information:该数据集包含从荷兰实用地图集合中提取的手写数字(`0'--`9')的特征。每类200个图案(总共2000个...Computer Classification
4.93M 1584
NYSK数据集,用于文本挖掘任务中的主题提取、情绪分析 Data Set Information:Documents are first obtained via a Web search using AMIEI: an integrated platform for delivering en...NLP,Social Clustering
17.5M 869
54个不同的文档分类数据集 Data Set Information:The 5473 examples comes from 54 distinct documents. Each observation concerns one block. All attrib...Computer Classification
103K 889
手写数字数据集的笔式识别 Data Set Information:我们从44位作者那里收集了250个样本,创建了一个数字数据库。由30位作者编写的样本用于培训、交叉验证和作...NLP Classification
1.58M 1032
路透社21578文本分类收集数据集 David D. LewisATT Labs - Research lewis '@' research.att.comdocuments came from Reuters newswire in 1987.Data Se...Agriculture Classification
7.8M 3522
Semeion手写数字数据集 The dataset was created by Tactile Srl, Brescia, Italy (http://www.tattile.it) and donated in 1994 to Semeion Research C...Computer Classification
2.8M 2035
句子分类数据集 America Chambers, ahollowa '@' ics.uci.edu, University of California, IrvineData Set Information:Please see the...N/A Classification
2.9M 1063
TTC-3600:土耳其文本分类数据集的基准数据集 Assist.Prof.Dr. Deniz KILIN??, Faculty of Technology, Celal Bayar University, Turkeydrdenizkilinc'@'gmail.comDat...Computer Classification
2.5M 1268
UJI笔字符(第2版)数据集 F. Prat(*), M. J. Castro(+), D. Llorens(*), A. Marzal(*), and J. M. Vilar(*)* Departamento de Lenguajes y Sistemas Infor...Computer Classification
2.03M 1155
用户分析和滥用语言检测数据集数据集 Abubakar Umar, abubakar.pg715673 '@' st.futminna.edu.ng, Federal University of Technology Minna, Nigeria,Data Se...Computer Classification
3.2M 1071
curationCorpus 策展语料库 策展语料库汇集了 40,000 篇专业撰写的新闻文章摘要,并附有文章本身的链接。这个存储库提供了一个抓取工具来访问它们。如果您对...NLP Text
123.13M 601
电子邮件垃圾邮件 ContextSome emails from [Spam Assassin][1] to create models that can differentiate between spam and ham (non - spam) ema...NLP,Classification,Software,Email and Messaging Classification
12.08M 395
ACL论文选集,论文数据来自ACL选集 The Accepted paper's data from ACL Anthology. An abstract of a paper is extracted from arXiv if it exists.The data i...NLP,Education,Literature Classification
1.14M 353
普莱诺斯总督 埃里总统2018年 NLP,Brazil Classification
16.5M 803
数以千计的关于爱情的问题,该数据集包含来自QA服务的爱情类问题和答案 ContextRUSSIAN LANGUAGEThis dataset collected from real answers to questions of the mail.ru service: https://otvet.mail....NLP,Education,Text Data,Languages Classification
176.23M 336