Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
新闻分类数据集sample(thu) 新闻分类数据集sample(thu)...NLP Text
12M 746
百科类问答json版,含有150万个预先过滤过的、高质量问题和答案 本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G 750
DARPA TIMIT声学语音连续语音语料库 TIMIT(英语:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州仪器、麻省理工学院和SRI International...Music Analysis Audio
812.64M 539
Wisesight 情感语料库数据集 对于 wisesight-160 和 wisesight-1000,它们是从这个语料库中以标记化形式的样本,有关数据探索和分类示例,请参阅泰语文本分类...Mental Health Text
4.1M 517
文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的 Data Set Information:The original data were formatted by Thorsten Joachims in the “bag-of-words” representation. There...NLP Classification
1.21M 537
僧伽罗语数字词汇(1.0版),字母A到M 数据集 僧伽罗语数字词汇表(1.0版),字母A至M,链接至www.siddham.net...NLP Classification
9.83M 407
僧伽罗语数字词汇(2.0版),字母A到M Digital Glossary of Sinhala Prakrit (version 2.0), letters A to M...NLP Classification
9.88M 421
Primewords 中文普通话语料库,包含100小时的语音数据 This free Chinese Mandarin speech corpus set is released by Shanghai Primewords Information Technology Co., Ltd.The corp...Music Analysis Audio
9G 1103
免费 ST 美国英语语料库 Thiscorpuswererecordedinsilencein-doorenvironmentusingcellphone.Ithas10speakers.Eachspeakerhasabout350utterances.Allutte...Music Analysis Audio
351M 512
免费 ST 中文普通话语料库 Thiscorpuswererecordedinsilencein-doorenvironmentusingcellphone.Ithas855speakers.Eachspeakerhas120utterances.Allutteranc...Music Analysis Audio
8.2G 571
Deeply Korean read speech corpus 深度韩语阅读语料库 about this resource:Recording environment: Studio apartment(moderate reverb), Dance studio(high reverb), Anechoic chambe...Music Analysis Audio
281M 385
Kazakh Speech Corpus (KSC) 哈萨克语语料库(KSC) A crowdsourced open-source speech corpus for the Kazakh language. The KSC contains around 332 hoursof transcribed audio...Music Analysis Audio
19G 929
人工智能语料库-Ubuntu对话语料库 包含2600万次对话数据 建立对话系统(人类可以与虚拟代理进行自然对话)是自然语言处理中的一项艰巨任务,也是许多正在进行的研究的重点。一些挑战包括...NLP Text
2.7G 2528
人工智能语料库-欧洲议会议事平行语料库,包括21种欧洲语言 Europarl平行语料库摘自欧洲议会的议事程序。它包括21种欧洲语言的版本:罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚...NLP Classification,Text
3.75G 656
人民日报词性标注语料数据(199801) 人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)资源为1998年人民日报1-6月份...NLP Text
2.81M 820
TED-LIUM 英语语音识别训练语料库 TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G 438
免费ST中文普通话语料库 使用手机在室内静音环境下记录了该语料库。它具有855个扬声器。每个扬声器有120声。所有话语都经过仔细记录,并由人工检查。转录...Music Analysis Audio
8.2G 378
LibriTTS语料库 LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G 1138
免费ST美国英语语料库 使用手机在室内静音环境下记录了该语料库。它有10个扬声器。每个说话者大约有350种话语。所有话语都经过仔细记录,并由人工检查...Video Games Audio
351M 388
Europarl用于统计机器翻译的并行语料库(21种欧洲语言的版本) For a detailed description of this corpus, please read:Europarl: A Parallel Corpus for Statistical Machine Translation,...NLP Classification
1.46G 591