公开数据集

ALFFA 非洲语音数据 收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael Mel...NLP Audio
3.81G 998
THCHS-30 汉语语音识别数据 THCHS-30标识符:SLR18摘要:CSLT @清华大学发布免费汉语语音语料库类别:演讲许可证:Apache License v.2.0THCHS30是由清华大学...NLP Audio
13.4G 2112
Sinhala TTS 语音识别数据 僧伽罗语TTS标识符:SLR30摘要:僧伽罗语多音箱TTS语料库类别:演讲许可:署名 - ShareAlike 4.0国际(CC BY-SA 4.0)关于此资源...CNN Audio
247.96M 1468
呼吸声音数据集,用于检测呼吸系统疾病 呼吸声音数据库,使用录音来检测呼吸系统疾病。呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动,肺组...Medical Audio
3.69G 1921
心跳声音数据集 该数据集最初是针对机器学习挑战来对心跳声音进行分类的。数据是从两个来源收集的:(A)通过iStethoscope Pro iPhone应用程序从...Medical Audio
110M 1001
TED-LIUM 英语语音识别训练语料库 TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G 871
免费ST中文普通话语料库 使用手机在室内静音环境下记录了该语料库。它具有855个扬声器。每个扬声器有120声。所有话语都经过仔细记录,并由人工检查。转录...Music Analysis Audio
8.2G 781
LibriTTS语料库 LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G 2494
免费ST美国英语语料库 使用手机在室内静音环境下记录了该语料库。它有10个扬声器。每个说话者大约有350种话语。所有话语都经过仔细记录,并由人工检查...Video Games Audio
351M 785
THCHS30 中文语音数据集 THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G 1491
人类语音的大规模视听数据集 (VoxCeleb2) VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio
1.47G 2008
大型说话人识别数据集(VoxCeleb1) VoxCeleb1 包含从上传到 YouTube 的视频中提取的 1,251 位名人的超过 100,000 条话语。...Music Analysis Audio
136M 950
FMA大型音乐分析数据集 Music Analysis Audio
1000G 1041
LibriSpeech ASR 语料库,大规模英语语料库 LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自...Music Analysis Audio
148.59G 1069
14.5G 1235
0M 1426
4G 548
AISHELL-家居环境近远讲同步语音数据库 AISHELL-2019A-EVAL 随机抽取 50 个发音人。每人从位置 A(高保真 44.1kHz,16bit)与位置 F(Android 系统手机 16kHz,16bit)中,...Music Analysis Audio
15G 833
音频档案研究数据集 Music Analysis Audio
0M 849
Warblr众包语音数据集 Music Analysis Audio
4.3G 808