Select Language

AI社区

公开数据集

Hi-Fi 多​​扬声器英语 TTS 数据集 (Hi-Fi TTS) 用于训练文本到语音模型的多说话者英语数据集about this resource:Hi-Fi Multi-Speaker English TTS Dataset (Hi-Fi TTS) is a m...Music Analysis Audio
41G 416
Nonverbal Vocalization Dataset 深度非言语发声数据集 about this resource:Volume(full set): ~0.6(~57) hours, ~800(~70,000) utterances, ~500(~1500) speakersFormat: 16kHz, 16-b...Music Analysis Audio
43.7M 388
LibriSpeech ASR corpus 语音数据 LibriSpeech ASR corpus 是一个语音数据,包括 1000小时 的英文发音和对应文字。标识符:SLR12摘要:大规模(1000小时)阅读英语...NLP Audio
8.14G 728
Google Audioset 音频数据集 AudioSet 包含了 632 类的音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(片段来自 YouTube 视频)。音频本体...NLP Audio
2.41G 1169
TIMIT语音识别数据 TIMIT语音读取语料库旨在为声学语音研究以及自动语音识别系统的开发和评估提供语音数据。TIMIT包含由八种主要美国英语方言组成的...NLP Audio
419.81M 567
THUYG-20 维吾尔语语音数据 摘要:免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布类别:演讲许可证:Apache License v.2.0介绍THUGY20是由语音和语...NLP Audio
6.12G 868
ALFFA 非洲语音数据 收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael Mel...NLP Audio
3.81G 488
THCHS-30 汉语语音识别数据 THCHS-30标识符:SLR18摘要:CSLT @清华大学发布免费汉语语音语料库类别:演讲许可证:Apache License v.2.0THCHS30是由清华大学...NLP Audio
13.4G 642
Sinhala TTS 语音识别数据 僧伽罗语TTS标识符:SLR30摘要:僧伽罗语多音箱TTS语料库类别:演讲许可:署名 - ShareAlike 4.0国际(CC BY-SA 4.0)关于此资源...CNN Audio
247.96M 499
呼吸声音数据集,用于检测呼吸系统疾病 呼吸声音数据库,使用录音来检测呼吸系统疾病。呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动,肺组...Medical Audio
3.69G 977
心跳声音数据集 该数据集最初是针对机器学习挑战来对心跳声音进行分类的。数据是从两个来源收集的:(A)通过iStethoscope Pro iPhone应用程序从...Medical Audio
110M 444
TED-LIUM 英语语音识别训练语料库 TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G 398
免费ST中文普通话语料库 使用手机在室内静音环境下记录了该语料库。它具有855个扬声器。每个扬声器有120声。所有话语都经过仔细记录,并由人工检查。转录...Music Analysis Audio
8.2G 349
LibriTTS语料库 LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G 1037
免费ST美国英语语料库 使用手机在室内静音环境下记录了该语料库。它有10个扬声器。每个说话者大约有350种话语。所有话语都经过仔细记录,并由人工检查...Video Games Audio
351M 358
THCHS30 中文语音数据集 THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G 774
人类语音的大规模视听数据集 (VoxCeleb2) VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio
1.47G 1365
大型说话人识别数据集(VoxCeleb1) VoxCeleb1 包含从上传到 YouTube 的视频中提取的 1,251 位名人的超过 100,000 条话语。...Music Analysis Audio
136M 445
FMA大型音乐分析数据集 Music Analysis Audio
1000G 332
LibriSpeech ASR 语料库,大规模英语语料库 LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自...Music Analysis Audio
148.59G 485