公开数据集
相关数据分类
124
1
0
0
3
2
0
0
1
2
0
0
0
0
Hi-Fi 多扬声器英语 TTS 数据集 (Hi-Fi TTS)
用于训练文本到语音模型的多说话者英语数据集about this resource:Hi-Fi Multi-Speaker English TTS Dataset (Hi-Fi TTS) is a m...Music Analysis Audio
41G
1123
LibriVox
Nonverbal Vocalization Dataset 深度非言语发声数据集
about this resource:Volume(full set): ~0.6(~57) hours, ~800(~70,000) utterances, ~500(~1500) speakersFormat: 16kHz, 16-b...Music Analysis Audio
43.7M
1082
Deeply Inc
LibriSpeech ASR corpus 语音数据
LibriSpeech ASR corpus 是一个语音数据,包括 1000小时 的英文发音和对应文字。标识符:SLR12摘要:大规模(1000小时)阅读英语...NLP Audio
8.14G
1846
Vassil Panayotov
Google Audioset 音频数据集
AudioSet 包含了 632 类的音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(片段来自 YouTube 视频)。音频本体...NLP Audio
2.41G
2434
Google
419.81M
1410
宾夕法尼亚大学
THUYG-20 维吾尔语语音数据
摘要:免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布类别:演讲许可证:Apache License v.2.0介绍THUGY20是由语音和语...NLP Audio
6.12G
2444
清华大学
ALFFA 非洲语音数据
收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael Mel...NLP Audio
3.81G
1005
ALFFA
THCHS-30 汉语语音识别数据
THCHS-30标识符:SLR18摘要:CSLT @清华大学发布免费汉语语音语料库类别:演讲许可证:Apache License v.2.0THCHS30是由清华大学...NLP Audio
13.4G
2131
Tsinghua University
Sinhala TTS 语音识别数据
僧伽罗语TTS标识符:SLR30摘要:僧伽罗语多音箱TTS语料库类别:演讲许可:署名 - ShareAlike 4.0国际(CC BY-SA 4.0)关于此资源...CNN Audio
247.96M
1483
Google
3.69G
1936
voltamax
110M
1005
Ed King
TED-LIUM 英语语音识别训练语料库
TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G
884
University of Pennsylvania
8.2G
784
openslr
LibriTTS语料库
LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G
2513
openslr
351M
791
openslr
THCHS30 中文语音数据集
THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G
1502
清华大学语音与语言技术中心



















