公开数据集
相关数据分类
124
1
0
0
3
2
0
0
1
2
0
0
0
0
ALFFA 非洲语音数据
收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael Mel...NLP Audio
3.81G
998
ALFFA
THCHS-30 汉语语音识别数据
THCHS-30标识符:SLR18摘要:CSLT @清华大学发布免费汉语语音语料库类别:演讲许可证:Apache License v.2.0THCHS30是由清华大学...NLP Audio
13.4G
2112
Tsinghua University
Sinhala TTS 语音识别数据
僧伽罗语TTS标识符:SLR30摘要:僧伽罗语多音箱TTS语料库类别:演讲许可:署名 - ShareAlike 4.0国际(CC BY-SA 4.0)关于此资源...CNN Audio
247.96M
1468
Google
3.69G
1921
voltamax
110M
1001
Ed King
TED-LIUM 英语语音识别训练语料库
TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自美国...Video Games Audio
19.82G
871
University of Pennsylvania
8.2G
781
openslr
LibriTTS语料库
LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英...Video Data Audio
1.2G
2494
openslr
351M
785
openslr
THCHS30 中文语音数据集
THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机科学...Music Analysis Audio
6.4G
1491
清华大学语音与语言技术中心
人类语音的大规模视听数据集 (VoxCeleb2)
VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio
1.47G
2008
robot
大型说话人识别数据集(VoxCeleb1)
VoxCeleb1 包含从上传到 YouTube 的视频中提取的 1,251 位名人的超过 100,000 条话语。...Music Analysis Audio
136M
950
robot
LibriSpeech ASR 语料库,大规模英语语料库
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自...Music Analysis Audio
148.59G
1069
openslr
AISHELL-家居环境近远讲同步语音数据库
AISHELL-2019A-EVAL 随机抽取 50 个发音人。每人从位置 A(高保真 44.1kHz,16bit)与位置 F(Android 系统手机 16kHz,16bit)中,...Music Analysis Audio
15G
833
robot