人类语音的大规模视听数据集 (VoxCeleb2)
VoxCeleb2 包含从上传到 YouTube 的视频中提取的 6,112 位名人的超过 100 万条话语。 VoxCeleb2 的开发集与 VoxCeleb1 或 SITW...Music Analysis Audio
1.47G
2073
robot
VGG-Sound 大规模视听数据集
VGG-Sound是一个视听对应数据集,由从上传到YouTube的视频中提取的音频短片组成.Citation@InProceedings{Chen20,author=HonglieC...Music Analysis,Others Audio
21.7M
2410
Honglie Chen


