Select Language

公开数据集

LibriTTS语料库

LibriTTS语料库

Scene:

Video Data

Data Type:

Audio
所需积分:10 去赚积分?
  • 659浏览
  • 46下载
  • 2点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 1.2G

    Data Structure ?

    *数据结构实际以真实数据为准

    LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英语语音。 LibriTTS语料库旨在用于TTS研究。它源自LibriSpeech语料库的原始资料(来自LibriVox的MP3音频文件和来自Gutenberg项目的文本文件)。下面列出了与LibriSpeech语料库的主要区别:   

    1、音频文件的采样率为24kHz。  

    2、 演讲在休息时分裂。   

    3、原始文本和标准化文本都包括在内。  

    4、可以提取上下文信息(例如,相邻句子)。   

    排除具有明显背景噪音的讲话。 有关更多信息,请参见论文“ LibriTTS:从LibriSpeech派生的语料转换为语音”,Heiga Zen,Viet Dang,Rob Clark,Yu Zhang,Ron J.Weiss,叶佳,陈志峰和Wu Yonghui ,arXiv,2019年。如果您在工作中使用LibriTTS语料库,请引用本文的开头。

    The MD5 checksums of the downloads are as follows (note: not everyone will want to know this).

    0c3076c1e5245bb3f0af7d82087ee207  dev-clean.tar.gz
    815555d8d75995782ac3ccd7f047213d  dev-other.tar.gz
    7bed3bdb047c4c197f1ad3bc412db59f  test-clean.tar.gz
    ae3258249472a13b5abef2a816f733e4  test-other.tar.gz
    4a8c202b78fe1bc0c47916a98f3a2ea8  train-clean-100.tar.gz
    a84ef10ddade5fd25df69596a2767b2d  train-clean-360.tar.gz
    7b181dd5ace343a5f38427999684aa6f  train-other-500.tar.gz
    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。