Select Language

AI社区

公开数据集

LibriTTS语料库

LibriTTS语料库

1.2G
1096 浏览
4 喜欢
46 次下载
0 条讨论
Video Data Audio

LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英......

数据结构 ? 1.2G

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英语语音。 LibriTTS语料库旨在用于TTS研究。它源自LibriSpeech语料库的原始资料(来自LibriVox的MP3音频文件和来自Gutenberg项目的文本文件)。下面列出了与LibriSpeech语料库的主要区别:   

    1、音频文件的采样率为24kHz。  

    2、 演讲在休息时分裂。   

    3、原始文本和标准化文本都包括在内。  

    4、可以提取上下文信息(例如,相邻句子)。   

    排除具有明显背景噪音的讲话。 有关更多信息,请参见论文“ LibriTTS:从LibriSpeech派生的语料转换为语音”,Heiga Zen,Viet Dang,Rob Clark,Yu Zhang,Ron J.Weiss,叶佳,陈志峰和Wu Yonghui ,arXiv,2019年。如果您在工作中使用LibriTTS语料库,请引用本文的开头。

    The MD5 checksums of the downloads are as follows (note: not everyone will want to know this).

    0c3076c1e5245bb3f0af7d82087ee207  dev-clean.tar.gz
    815555d8d75995782ac3ccd7f047213d  dev-other.tar.gz
    7bed3bdb047c4c197f1ad3bc412db59f  test-clean.tar.gz
    ae3258249472a13b5abef2a816f733e4  test-other.tar.gz
    4a8c202b78fe1bc0c47916a98f3a2ea8  train-clean-100.tar.gz
    a84ef10ddade5fd25df69596a2767b2d  train-clean-360.tar.gz
    7b181dd5ace343a5f38427999684aa6f  train-other-500.tar.gz
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 1096浏览
    • 46下载
    • 4点赞
    • 收藏
    • 分享