Select Language

公开数据集

DARPA TIMIT声学语音连续语音语料库

DARPA TIMIT声学语音连续语音语料库

Scene:

Music Analysis

Data Type:

Audio
所需积分:10 去赚积分?
  • 365浏览
  • 6下载
  • 1点赞
  • 收藏
  • 分享

贡献者查看主页

Massachusetts Institute of Technology

The MIT community is driven by a shared purpose: to make a better world through education, research, and innovation. We are fun and quirky, elite but not elitist, inventive and artistic, obsessed with numbers, and welcoming to talented people regardless o

Data Preview ? 812.64M

    Data Structure ?

    *数据结构实际以真实数据为准

    TIMIT(英语:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州仪器、麻省理工学院和SRI International合作构建的声学-音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。

    70%的说话人是男性;大多数说话者是成年白人。

    TIMIT语料库多年来已经成为语音识别社区的一个标准数据库,在今天仍被广为使用。其原因主要有两个方面: 数据集中的每一个句子都在音素级别上进行了手动标记,同时提供了说话人的编号,性别,方言种类等多种信息; 数据集相对来说比较小,可以在较短的时间内完成整个实验;同时又足以展现系统的性能。

    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。