Select Language

公开数据集

AISHELL-家居环境近远讲同步语音数据库

AISHELL-家居环境近远讲同步语音数据库

Scene:

Music Analysis

Data Type:

Audio
所需积分:25 去赚积分?
  • 207浏览
  • 6下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 15G

    Data Structure ?

    *数据结构实际以真实数据为准

    AISHELL-2019A-eval 随机抽取 50 个发音人。每人从位置 A(高保真 44.1kHz,16bit)与位置 F(Android 系统手机 16kHz,16bit)中,各选取 232 句到 237 句。

    此数据库经过专业语音校对人员转写标注,并通过严格质量检验,文本正确率 100%。

    Aishell is an open-source Chinese Mandarin speech corpus published by Beijing Shell Shell Technology Co.,Ltd.

    400 people from different accent areas in China are invited to participate in the recording, which is conducted in a quiet indoor environment using high fidelity microphone and downsampled to 16kHz. The manual transcription accuracy is above 95%, through professional speech annotation and strict quality inspection. The data is free for academic use. We hope to provide moderate amount of data for new researchers in the field of speech recognition.

    You can cite the data using the following BibTeX entry:

    @inproceedings{aishell_2017,
      title={AIShell-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition baseline},
      author={Hui Bu, Jiayu Du, Xingyu Na, Bengu Wu, Hao Zheng},
      booktitle={Oriental COCOSDA 2017},
      pages={Submitted},
      year={2017}
    }


    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。