Select Language

AI社区

公开数据集

WSJ0 Hipster 城市噪音音频数据集 环境主要包括餐馆、咖啡馆、酒吧和公园

WSJ0 Hipster 城市噪音音频数据集 环境主要包括餐馆、咖啡馆、酒吧和公园

85G
644 浏览
1 喜欢
1 次下载
0 条讨论
Environment,Environment Audio

WSJ0 Hipster环境混合(WHAM!)数据集将WSJ0-2mix数据集中的每两种扬声器混合与独特的噪声背景场景配对。我们还创建了WHAMR!,......

数据结构 ? 85G

    README.md

    WSJ0 Hipster环境混合(WHAM!)数据集将WSJ0-2mix数据集中的每两种扬声器混合与独特的噪声背景场景配对。我们还创建了WHAMR!,除了背景噪声之外,将人工混响添加到语音信号的扩展。
    2018年末,在旧金山湾区的各个城市地点收集了噪音音频。环境主要包括餐馆、咖啡馆、酒吧和公园。音频是使用Apogee Sennheiser双耳麦克风在距离地面1.0至1.5米的三脚架上录制的。
    这里提供了一组噪声样本,称为“WHAM!噪声数据集”,以及构建WHAM!还有WHAMR!来自噪声数据和WSJ0数据集的数据集。我们还提供了“WHAM!48kHz噪声数据集”,由原始采样率的噪声记录组成,而不将剪辑分割到WSJ0剪辑的持续时间。两个WHAM!噪声数据集和WHAM!48kHz噪声数据集已被处理以去除包含可理解语音的任何片段。因为WHAM!48kHz噪声数据集尚未进一步分割到WSJ0剪辑的持续时间,它具有广泛的剪辑持续时间分布。

    Dataset Structure

    The WHAM! noise dataset is split into training, validation, and test sets following the        wsj0-2mix dataset.

    SplitDirectoryDuration (hr)No. of files
    Trainingtr58.0320,000
    Validationcv14.655000
    Testtt9.003000

    The clips are in 32-bit floating point WAV format with 2 channels and a sampling rate of 16 kHz.        The average clip duration is 10 seconds with the shortest clip being 3.5 seconds and the longest        47.7 seconds.

    Citation

    WHAM! is a joint effort between Mitsubishi Electronics Research Laboratories (MERL) and Whisper.  If you use WHAM! or WHAM!48kHz please cite our paper            describing the dataset:

    @inproceedings{Wichern2019WHAM,
        title     = {WHAM!: Extending Speech Separation to Noisy Environments},
        author    = {Wichern, Gordon and Antognini, Joe and Flynn, Michael and Zhu,
                     Licheng Richard and McQuinn, Emmett and Crow,
                     Dwight and Manilow, Ethan and Le Roux, Jonathan},
        booktitle = {Proc. Interspeech},
        year      = {2019},
        month     = sep
    }

    If you use WHAMR! please citeour paper describing the dataset:

    @inproceedings{Maciejewski2020WHAMR,
        title     = {WHAMR!: Noisy and Reverberant Single-Channel Speech Separation},
        author    = {Maciejewski, Matthew and Wichern, Gordon and Le Roux, Jonathan},
        booktitle = {Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
        year      = {2020},
        month     = may
    }


    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:55 去赚积分?
    • 644浏览
    • 1下载
    • 1点赞
    • 收藏
    • 分享