公开数据集

阿拉伯自然音频数据集

1.4G

931 浏览

0 喜欢

2 次下载

0 条讨论

Music Analysis Audio

这是第一个用于识别3种离散情感的阿拉伯自然音频数据集（ANAD）：快乐，愤怒和惊讶。从在线阿拉伯脱口秀节目中下载了演播室外一......

数据介绍
文件预览
相关论文
Code
分享讨论(0)
使用声明

启动Notebook开发

数据结构 ? 1.4G

* 以上分析是由系统提取分析形成的结果，具体实际数据为准。

README.md

这是第一个用于识别3种离散情感的阿拉伯自然音频数据集（ANAD）：快乐，愤怒和惊讶。

从在线阿拉伯脱口秀节目中下载了演播室外一个主播与人类之间的实时通话的八个视频。然后将每个视频分成轮流：呼叫者和接收者。为了给每个视频加上标签，要求18位听众收听每个视频，并选择他们是否感到快乐，愤怒或惊讶的情绪。消除了沉默，笑声和嘈杂的部分。然后将每个块自动分成1秒的语音单元，形成由1384个记录组成的最终语料库。

提取了二十五个声学特征，也称为低级描述符。这些功能包括：强度，过零率，MFCC 1-12（梅尔频率倒谱系数），F0（基本频率）和F0包络，发声的概率以及LSP频率0-7。在每个功能上应用了19个统计功能。函数包括：最大值，最小值，范围，最大值的绝对位置，最小值的绝对位置，均值算术，线性回归1，线性回归2，线性回归A，线性回归Q，标准偏差，峰度，偏度，四分位数1、2、3和，四分位间距1-2、2-3、1-3。每个LLD的增量系数也作为一阶导数的估计值进行计算，因此总共可以得到950个特征。

暂无相关内容。

分享你的想法

去分享你的想法~~

全部内容

欢迎交流分享

开始分享您的观点和意见，和大家一起交流分享.

数据使用声明：

一、数据来源与展示说明：

1、该数据来自于互联网数据采集或服务商的提供，本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息，如数据集描述中有描述差异，请以数据原地址或服务商原地址为准。

二、所有权说明：

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明：

1、如您需要转载本站数据，请保留原数据地址及相关版权声明。

四、侵权与处理说明：

1、如本站中的部分数据涉及侵权展示，请及时联系本站，我们会安排进行数据下线。

所需积分：

15 去赚积分？

931浏览
2下载
0点赞
收藏
分享

Select Language

AI社区

今日排行

本月搜索

Dataset Category