Select Language

公开数据集

呼吸声音数据集,包括920条带注释语音数据

呼吸声音数据集,包括920条带注释语音数据

Scene:

Medical

Data Type:

Classification
所需积分:11 去赚积分?
  • 330浏览
  • 3下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 3.69G

    Data Structure ?

    *数据结构实际以真实数据为准

    呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动,肺组织内的变化以及肺内分泌物的位置直接相关。例如,喘息声是患者患有阻塞性气道疾病(如哮喘或慢性阻塞性肺病(COPD))的常见征兆。

    可以使用数字听诊器和其他录制技术录制这些声音。这些数字数据开辟了使用机器学习自动诊断呼吸系统疾病(例如哮喘,肺炎和细支气管炎)的可能性。

    呼吸声音数据库是由葡萄牙和希腊的两个研究小组创建的。它包括920条带注释的长度不等的记录-10s至90s。这些录音来自126位患者。总共有5.5个小时的录音,包含6898个呼吸循环-1864个包含crack啪声,886个包含wh气,而506个包含crack啪声和喘息。数据包括干净的呼吸声以及模拟现实生活状况的嘈杂录音。患者涵盖所有年龄段-儿童,成人和老年人。

    数据集包括:

    • 920.wav声音文件

    • 920个注释.txt文件

    • 文本文件列出每个患者的诊断

    • 解释文件命名格式的文本文件

    • 列出91个名称的文本文件(filename_differences.txt)

    • 包含每个患者的人口统计信息的文本文件

    注意:

    filename_differences.txt是文件列表,这些文件的名称在此数据集的创建者在原始文件命名脚本中发现错误后已更正。现在可以忽略它。

    General

     The demographic info file has 6 columns:
      - Patient number
      - Age
      - Sex
      - Adult BMI (kg/m2)
      - Child Weight (kg)
      - Child Height (cm)
    
    
    Each audio file name is divided into 5 elements, separated with underscores (_).
    
    1. Patient number (101,102,...,226)
    2. Recording index
    3. Chest location 
          a. Trachea (Tc)
          b. Anterior left (Al)
          c. Anterior right (Ar)
          d. Posterior left (Pl)
          e. Posterior right (Pr)
          f. Lateral left (Ll)
          g. Lateral right (Lr)
    4. Acquisition mode 
         a. sequential/single channel (sc), 
         b. simultaneous/multichannel (mc)
    5. Recording equipment 
         a. AKG C417L Microphone (AKGC417L), 
         b. 3M Littmann Classic II SE Stethoscope (LittC2SE), 
         c. 3M Litmmann 3200 Electronic Stethoscope (Litt3200), 
         d.  WelchAllyn Meditron Master Elite Electronic Stethoscope (Meditron)
    
    The annotation text files have four columns:
    - Beginning of respiratory cycle(s)
    - End of respiratory cycle(s)
    - Presence/absence of crackles (presence=1, absence=0)
    - Presence/absence of wheezes (presence=1, absence=0)
    
    The abbreviations used in the diagnosis file are:
    - COPD: Chronic Obstructive Pulmonary Disease
    - LRTI: Lower Respiratory Tract Infection
    - URTI: Upper Respiratory Tract Infection

    Citation

    Paper: Α Respiratory Sound Database for the Development of Automated Classification

    Rocha BM, Filos D, Mendes L, Vogiatzis I, Perantoni E, Kaimakamis E, Natsiavas P, Oliveira A, Jácome C, Marques A, Paiva RP (2018) In Precision Medicine Powered by pHealth and Connected Health (pp. 51-55). Springer, Singapore.

    https://eden.dei.uc.pt/~ruipedro/publications/Conferences/ICBHI2017a.pdf

    Ref Websites

    Acknowledgements

    Many thanks to the research teams at the University of Coimbra, Portugal; the University de Aveiro, Portugal and the Aristotle University of Thessaloniki, Greece for making this dataset publicly available.

    Inspiration

    • Build a model to classify respiratory diseases.

    • Build a model to detect if a recording contains crackles, wheezes or both.

    • Annotation is a time consuming process. Create a model to automatically annotate respiratory sound recordings.

    • Deploy your model as a Tensorflow.js web app so it can be accessed from anywhere in the world.

    • Bioelectronics - Can you build your own digital stethoscope using an Arduino? If you are an aspiring inventor, this video will give you some valuable practical advice: https://www.youtube.com/watch?v=jo1cQ-ga2MI

    Photo by voltamax on Pixabay.


    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。