如何在一段音频中听见几次呼吸

osc_89121052 发布于 10/13 13:54
阅读 483
收藏 0

需要用到什么操作概念以及执行框架

加载中
0
只做你的小飞哥
只做你的小飞哥

提取音频特征数据,输入呼吸的特征数据,进行对比,不是很准确
 

0
f
freezingsky

只需要一个人,会喘气的,然后录制过程中,发出骄喘,就可以了

0
ArchitectureMaster
ArchitectureMaster

题主先要了解发声的原理及计算机记录声音的方式。物理学基础告诉我们声音是物体振动产生空气摩擦传递在空气中,声音的高低则由单位时间内振动的次数决定,每秒中振动次数我们称为赫兹hz,简单讲不同的声音hz数一般不相同。人能听到的hz数是20-20khz,低于这个范围我们叫次声波,高于则叫超声波。计算机用波形来记录,也就是我们的波表文件wav,而原始的波形文件记录的声波则是不规则的类似于贝塞尔曲线,将这些声波以数字化就需要做傅立叶算法转换,转换后的文件存储的就是我们常说有脉冲,也就是方波。而方波再进一步用算法把相近或相同的形状合并我们称为声音的压缩,压缩算法有很多种,我们所知的mp3就是一种,压缩后保存的格式就是mp3、aac等。

回答题主的问题,首先要知道音频的压缩方式,并还原成最原始的模拟波,找出特征声纹信息,简单来讲呼吸的声音振幅和说话声明显不在一个频响范围。找出呼吸的频宽hz,先过滤出这个频宽范围的所有波形,再用图形学降噪原理过滤掉不是呼吸的声音,统计剩下的出现个数就可知多少次呼吸。

其实不难发现对于计算机而言图形和声音是原理相通的,当然不了解的人会说计算机不都是0和1吗?但我说的是我们能通过程序去实现的这一层原理是相通的,而不是自己去从零开始设计自己的软硬件。

OSCHINA
登录后可查看更多优质内容
返回顶部
顶部