冥王生活

您现在的位置是:首页 > 科技生活 > 正文

科技生活

什么是听觉掩蔽效应(听觉掩蔽现象)

admin2022-12-17科技生活111

什么是掩蔽效应?

一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”.人耳的掩蔽效应 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”...

什么是耳朵的掩蔽效应?

在古希腊曾流传着这样一个神话故事:宇宙之神克鲁纳士,有一个吞食自己孩子的怪癖。所以克鲁纳士的妻子在生下最后一个孩子宙斯以后,生怕他再遭厄运,就偷偷藏在克里特岛的洞中,而把石块包在襁褓中让克鲁纳士吃掉了。为了避免小宙斯被发现,每当他在洞中哭叫时,守卫在洞口的卫士们就用石头敲击盾牌发出的巨响来压倒婴儿的哭声。就这样,小宙斯生存下来了。

在上面故事中,卫士们为了保护小宙斯,用一种响的声音去遮盖另一种弱的声音,这在科学上叫声的掩蔽。声的掩蔽是一种和听觉器官相关联的现象,在日常生活中经常会遇到。例如,在工厂的车间里,各种机器的混响淹没了人们的谈话;收听质量差的收音机,刺耳的杂音干扰了电台播放的音乐;拥挤的市场上,人群的喧哗掩盖了商家的叫卖声等,都属于声的掩蔽现象。

要想用一种声音去掩盖住另一种声音,掩蔽声必须具有足够的强度才行,否则就很难达到预期的效果。正因为如此,所以在人声嘈杂的场合讲话或演唱时,应当加设扩音设备,把声音扩得越响,掩蔽效果越好。

除此之外,掩蔽效应还跟掩蔽声的频率有关。实验表明,掩蔽声的频率比被掩蔽声的频率低,掩蔽效果就强,反之,效果较差。例如在剧场或歌舞厅里,若舞台上演出的是女声歌唱或轻音乐,即使声音较响,台下观众依然可以轻声交谈而不被掩蔽;可是当台上演出带有打击乐的音乐节目时,台下观众相互交谈就比较困难了。特别是,当掩蔽声的频率同被掩蔽声的频率相同或相近时,声的掩蔽效果将会十分显著。在广场或礼堂听报告时,台下的喧哗声常常使人听不清甚至听不见台上的讲话声,就是这个缘故。

在人类生活的环境中,总是存在着各种各样嘈杂的声音。在这样背景条件下,由于声的掩蔽现象的存在,给人们接收某些有用的声音带来了困难。幸好我们的耳朵有很强的选择性,它像一个滤波器一样,可以把那些与我们无用的声音频率成分给滤掉了,而把人们需要听的声音频率成分给留下了,这就使得我们能够听到这些声音。例如,一个人,他可以对窗外哗啦啦的雨声“充耳不闻”,却可以集中精力听清他对面朋友的谈话;一个孩子的母亲,她对托儿所里几十名孩子的哇哇叫声“置若罔闻”,却独独听见了自己孩子的哭声。

掩蔽效应

如果大家对音视频相关知识感兴趣,可以订阅我的专题 视频播放器和音视频基础知识 。

所谓的掩蔽效应是指: 一个较弱的声音的听觉感受被另一个较强的声音影响的现象,我们就称之为人耳的“掩蔽效应”。“掩蔽效应”在实际声学应用中有很重要的作用。

我们假设安静的环境下,听清楚声音A的阈值为30dB,若此时又能同时听见声音B,这时由于B的影响,使得 A的阈值提高到了40dB,即比原来提高了10dB。此时,我们就称B为掩蔽声,A为被掩蔽声。被掩蔽声听阈提高的分贝数称为掩蔽量,即上述10dB为掩蔽量,40dB称为掩蔽阈。

掩蔽可分成频域掩蔽和时域掩蔽。

事实上,掩蔽效应并不仅仅是个音量问题,因为当掩蔽音与被掩蔽音的频率不相同的时候,掩蔽作用并不那么严重。但一个响亮的纯音很容易就把另一个频率更高的纯音给掩蔽掉。

一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking),如图1所示。

从图1中可以看到,声音频率在300 Hz附近、声强约为60 dB的声音掩蔽了声音频率在150 Hz附近、声强约为40 db的声音。又如,一个声强为60 dB、频率为1000 Hz的纯音,另外还有一个1100 Hz的纯音,前者比后者高18 dB,在这种情况下我们的耳朵就只能听到那个1000 Hz的强音。如果有一个1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同时听到这两个声音。要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB。一般来说,弱纯音离强纯音越近就越容易被掩蔽。

在图2中的一组曲线分别表示频率为250 Hz,1 kHz和4 kHz纯音的掩蔽效应,它们的声强均为60 dB。从图2中可以看到:

1)在250 Hz,1 kHz和4 kHz纯音附近,对其他纯音的掩蔽效果最明显。

2)低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。

由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(critical band)”的概念。通常认为,在20 Hz到16 kHz范围内有24个临界频带,临界频带的单位叫Bark(巴克),

1 Bark = 一个临界频带的宽度

f(频率) 500 Hz的情况下,1 Bark≈f/100

f(频率) 500 Hz的情况下,1Bark≈9 + 4log(f/1000)

以上我们讨论了响度、音高和掩蔽效应,尤其是人的主观感觉。其中掩蔽效应尤为重要,它是心理声学模型的基础。

除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking),如图3所示。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms。

除了频域掩蔽和时域掩蔽外,还存在一种被称之为“时间掩蔽”的效应。

同步掩蔽效应和不同频率声音的频率和相对音量有关,而时间掩蔽则仅仅和时间有关。

如果两个声音在时间上特别接近,我们在分辨它们的时候就会有困难。例如,如果一个很响的声音后面紧跟着一个很弱的声音,后一个声音就很难听到。但是如果在第一个声音停止后过一段时间再播放第二个声音,后一个声音就可以听到。对纯音一般来讲,这个间隔时间是5毫秒。当然如果在时序上反过来,效果是一样的。如果一个较低的声音出现在一个较高的声音之前,而且间隔很短,那个较低的声音我们也听不到。

掩蔽效应是指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。

应用此原理,人们发明了mp3等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。

MP3用户可以指定每一秒的音乐是用多少个bit来存储。而MP3编解码器只关心频率之间和音量之间的相互关系。

编码过程中,信号中的“无用分量”被拿来和人类心理声学的数学模型,以及压缩使用的比特率作比较,以决定要扔掉哪些数据。当前MP3压缩使用的比特率一般是128kbps。编码器在输出每一帧数据的时候都会考虑到这个数字,如果比特率比较低,那么“无关”和“冗余”数据的定义就会被放宽,导致大量的数据被认为是无用数据,此时压缩后的音频会丢失大量细节,导致音质下降。相反,如果使用较高的比特率编码,“无关”和“冗余”的标准就会被限定的更严格,细节会被保留,但是文件更大。

除此之外,听觉的掩蔽效应在电声领域也被广泛应用。如动态降噪,就是根据不同的节目对噪声的掩蔽不同的原理设计的。

掩蔽效应不仅是听觉生理现象,也是心理现象,“鸡尾酒效应”就是其中的一例。鸡尾酒效应是指当注意力十分集中时,或对比较熟悉的声音,人的听觉可以从相当严重的掩蔽噪声下,有选择地倾听想要听的声音。在许多人相聚的鸡尾酒会中,可以对特定人的的讲话听的最清楚,这在实际录音中也有很多的应用。

什么是听觉掩蔽现象?

听觉掩蔽现象是指一种声音对听觉系统感受另一种声音的影响,其在自然界中普遍存在。听觉掩蔽现象不仅在人和动物对声音的感知和定位中起着重要的作用,其也越来越多地被应用于实际生活和临床治疗。 编辑摘要 目录 1 现象表现 2 声音作用 3 实际应用 4 语音识别相关 1 现象表现 2 声音作用 3 实际应用 3.1 环境噪声控制 3.2 临床耳鸣的治疗 3.3 语音增强 4 语音识别相关 听觉掩蔽现象 - 现象表现 声音无处不在人和动物都生活在充满声音的环境里,人类依靠声音进行交流,很多动物则靠声音进行通讯,寻找食物和配偶乃至感知外界环境。有些有生物学意义的声音在自然界中并非孤立存在,它们之间相互作用相互影响会形成听觉的掩蔽现象。在听觉研究中,掩蔽是指一种声音对听觉系统感受另一种声音的影响。早期听觉心理物理学测试显示,当从不同位置呈现的两个声信号间隔时间足够短时,受试者将两个声信号辨知为一个融合声,且只能确认前导声的位置,即第一个声音(掩蔽声)对滞后声(探测声)存在前掩蔽效应;同时滞后声对前导声的感知也存在着一定程度的后掩蔽效应。一般而言,掩蔽作用会削弱听觉系统对声音的辨别和感知,引起对探测声的反应下降,感受阈值升高,对探测声探测能力降低;而在有些情况下掩蔽声也可易化神经元对探测声的反应使其兴奋性增加。 自然界中存在的听觉掩蔽现象非常普遍,其在人和动物对声音的感知和定位中起着非常重要的作用。随着人们对听觉掩蔽现象的了解,其也越来越多被应用于实际生活和临床有关疾病的治疗。 听觉掩蔽现象 - 声音作用 生源定位测试图解声源定位:当声音产生于一个回响的环境时,会向不同方向传播,并且随后从附近的表面反射回来,第一个声音和反射回来的声音之间会相互影响,从而产生掩蔽效应。听觉系统因而面临着要分析发出去的第一个声音和反馈声之间相互作用的问题,并根据反馈声的不同特性进行声音的感知和定位,尽管这是一堆看似乱糟糟的信息,但我们仍然能对这些声源进行定位并能相当准确的分辨出其中的含义。声源定位的能力相当重要,确定物体的方向有助于我们将注意转向或回避某种声源。对于某些动物,尤其是声纳动物如蝙蝠等,声源定位有助于寻找捕猎对象或回避敌害,此为生存的必不可少的能力。 噪声环境下声信号的辨别:实际生活中,人们的听觉系统常常是在噪声的环境中辨别信号的存在。由于根据声音到达两侧耳,在双耳对声音的感知时会产生双耳掩蔽效应,而研究表明双耳的掩蔽效应对噪声环境中信号的辨别具有明显的实际意义。当两个或多个声源来自不同角度时,由于信号抵达双耳的时间和位相不同,我们较易定位各声源或将注意力集中于某一种声源。譬如,从合唱团表演中分辨出来人的嗓音,从乐队演奏中分辨出某一种乐器,或从嘈杂的晚会上听取交谈的内容,这种基于声源在空间位置上的不同而从复杂环境中辨别声信号的能力常被称为“鸡尾酒会效应”。 正是由于听觉掩蔽效应在声音感知和定位方面的重要影响和作用,根据其作用的原理和特点,听觉掩蔽效应被广泛地应用于语音通讯领域和临床上某些听觉相关疾病的治疗和研究。 听觉掩蔽现象 - 实际应用 环境噪声控制 掩蔽现象可以适当地应用于环境噪声控制,如果掩蔽噪声为连续的声音,而又不大响亮,且没有信息内容时,它可以成为使人易于接受的本底噪声,同时也可以抑制其它干扰的噪声,使人听到这些声音时从心理上不觉得烦躁,如刹车的刺耳声,盘子的碰撞声,便可用风扇之类较柔和的噪声来掩蔽。 临床耳鸣的治疗 耳鸣既可以是整个听觉系统中某一部分功能紊乱表现出来的一种临床症状,也可能是精神或心理因素所致。耳鸣至少有80%源于外周(即耳蜗性耳鸣),这种由内耳引起的耳部疾病,主要途径可能为病变导致毛细胞或听神经末梢等受损或变性坏死而致功能失调或引起中枢控制失调,这样就可能使听神经自行发出一些病理信号,即产生一种异常的自发放电活动,且被错误地感觉为一种声音。目前临床上常见的治疗耳鸣的方法为掩蔽疗法,掩蔽疗法的作用机制就是选择活动性增强部分毛细胞相对应的窄带噪声以兴奋支配这部分细胞的传出神经,从而降低毛细胞的自发活动性,使之恢复正常活动。经过一段时期的刺激训练,即可恢复部分或全部传出神经的兴奋性,降低异常自发放电活动或自发放电活动恢复正常。抹掉中枢对耳鸣的记忆及破坏其可塑性,从而达到缓解耳鸣甚至耳鸣消失。 语音增强 在实际语音通信中,语音信号很容易受到噪声的污染,用语音进行信息交流会受到严重影响,致使许多通信系统的性能急剧恶化。语音增强作为一种预处理手段,是解决噪声污染、改善通信质量的有效方法。目前在语音增强中用得比较成功的是听觉掩蔽效应,语音信号能够掩蔽与其同时进入听觉系统的一部分能量较小的噪声信号,从而使得这部分噪声不为人们所感知。 听觉掩蔽现象 - 语音识别相关 掩蔽效应既影响听觉的感受也影响听觉的辨别。人的大脑皮质与语言的关系,已有很长的研究历史,重点是确定了一些与语言密切相关的皮质区域。由于技术上的限制,先驱者们积累的资料,较多地是靠分析语言障碍患者病变部位与失语特征的相关性获得。有3-6%的儿童口头表达和理解别人的说话会极端困难,这种症状称之为“特定语言损伤”。研究认为特定语言损伤源于对大脑皮层语言和认知的加工缺乏特异性,更有研究者认为特定语言损伤是由于一个更基本的原因,即受影响的儿童不能分辨出言语中连续短声在声学上的不同。采用脑电图以及功能性核磁共振技术(fMRI)研究发现,语言障碍儿童存在非语言的感觉紊乱和神经生理学损伤,如复杂的、非语言的声音听觉记忆障碍,初级听皮层以及相关脑区在不同掩蔽条件下出现不同活动模式(pattern),实验显示语言障碍儿童对听觉的后掩蔽效应与正常儿童相比减弱,但是同时掩蔽效应则不太受影响。通过在听觉同时掩蔽和后掩蔽的条件下测量的大脑活动,发现这两种情况可激活不同的听觉加工流程和不同的感知脑区,对于语言障碍儿童来说,可能是后掩蔽模式激活的部分特定的听觉和认知脑功能恰好被削弱了。提示听觉系统对声信号的时相整合(temporal integration)功能在语言认知过程中起重要作用。

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~