现代声学理论基础

创建时间 2019-05-27
更新时间 2021-04-28

第一章 绪论

三分损益十二律

律名 黄钟 大吕 太簇 夹钟 姑洗 仲吕 蕤宾 林钟 夷则 南吕 无射 应钟 清黄
相生次序 1 8 3 10 5 12 7 2 9 4 11 6 (13)
律长 81 75.9 72 67.4 64 59.9 56.9 54 50.6 48 44.9 42.7
五七声宫调 变徵 变羽 清宫
音名 C #C D #D E F #F G #G A #A B C’
唱名 do re mi fa sol la si do’

注:
- 蕤 [ruí]
- 角 [jué]
- 徵 [zhǐ]

音律

欧洲乐律起猓一般归之于毕达哥拉斯(Pythagoras)。毕达哥拉斯律完全用三分损一(弦长,或称五度相生)前面生的六声与我国完全相同,另一声fa, 则接近自然律,他的中心思想是用简单整数的比值,毕氏是公元前六世纪的希腊哲学家,时间比管仲稍晚。

共振

古代,在我国另一个受到重视的问题是共振现象,在欧洲却讨论不多。原因可能是共振和我国古代“天人相应”的哲学思想符合,共振称为“应”声。两个调谐一 致的琴,“鼓宫宫动,鼓角角动,音律同矣”。

响度

关千声的接收研究主要是人耳听觉的研究,比对语言发声研究丰富得多。人 耳听觉的灵敏度和人目视觉的灵敏度都是惊人的。正常听觉阔限是10^{-12}W/m^2声动率。如果说鼓膜的平均面积是0.66cm^2,能够使人感觉到声音的强度就是6.6 \times 10^{-11}W。声音响0.1s就可以认出,所以认出声音只需要能量 6.6 \times 10^{-18}J

频率

人耳听觉问题引起很多生理学家和心理学家的注意,不仅是物理学家的事。关千听觉的频率范围有很多工作,法国科学家萨瓦(F.Savart)于1830年前后求得听觉低限频率8Hz,高限24000Hz,随着后来不少人做了不少工作,得到的结果,低频是在16 ~ 32Hz之间,人与人之间颇有出入,但高频出入更大,而且随年岁增加高频极限不断 降低。现在一般标准定为20和20000Hz(也有人认为更低或更高的)。

完全是人为的规定声强的听觉低限是托普勒(A.Toepler)与著名的统计物理学家玻尔兹曼(Boltzmann)在1870年前后合作研究的。他们巧妙地用光学干涉方法测空气密度最大变化,据此算出最大声场强度,得到的结果是10^{-7}W/m^2,比现在接受的值大得多,但已足以说明听觉灵敏度的高。

第一个提出听觉理论的是提出电路定律的德国物理学家欧姆(GeorgSimon Ohm), 他于1843年指出一个乐音具有基波和频率为整数倍的谐波,谐波结构决定乐音的音色,这称为欧姆听觉定律

人耳听音时就像谐波分析器一祥,可把声音的基波和各谐波分解,如1822年提出的傅里叶级数。欧姆听觉定律引起大世生理声学和心理声学的研究工作,其中最伟大的是亥姆霍兹,他的研究结果发表千1862年出版的伟大著作《音的感知》,1895年出版了英文版。他提出耳内机构的详细理论,即共振理论。按照这个理论,耳蜗的基底膜各部分对射来声音的不同频率共振。这样就可以说明欧姆听觉定律。亥姆霍兹时代,生理学知识极为有限,他的结论和理论主要是由物理现象推论而来。

混响

西方社会生活较多,教堂、戏院、讲堂、教室等都多,有些就不适于听声(语言、音乐等),人们想了不少改进的办法,但是很少谈到混响。

1853年美国波士顿物理学家伍普汉(J. B. Upham)发表了几篇文章,反映对关键问题,对混响有较明确的认识,他用挂些幕布、帘子,加些椅垫等方法改进了听觉条件。

1856年,美国著名的物理学家亨利(Joseph Henry)对混响做了研究,但只提出一些定性的建议,不为建筑师所注意。

到19世纪末赛宾(W. C. Sabine)的研究才彻底解决了混响问题。

电声学

电声学的研究也是19世纪开始的,贝尔(Alexander Graham Bell)千1876年发明了电话,但是电声换能器(指传声器、耳机、扬声器等)的严格科学研究还有待于50年后。

直到19世纪末的声学研究工作由瑞利勋爵(Lord Rayleigh)以他的两卷巨著《声的理论》总结了300年重要成就,集声学理论的大成,至今仍为经典,引用不绝。当时科学界断言,声学已经发展到极点,问题都解决了。

声波

声波是物质波,是在弹住介质(气体、液体和固体)中传播的压力、应力、质点运动等的一种或多种变化。声也是这些变化所引起人的声觉。

整个气体则看成连续流体,和水一样,忽略分子间的空当。质点就是连续流体中的一个点,静止,在受力时可以移动。声波就是质点运动的传播。质点运动或流体运动制约于物质守恒定律和牛顿运动定律,这也是声波的基础。

阻尼波

气体中能使振动受到阻尼的只有黏滞性和热传导,这些因数都很小,一般只是长距离传播,或有固体或其它介质时才比较重要。

第三章 声的主客观评价

人听声音时,主观 上是感觉它的大小强弱(响度),高低尖粗(音调)以及它的质散(音色)。这些在过去都是不能定量描述的,在语言声的研究中,逐渐建立了心理物理学实验方法,除 了音色很难定量评价外,首先建立了响度相同声音的频率强度关系,进一步又求得了响度与强度、频率的定量关系,并求得其规律和般主观感知和客观参数的关系。同样,也求得音调与频率的关系并和人的听觉系统的构造联系起来。根据这些结果提出接近主观感知的客观量一计权声级,成为可以用仪器测量的参数,并提出符合听力要求的声波频谱分析技术,使语声的分析与合成有了办法,这就是 建立语言机器的基础。本章中讨论声的主客观评价僵和相互关系,从人耳的听力开始。

人的听觉

人耳分外耳、中耳和内耳三部分。外耳有耳廓和外耳道。耳廓长52 \sim 79 mm, 各人不同。一般动物的耳廓起收集外来声音进入外耳道的作用,但人的耳廓在这方面作用不大,如要收集声音,增加耳的灵敏度须把手掌弯曲置在耳后。外耳道截面积30 \sim 50 mm^2, 长27 \sim 35 mm, 末端以鼓膜封闭并与中耳隔离。鼓膜基本是圆形,面积 50 \sim 90 mm^2, 中心向中耳突出使鼓膜接近圆锥形。中耳连接外耳和内耳,内有三个听小骨,鼓膜所受力集中于中心传到锤骨—站骨一橙骨链进入内耳。中耳总容积约 1 \sim 2 ml, 锤骨重23mg, 长 5.5 \sim 6mm, 祜骨27mg, 橙骨215 mg, 镜骨底长3.2mm,宽1,4mm, 面积3.2 mm^2。通到骨壁上的卵圆窗上的前庭 膜推动内耳中淋巴液。三块小骨形成机械放大器放大约3倍,把鼓膜上的微小振 动放大到卵圆窗而至听力中心,由于面积关系也要放大约15倍。

听力最重要部分是内耳的耳蜗。耳蜗像个蜗牛壳,是绕成两圈半的骨质细管,管长35mm, 沿其 长度以基底膜分为两半,在蜗顶处有小孔相连,管内充满淋巴液体,两半的末端分别为骨壁上的卵圆管和圆窗。基底膜在镜骨处宽0.04mm, 蜗孔处宽0.5mm与蜗管由大变小正相反。按欧姆(电路理论的著名科学家)分析,后得生理学解剖证实,基底膜的作用如一频率分析器,从链骨处高频,逐渐降低,到蜗孔处低频,各点对不同频率共振。 声波自橙骨传入后,在上半管(前庭阶)中沿基底膜传播,到蜗孔再在下半管(鼓阶)中传回到圆窗。基底膜上与频率相应的部分发生共振,其上的毛细胞弯曲,发出神经脉冲,经耳蜗神经传入大脑。基底膜的共振不是非常尖锐,共振峰较宽,由于内、外毛细胞的化学能释放,形成正反馈,使共振十分尖锐,对1000Hz的声音可以辨别4Hz的差值。人耳对声信号的处理已比较明确,但大脑对神经脉冲的处理还要进一步研究,听觉理论还不完整。

响度

一般人的听力在低频和高频都较差。 例如40 phon的声音在1000 Hz要求声 压级40 dB(0 dB= 20µPa), 在100 Hz就要求52 dB, 在20 Hz就要求91 dB了,听起来是一样的响。在低频率,听力降低的情况各人出入不大。但在高频率10kHz以上,各人之间出入就很大了。平常定高频听力的极限为20kHz完全是人为选定的,青年和少年可能达到,年纪大的人高频的听力要低,随着年龄增长,下降更多,大致10 kHz以下的听力不大改变,但如果在噪声下长期暴露, 10 kHz以下,特别是 2~3 kHz的听力也要变弱。是长期在强噪声中工作的工人,他的听力在2 kHz上面降低至50dB, 且耳蜗上相应位置毛细胞完全破坏(达全部的30%)。这种耳聋是不可能恢复的,毛细胞不能再生。

响度的定义是,以 40phon 响度级的响度 N 为 1宋(sone),听者判断为其2倍响的是2sone, 为其10倍响的是10 sone。由大批听力正常的青年人由不同的响度级起做2倍响、10倍响的试验,得到的结果很有规律,因而得到响度与响度级的关系,在半对数坐标纸上是一直线。用数学表达式响度:

N = 2^{L_{N}-40}

音调 音高

听觉有掩蔽现象:一个声音由于另一声音的存在而提高听阈,但二音的频率差大到一定程度,这种影响就小了。互相掩蔽的最大 频率差值称为临界频带宽度。

听阈:能产生听觉的最高限度和最低限度的刺激强度。 耳的适宜刺激是空气振动的疏密波,但振动的频率必须在一定的范围内,并且达到一定强度,才能被耳蜗所感受,引起听觉。通常人耳能感受的振动频率在16-20000Hz之间,而且对于其中每一种频率,都有一个刚好能引起听觉的最小振动强度,称为听阈。人耳对不同频率的可听阈是不同的,例如对1KHz纯音的可听阈约为2 \times 10^{-5}Pa。当振动强度在听阈以上继续增加时,听觉的感受也相应增强,但当振动强度增加到某一限度时,它引起的将不单是听觉,同时还会引起鼓膜的疼痛感觉,这个限度称为最大可听阈。人耳最敏感的频率在1000~3000Hz之间;而日常语言的频率较此略低,语音的强度则在听阈和最大可听阈之间的中等强度处。

参考资料