现代声学理论基础

创建时间 2019-05-27

更新时间 2021-04-28

分类

读书笔记

第一章绪论

三分损益十二律

律名	黄钟	大吕	太簇	夹钟	姑洗	仲吕	蕤宾	林钟	夷则	南吕	无射	应钟	清黄
相生次序	1	8	3	10	5	12	7	2	9	4	11	6	(13)
律长	81	75.9	72	67.4	64	59.9	56.9	54	50.6	48	44.9	42.7
五七声宫调	宫		商		角		变徵	徵		羽		变羽	清宫
音名	C	#C	D	#D	E	F	#F	G	#G	A	#A	B	C’
唱名	do		re		mi	fa		sol		la		si	do’

注：
- 蕤 [ruí]
- 角 [jué]
- 徵 [zhǐ]

音律

欧洲乐律起猓一般归之于毕达哥拉斯(Pythagoras)。毕达哥拉斯律完全用三分损一（弦长，或称五度相生）前面生的六声与我国完全相同，另一声fa, 则接近自然律，他的中心思想是用简单整数的比值，毕氏是公元前六世纪的希腊哲学家，时间比管仲稍晚。

共振

古代，在我国另一个受到重视的问题是共振现象，在欧洲却讨论不多。原因可能是共振和我国古代“天人相应”的哲学思想符合，共振称为“应”声。两个调谐一致的琴，“鼓宫宫动，鼓角角动，音律同矣”。

响度

关千声的接收研究主要是人耳听觉的研究，比对语言发声研究丰富得多。人耳听觉的灵敏度和人目视觉的灵敏度都是惊人的。正常听觉阔限是 $10^{-12}W/m^2$ 声动率。如果说鼓膜的平均面积是 $0.66cm^2$ ,能够使人感觉到声音的强度就是 $6.6 \times 10^{-11}W$ 。声音响0.1s就可以认出，所以认出声音只需要能量 $6.6 \times 10^{-18}J$ 。

频率

人耳听觉问题引起很多生理学家和心理学家的注意，不仅是物理学家的事。关千听觉的频率范围有很多工作，法国科学家萨瓦(F.Savart)于1830年前后求得听觉低限频率8Hz，高限24000Hz，随着后来不少人做了不少工作，得到的结果，低频是在16 ~ 32Hz之间，人与人之间颇有出入，但高频出入更大，而且随年岁增加高频极限不断降低。现在一般标准定为20和20000Hz(也有人认为更低或更高的）。

完全是人为的规定声强的听觉低限是托普勒(A.Toepler)与著名的统计物理学家玻尔兹曼(Boltzmann)在1870年前后合作研究的。他们巧妙地用光学干涉方法测空气密度最大变化，据此算出最大声场强度，得到的结果是 $10^{-7}W/m^2$ ，比现在接受的值大得多，但已足以说明听觉灵敏度的高。

第一个提出听觉理论的是提出电路定律的德国物理学家欧姆(GeorgSimon Ohm), 他于1843年指出一个乐音具有基波和频率为整数倍的谐波，谐波结构决定乐音的音色，这称为欧姆听觉定律。

人耳听音时就像谐波分析器一祥，可把声音的基波和各谐波分解，如1822年提出的傅里叶级数。欧姆听觉定律引起大世生理声学和心理声学的研究工作，其中最伟大的是亥姆霍兹，他的研究结果发表千1862年出版的伟大著作《音的感知》，1895年出版了英文版。他提出耳内机构的详细理论，即共振理论。按照这个理论，耳蜗的基底膜各部分对射来声音的不同频率共振。这样就可以说明欧姆听觉定律。亥姆霍兹时代，生理学知识极为有限，他的结论和理论主要是由物理现象推论而来。

混响

西方社会生活较多，教堂、戏院、讲堂、教室等都多，有些就不适于听声（语言、音乐等），人们想了不少改进的办法，但是很少谈到混响。

1853年美国波士顿物理学家伍普汉(J. B. Upham)发表了几篇文章，反映对关键问题，对混响有较明确的认识，他用挂些幕布、帘子，加些椅垫等方法改进了听觉条件。

1856年，美国著名的物理学家亨利(Joseph Henry)对混响做了研究，但只提出一些定性的建议，不为建筑师所注意。

到19世纪末赛宾(W. C. Sabine)的研究才彻底解决了混响问题。

电声学

电声学的研究也是19世纪开始的，贝尔(Alexander Graham Bell)千1876年发明了电话，但是电声换能器（指传声器、耳机、扬声器等）的严格科学研究还有待于50年后。

直到19世纪末的声学研究工作由瑞利勋爵(Lord Rayleigh)以他的两卷巨著《声的理论》总结了300年重要成就，集声学理论的大成，至今仍为经典，引用不绝。当时科学界断言，声学已经发展到极点，问题都解决了。

声波

声波是物质波，是在弹住介质（气体、液体和固体）中传播的压力、应力、质点运动等的一种或多种变化。声也是这些变化所引起人的声觉。

整个气体则看成连续流体，和水一样，忽略分子间的空当。质点就是连续流体中的一个点，静止，在受力时可以移动。声波就是质点运动的传播。质点运动或流体运动制约于物质守恒定律和牛顿运动定律，这也是声波的基础。

阻尼波

气体中能使振动受到阻尼的只有黏滞性和热传导，这些因数都很小，一般只是长距离传播，或有固体或其它介质时才比较重要。

第三章声的主客观评价

人听声音时，主观上是感觉它的大小强弱（响度），高低尖粗（音调）以及它的质散（音色）。这些在过去都是不能定量描述的，在语言声的研究中，逐渐建立了心理物理学实验方法，除了音色很难定量评价外，首先建立了响度相同声音的频率强度关系，进一步又求得了响度与强度、频率的定量关系，并求得其规律和般主观感知和客观参数的关系。同样，也求得音调与频率的关系并和人的听觉系统的构造联系起来。根据这些结果提出接近主观感知的客观量一计权声级，成为可以用仪器测量的参数，并提出符合听力要求的声波频谱分析技术，使语声的分析与合成有了办法，这就是建立语言机器的基础。本章中讨论声的主客观评价僵和相互关系，从人耳的听力开始。

人的听觉

人耳分外耳、中耳和内耳三部分。外耳有耳廓和外耳道。耳廓长 $52 \sim 79 mm$ , 各人不同。一般动物的耳廓起收集外来声音进入外耳道的作用，但人的耳廓在这方面作用不大，如要收集声音，增加耳的灵敏度须把手掌弯曲置在耳后。外耳道截面积 $30 \sim 50 mm^2$ , 长 $27 \sim 35 mm$ , 末端以鼓膜封闭并与中耳隔离。鼓膜基本是圆形，面积 $50 \sim 90 mm^2$ , 中心向中耳突出使鼓膜接近圆锥形。中耳连接外耳和内耳，内有三个听小骨，鼓膜所受力集中于中心传到锤骨—站骨一橙骨链进入内耳。中耳总容积约 $1 \sim 2 ml$ , 锤骨重23mg, 长 $5.5 \sim 6mm$ , 祜骨27mg, 橙骨215 mg, 镜骨底长3.2mm,宽1,4mm, 面积 $3.2 mm^2$ 。通到骨壁上的卵圆窗上的前庭膜推动内耳中淋巴液。三块小骨形成机械放大器放大约3倍，把鼓膜上的微小振动放大到卵圆窗而至听力中心，由于面积关系也要放大约15倍。

听力最重要部分是内耳的耳蜗。耳蜗像个蜗牛壳，是绕成两圈半的骨质细管，管长35mm, 沿其长度以基底膜分为两半，在蜗顶处有小孔相连，管内充满淋巴液体，两半的末端分别为骨壁上的卵圆管和圆窗。基底膜在镜骨处宽0.04mm, 蜗孔处宽0.5mm与蜗管由大变小正相反。按欧姆（电路理论的著名科学家）分析，后得生理学解剖证实，基底膜的作用如一频率分析器，从链骨处高频，逐渐降低，到蜗孔处低频，各点对不同频率共振。声波自橙骨传入后，在上半管（前庭阶）中沿基底膜传播，到蜗孔再在下半管（鼓阶）中传回到圆窗。基底膜上与频率相应的部分发生共振，其上的毛细胞弯曲，发出神经脉冲，经耳蜗神经传入大脑。基底膜的共振不是非常尖锐，共振峰较宽，由于内、外毛细胞的化学能释放，形成正反馈，使共振十分尖锐，对1000Hz的声音可以辨别4Hz的差值。人耳对声信号的处理已比较明确，但大脑对神经脉冲的处理还要进一步研究，听觉理论还不完整。

响度

一般人的听力在低频和高频都较差。例如40 phon的声音在1000 Hz要求声压级 $40 dB(0 dB= 20µPa)$ , 在100 Hz就要求52 dB, 在20 Hz就要求91 dB了，听起来是一样的响。在低频率，听力降低的情况各人出入不大。但在高频率10kHz以上，各人之间出入就很大了。平常定高频听力的极限为20kHz完全是人为选定的，青年和少年可能达到，年纪大的人高频的听力要低，随着年龄增长，下降更多，大致10 kHz以下的听力不大改变，但如果在噪声下长期暴露， 10 kHz以下，特别是 2~3 kHz的听力也要变弱。是长期在强噪声中工作的工人，他的听力在2 kHz上面降低至50dB, 且耳蜗上相应位置毛细胞完全破坏（达全部的30%)。这种耳聋是不可能恢复的，毛细胞不能再生。

响度的定义是，以 40phon 响度级的响度 N 为 1宋(sone),听者判断为其2倍响的是2sone, 为其10倍响的是10 sone。由大批听力正常的青年人由不同的响度级起做2倍响、10倍响的试验，得到的结果很有规律，因而得到响度与响度级的关系，在半对数坐标纸上是一直线。用数学表达式响度：

$N = 2^{L_{N}-40}$

音调音高

听觉有掩蔽现象：一个声音由于另一声音的存在而提高听阈，但二音的频率差大到一定程度，这种影响就小了。互相掩蔽的最大频率差值称为临界频带宽度。

听阈：能产生听觉的最高限度和最低限度的刺激强度。耳的适宜刺激是空气振动的疏密波，但振动的频率必须在一定的范围内，并且达到一定强度，才能被耳蜗所感受，引起听觉。通常人耳能感受的振动频率在16-20000Hz之间，而且对于其中每一种频率，都有一个刚好能引起听觉的最小振动强度，称为听阈。人耳对不同频率的可听阈是不同的，例如对1KHz纯音的可听阈约为 $2 \times 10^{-5}Pa$ 。当振动强度在听阈以上继续增加时，听觉的感受也相应增强，但当振动强度增加到某一限度时，它引起的将不单是听觉，同时还会引起鼓膜的疼痛感觉，这个限度称为最大可听阈。人耳最敏感的频率在1000~3000Hz之间；而日常语言的频率较此略低，语音的强度则在听阈和最大可听阈之间的中等强度处。

参考资料

现代声学理论基础 - 马大猷