- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[信息与通信]2-2音频处理技术
音频处理技术 昆明理工大学计算中心 内容提要 声音的本质 声音心理学 模拟声音与数字声音 音频信号的数字化 音频处理 音乐合成与MIDI 音频信息的处理 由于人们在接收外界信息以及与他人进行交流的过程中,大约有20%是通过听觉实现的,所以音频(声音)是多媒体计算机技术中一种不可缺少的媒体。也正是由于多媒体计算机具有处理音频媒体的能力,才使得计算机走出无声的世界,像人性化迈进了一步。 音频信号的处理技术是多媒体计算机(MPC)技术的重要组成部分。同时由音频信号处理技术得来的语言、音乐播放功能也是MPC诸功能中最重要的功能之一。 音频信息的处理 在计算机应用系统中加入声音可以极大地加强计算机处理信息的效果。早期的计算机以处理数值和文字信息为主,简单的声音应用也只是加入一些用扬声器报警的振铃声或者是控制音响设备。在实际应用中存在着种类繁多的声音,且需要对它们进行数值化处理。 人类获取信息的方法主要有“听”和“看”两种。看是通过眼睛读或是观察文字、图形和图像等,听则要用耳朵来接受语音、音乐及其他声音。因而在多媒体系统中加入声音功能是必不可少的,我们希望一个计算机系统既能发音又能记录各种声音,当然还要能对声音进行编辑制作。 声音心理学 1.声音的量纲 声音的振动是一种正弦波,声音的变化必须确定三件事:频率(变化的速度)、幅度(产生的压力)、相位(何时开始)。 另外一方面,人们可以感觉到声音的强弱,可以感觉到歌唱家音调的高低。因此,声音的量纲分为声音的物理量纲和心理量纲。 物理量纲可以用精确的值来描述,但对某一具体声音得来的心理印象却不容易说明白,因为心理印象要由被测者的经验而定。 声音的心理属性和物理属性不可等同,首先,这些关系不是线性的;其次这些关系不是孤立的;第三这些关系不是不变的。 声音的量纲 声音心理学 2.听觉特性 等响曲线 由于响度与频率和强度有关,所以在不同频率上的强度是不同的。先设一个音为标准音,给予固定的频率、强度和持续时间,例如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称之为等响曲线。等响曲线描述的是响度与频率和强度的关系。从声音心理学考虑,对同一响度的声音在频率上和强度上可以有很大的差别,这对声音表现有重要意义。 声音心理学 掩蔽(masking) 声音的响度不仅取决于自身的强度和频率,而且也依赖于同时出现的其它声音。各种声音可以互相掩蔽,也就是说一种声音的出现可能使得另一种声音难于听清。由于声音的掩蔽效果,可以欺骗人的听觉。例如,本来是多种频率的声音的复合,但听众以为是另一种声音。所以,声音的掩蔽特性常常用于声音的压缩。 声音心理学 临界频带 在频率的某一临界区里,各种声音是相互作用的,合成声音的响度由这些频率共同决定。如果超出临界区,声音的响度不再相互作用,声音的响度随频率的改变而改变。这个临界区就是临界频带,其宽度视其中心频率而定。对于临界频带的确定,使得对声音响度的处理能够有的放矢。 声音心理学 相位 从声音的波形来看,声音的起点和方向也要反映声音的特性,这就是声音的相位。当两个声音相同相位完全相反时,它们将相互抵消;当两个声音相同而且相位也相同时,声音就会得到加强。 相位的确定对于多声道声音系统的设计非常重要,其可以应用在回声的消除、会议系统的声音设计上。 声音心理学 自然声音的时变现象 声音的音调分成三个区域:起始区、稳定状态区、延迟区。 研究表明,音调的频谱分量随时间改变。在稳定状态区,频谱保持固定。在起始区,振幅频谱随时间变化。因此自然声音的起始部分是非常难识别的。例如刚听了一小节音调后要识别乐器,专家也会觉得较难。时变现象用于数字系统中,说明声音中的某些错误是不太容易发现的,但如果出现停顿就很容易引起人的注意。 声音心理学 听觉空间 人耳可听到来自各个方向的声音,并用不同的因素来判定声源的位置。声源的位置不论对于增进人们的感受还是增进对声音的理解,都是非常重要的。通过声音的精确再现,就可以构造出听觉空间。 方位的线索是各种声音到达两耳的精确时间和强度。 声音心理学 听觉的频谱特性 声音是时间函数,通过傅里叶变换可做出其频谱图。人耳对频谱成分的波峰和波谷是非常敏感的。在语言中,元音很少有频谱变速变化的区域。基频改变,人耳是很敏感的。例如:快进的录像,音调会发生变化。 音色非常复杂,目前尚在研究中。音色的处理将使我们能识别音源,音色也代表和声音有关的主观质量。 声音心
文档评论(0)