多媒体技术及应用第5章.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术及应用第5章

第5章 数字音频处理 本章内容 5.1音频基本概念 5.2音频文件格式 5.3语音识别和语音合成 5.4MIDI介绍 5.5录音机的使用 5.6Cool Edit的使用 5.7Cakewalk Sonar的使用 5.1.1 声音的发生和传播 声音是一种机械波,是由物体振动产生的。 正在发声的物体称为声源。 声音的传播需要介质,气体、固体、液体都能传播声音。 声音是以声波的形式通过介质将声源的振动向外传播. 声音在空气中的传播就是由物体振动引起周围空气的振动,振动的空气又引起耳膜振动,再通过耳蜗传到听觉神经上,于是人就感觉到声音了。 5.1.2 声音的特性 声音特性的三个要素是音调、音强和音色。 音调是指声音的高低,由声波的频率决定,频率大,音调就高,频率小,音调就低。 频率的单位是赫兹(HZ),就是物体每秒钟振动的次数。 人耳的听觉范围是20HZ-20000HZ。 频率低于20HZ的声波称为次声波,频率高于20000HZ的声波称为超声波。 5.1.2 声音的特性 音强又称为响度或音量,是指声音的大小,由声波的振幅决定。 音强可以用“声强(I)”来量度,声强的单位是“瓦/米2”,是指1秒内垂直穿过单位面积的声能。 日常生活中,音强通常是以分贝(dB)为单位,分贝是声源功率与基准声功率比值的对数再乘以10。 5.1.2 声音的特性 音色又称为音质,是指声音的特色,由声波的形状决定。 不同的乐器演奏同一个乐音,音调和音强都一样,人们能够分辨出不同乐器的原因就是它们的音色不同。 5.1.3 声音的质量 评价声音的质量有客观质量度量方法和主观质量度量方法两种。 客观质量度量方法是根据声音的技术指标,例如频率范围和信噪比等进行评价。 主观质量度量方法是人为对声音质量进行评分。 根据声音的频率范围,可以把声音的质量分为4级,由高到低分别是数字激光唱盘CD-DA质量,其频率范围为10Hz~20kHz;调频广播FM(Frequency Modulation)质量,其频率范围为20Hz~15kHz;调幅广播AM(Amplitude Modulation)质量,其频率范围为50Hz~7kHz;电话的话音质量,其频率范围为200Hz~3400Hz。 5.1.4 声音信号的数字化 声音信号是模拟信号,计算机只能处理数字信号,要用计算机对声音进行处理,必须将模拟声音信号转换为数字声音信号。 声音信号的数字化过程一般分为采样、量化和编码三个步骤。 第一步:采样 采样是将时间上和幅度上都连续的模拟信号,转换成时间上离散但幅度上仍然连续的信号的过程。 每秒钟采样的次数称为采样频率,目前常用的采样频率有11.05KHz、22.05KHz和44.1KHz,其中22.05 KHz可以达到FM广播的音质,44.1KHz则可以达到CD的音质。 5.1.4 声音信号的数字化 根据奈奎斯特理论(Nyquist theory),只要采样频率不低于模拟信号最高频率的两倍,就能把用数字表达的信号还原成成原来的信号,称为无损数字化过程。 例如电话话音的频率约为300Hz~3.4KHz,那么只要采样频率大于6.8KHz,采样后的信号就可以不失真地还原,所以电话话音的采样频率通常取为8KHz。 5.1.4 声音信号的数字化 第二步:量化 量化处理是把幅度上连续取值的模拟量转换为离散量,量化后的样本用二进制数表示。 每个样本使用的二进制数位数的多少称为量化精度。一般常用的量化精度有8位、12位和16位。 越高的量化精度当然声音质量越好,但同时也意味着越大的数据量。 第三步:编码 编码有非压缩与压缩两种方式。通常.wav文件采用的线性PCM编码(脉冲编码调制)的是一种非压缩方式的编码,而.mp3文件采用的MPEG Layer3编码则是一种压缩方式的编码。 5.2 音频文件格式 存储声音信息的文件格式主要有:WAV文件、MP3文件、WMA文件、MIDI文件等。 5.2 音频文件格式 1. WAV文件 WAV文件的扩展名为.wav,是Microsoft公司开发的一种声音文件格式。 WAV格式的声音文件质量很高,但是WAV格式存放的一般是未经压缩处理的音频数据,所以文件尺寸往往很大 WAV文件数据量(Byte)=采样频率(Hz)×量化位数(位)×声道数/8×持续时间(秒)。 例如采用44.1kHz、16位、立体声,持续时间为1分钟,WAV文件的大小为44100×16×2×60/8 =10.584MB 5.2 音频文件格式 2. MP3文件 MP3文件的扩展名为.mp3,这种诞生于德国的声音文件格式风靡世界。 MP3是一种采用国际标准MPEG中的第三层音频压缩模式(MPEG-1 Audio Layer 3)对声音信号进行有损压缩的格式。 MP3文件

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档