数字声音及MIDI简介剖析课件.pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

MMT第二讲数字声音及MIDI简介YANGZHOUDAXUE物理科学与技术学院

第1节声音声音是携带信息的极其重要的媒体(20%),是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们的各自的特性。我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本的音频信号编码技术。

声音的本质声音是通过空气传播的一种连续的波,叫声波。反射(reflection)、折射(refraction)和衍射(diffraction)声音信号是由许多频率不同的分量信号组成的复合信号。复合信号的频率范围称为带宽。

声音与听觉带宽为20Hz-20kHz的信号称为音频(audio)信号,可以被人的耳朵感知。话音信号带宽在80Hz~3400Hz。频率决定音调。响度(音量)表示的是声音能量的强弱程度,主要取决于声波振幅的大小。用声压(达因/平方厘米,牛顿/平方米)或声强(瓦特/平方厘米)来计量。声压的单位为帕(Pa)。人耳对lkHz、10-16W/cm的纯音刚能听到。声强级表示响2度的相对量,它定义为某响度与10-16W/cm10,单位为dB。2比值的对数值乘以正常人听觉的强度范围为0dB—120dB。

乐音n以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之一……处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为基音,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率,我们称之为泛音。n如果一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是乐音;如果泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为噪音,如汽车发动机、计算机风扇等发出的都是噪音。基音和混入基音的泛音决定音色。

声音的三要素n音调、音强、音色为声音的三要素。n音强(响度)取决于声音的幅度。n音调取决于声音的频率。n音色是由混入基音的泛音所决定的。声音的听觉特性n声音的方向性n人的耳朵对声音强度和频率的反应成对数形式n声音的掩蔽特性(时域掩蔽、频域掩蔽)

声音质量的度量n声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。声音类型电话语音带宽200Hz-3.4kHz50Hz-7kHz20Hz-15kHz10Hz-20kHz调幅广播(AM)调频广播(FM)CD

信噪比(SNR)度量主观平均判分法(MOS,MeanOpinionScore)指试听者要把语音编码器的输出按质量分为:优(5分)、良(4分)、中(3分)、差(2分)、劣(1分)或分类为:察觉不到(5分),稍稍察觉到但无不适感(4分),能察觉且有不适感(3分),有不适感但还能忍受(2分),很不适且无法忍受(1分)

第2节声音信号数字化n声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。n声音进入计算机的第一步就是数字化,数字化过程中最重要的步骤就是采样和量化。

n采样(sampling):将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。

n量化(quantization):将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。一般紧跟编码过程。电压范围量化步长量化结果编码逆量化结果5~73~522222222320110100010001111101011006421~31-1~1-3~-1-5~-3-7~-5-9~-700-1-2-3-4-2-4-6-8多媒体数据的量化一般通过除以量化步长量化为整数。逆量化就是乘以量化步长。

量化除了有使幅度离散的作用外,同时:(1)压缩字节(2)产生量化误差(量化误差:逆量化的结果和原始信号幅值之差,也称为量化噪声。)量化步长越长,压缩字节越多,但是误差越大。量化步长越短,压缩字节越少,但是误差越小。

n采样频率奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。sf=2fmax例如话音信号最高频率约为3.4kHz,所以采样频率取为8kHz。

n采样精度每个声音样本的数字化位数。反映声音波形幅度的采样精度。也直接决定数据率的大小。质量采样频率(kHz)样本精度(bit)单道声/数据率立体声(kb/s)电话888单道声单道声64AM11.02588.2FMCD22.05044.11616立体声立体声705.61411.2

第3节音频

您可能关注的文档

文档评论(0)

美鑫可研报告 + 关注
官方认证
服务提供商

我们是专业写作机构,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务。可行性研究报告,实施方案,商业计划书,社会稳定风险评估报告,社会稳定风险分析报告,成果鉴定,项目建议书,申请报告,技术报告,初步设计评估报告,可行性研究评估报告,资金申请报告,实施方案评估报告

认证主体成都慧辰星信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510104MA69XDD04C

1亿VIP精品文档

相关文档