多媒体技术及应用基础第1章多媒体技术概述-西安交通大学多媒体.ppt

多媒体技术及应用基础第1章多媒体技术概述-西安交通大学多媒体.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术及应用基础第1章多媒体技术概述-西安交通大学多媒体.ppt

第2章 音频处理技术 西安交通大学计算机教学实验中心 简述 音频是多媒体技术中媒体的一种,由于音频信号是一种连续变化的模拟信号,而计算机只能处理和记录二进制的数字信号,因此,音频信号必须经过一定的变化和处理,变成二进制数据后才能送到计算机进行编辑和存储。 声音的基本特性 音频信号所携带的信息大体上可分为语音、音乐和音响三类。 语音是指具有语言内涵和人类约定的特殊媒体; 音乐是规范的符号化了的声音; 音响指其他自然声音,如动物的叫声、机器的轰鸣声、风雨雷电声等; 音频信号的特征 声音机械振动产生声波。 声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的,称为模拟音频信号。 在任一时刻,声波可以分解成一系列正弦波的线性叠加: 声音的物理特性 频率/声压/带宽 单位时间内声源振动的次数或空气中气压疏密变化的次数,称为声源的频率f,单位赫兹(Hz) 频带宽度或称之为带宽,它描述组成复合信号的频率范围 声压 声波在空气媒质中是以空气中的分子振动形成疏密而传播。它造成空气中的气压发生大小变化,相当于在无声波下空气中的气压上叠加一个变化的压强,叠加上的压强称为声压,记作P。单位有帕斯卡(Pa)和微巴(μbar)。 引起人耳刚能听到声音时的声压称为可听阈 引起人耳膜感到疼痛的声压称为痛阈 分贝(dB) 在声学中引用分贝来表示声压或声强的变化程度因为人的听觉神经的刺激程度不与刺激量大小成正比,而是按刺激量以10为底的对数增长 动态范围 声音的动态范围指声音的最大声压级和最小声压级之间的差值。 每种声源的动态范围依据各自的特性有所不同。 如女声的动态范围为25~50dB, 男声为30~50dB, 交响乐队的动态范围大于100dB。 动态范围不仅用来表示一个声源产生的最大声压级与最小声压级之间的差值,录音设备或记录声音的载体(磁带、光盘、硬盘)同样可用动态范围表示能够处理信号电平的范围。 如磁带的动态范围为50dB~60dB, CD光盘96dB, 磁光盘录放音机105dB。 频谱 乐器很少产生单一频率的纯音,而是复音。 复音的产生基于物体的复杂振动,可以分解为许多不同振幅和不同频率的简谐振动(即看成简谐振动的叠加)。 简谐振动的振幅按频率排列的图形称为频谱。频谱可一目了然地看出复杂振动的频率结构。 音频信号的质量指标 频带宽度 音频信号所包含的谐波分量越丰富,音色越好。在广播通信和数字音响系统中,以声音信号所包含的谐波分量的频率范围来衡量声音的质量,即带宽。 动态范围 动态范围越大,说明音频信号强度的相对变化范围越大,音响效果越好。 动态范围一般用dB为单位来计量。 AM广播的动态范围约40dB FM广播的动态范围约60dB CD—DA的动态范围约100dB, 数字电话约50dB。 声音的数字化 数字化就是将连续信号变成离散信号。 对音频信号,首先在时间上离散,取有限个时间点,称为采样。 然后在幅度上离散,取有限个幅度值,称为量化。 再将得到的数据表示成计算机容易识别的格式,称为编码。 PCM编码 PCM编码示意图 量化位数 均匀量化 量化时,如果采用相等的量化间隔对采样得到的信号作量化,那么这种量化称为均匀量化。均匀量化采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化. 非线性量化 非线性量化的思想是大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔, 这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时,采用相同的规则。 话音频率脉冲编码调制 1972’CCITT推荐的G.711标准:话音频率脉冲编码调制,采样频率为8kHz,使用μ律压扩编码或者使用A律压扩编码,经过PCM编码器之后每个样本需8位二进制存储,输出的数据率为64 kb/s。 这个数据编码的精度相当于13位或14位的数据均匀量化编码。 数字音频的技术指标 采样频率 采样频率是指一秒钟采样的次数。采样频率越高,单位时间内采集的样本数越多,得到波形越接近于原始波形,音质就越好。 根据奈奎斯特(Harry Nyquist)采样理论:如果采样频率高于输入信号最高频率的两倍,重放时就能从采样信号序列无失真地重构原始信号。例如,话音的信号频率约为3.4 kHz,若采样频率选为8kHz,就能无失真地重放原始声音。 常用采样频率 11.025kHz——AM广播 22.05kHz ——FM广播 44.1kHz ——CD高保真音质声音 现在声卡的采样频率一般为48kHz甚至96kHz。 采样精度 采样精度用每个声音样本的位数表示,也叫样本精度或量化位数。它反映度量声音波形幅度的精度。 例如,每个声音样本用16位表示,则量化样本值在0~65535的整数范围内,它的精度是输入信号的1/6553

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档