第四章音频媒体的压缩编码.pptVIP

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章音频媒体的压缩编码

音频媒体的压缩编码标准与技术;本章内容;话音技术的研究热点;4.1 音频信号;音频信号;音频信号;4.1.1 音频信号的数字化;音频信号的数字化; 采样频率越高,采样精度越大,则数字化声音效果越好,但是需要的存储量就越大。因此在实际应用中,需要折中考虑声音质量和存储量的问题。;声音硬件:;4.1.2 音频信号压缩编码的可行性与分类;音频信号压缩技术; ;根据压缩编码思想的不同,把音频编码技术分为三类: (1)波形编码(Waveform Coding) (2)源编码(Source Coding),参数编码 (3)混合编码(Hybrid Coding) 波形编码: 没有利用语音信号自身的特点。波形编译码的想法是,不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。一般来说,这种编译码器的复杂程度比较低,数据速率在16 kb/s以上,质量相当高。低于这个数据速率时,音质急剧下降。如: 1.CD质量音频数据量:2x44100x16 b/s 2.电话质量音频数据量:8Kx8 b/s PCM (DPCM 56Kb/s;ADPCM 32Kb/s).;源编码(参数编码): 参数化,利用语音信号的特点进行数据压缩。音源编译码的想法是企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 例如:信道声码器的工作原理: 将语音信号基于语音分析原理分解成一系列频率分量,将这些分量在信道中传输。 接收方基于收到的数据进行语音重建:将收到的数据中的频率分量作为语音的基频,产生一系列脉冲作为浊音,用噪声发生器的输出作为清音。 此方法可以将语音的传输速率降低至2.4Kb/s,甚至更低 。;混合编码: 混合编译码器使用音源编译码技术和波形编译码技术,数据率和音质介于它们之间。使用的激励信号波形尽可能接近于原始话音信号的波形。例如CELP。 下图表示了目前这三种编译码器的话音质量和数据率的关系。 ;4.1.3 声音类别与数据率;声音类别与数据率;声音类别与数据率;4.1.4 声音质量的度量;声音质量的度量;4.2音频信息压缩编码技术标准体系;1.电话质量的音频压缩编码技术标准 信号频率规定在300Hz~3.4kHz,采用标准的脉冲??码调制(PCM),当采样频率为8kHz,进行8bit量化时,所得数据速率为64kb/s,即一个数字电话。 PCM标准G.711 ,1972年CCITT为电话质量和语音压缩制定,其速率为64Kb/s,使用非线性量化技术,主要用于公共电话网中。 ADPCM是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术,CCITT为此制定了G.721推荐标准,这个标准叫做32 kb/s ADPCM。在此基础上还制定了G.721的扩充推荐标准G.723,使用该标准的编码器的数据率可降低到40 kb/s和24 kb/s。 G.721 的输入信号是G.711 PCM代码,它的数据率为64 kb/s。而G.721 ADPCM的输出是用4位表示的差分信号,它的采样率仍然是8 kHz,它的数据率为32 kb/s,这样就获得了2∶1的数据压缩。 ;2.调幅广播质量的音频压缩编码技术标准 频率在50Hz一7kHz范围。 G.722标准是采用16kHz采样,14bit量化,信号数据速率为224kbit/s, 224kbit/s可以被压缩成64kbit/s. 采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流,224kbit/s可以被压缩成64kbit/s,最后进行数据插入(最高插入速率达16kbit/s),因此利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号)。;3.高保真度立体声音频压缩编码技术标准 高保真立体声音频信号频率范围是50Hz~20kHz,采用44.1kHz采样频率,16bit量化进行数字化转换,其数据速率每声道达705kbit/s。 采样频率为48kHz,44.1kHz,32kHz MPEG音频压缩技术的数据速率为每声道32~448kbit/s,适合于CD-DA光盘应用。 目前国际上比较成熟的高保真立体声音频压缩标准为MPEG音频。 MPEG-1和MPEG-2的声音数据压缩编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码(perceptual audio coding)。;4.2.1 G.7XX系列音频信号压缩编码标准;G.723: G.723是一种以24Kbps运行的基于 AD

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档