- 1、本文档共169页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第4章数字声音编码本章内容音频信号压缩的可能性G.7XX声音压缩编码技术各标准的编码方法;编/解码器等MPEG-X声音压缩编码各标准的编码方法;编/解码器等4.1音频信号压缩的可能性人耳可以听到的声音是频率在20Hz~20kHz之间的声波,称为可听声。音频信息就是指这一类声音,可听声有三类。(1)语音:由口腔发出的声波,频率大致在200Hz~3.4kHz之间,主要用于信息解释说明、叙述、答问,也可以作为命令参数输入语言。(2)音乐声:是由各种乐器产生的,音频范围都可以存在,本身可供欣赏,也可作为烘托气氛,是音频信息的重要组成部分之一。(3)效果声:大自然物理现象产生的,如刮风、下雨、打雷等,还有一些人工产生的,如爆破声、拟音等,对语音和音乐起补充作用。音频信号压缩的可能性对于高质量和长时间的音频数据,由于数据量都特别大,为了有效地存储和传输,需要进行压缩编码。衡量语音编码性能的主要因素有:编码质量;编码速率;算法复杂度。压缩的可能性存在于:1)时域冗余。2)频域冗余。3)听觉冗余。1).时域冗余(1)两种主要的时域冗余:语音信号幅度分布的非均匀性和样本之间的相关性。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信号出现的概率小?非均匀量化技术,例如ADPCM编码算法;样本之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编码质量,例如线性预测算法就是利用这一原理。1).时域冗余(2)周期之间的相关性虽然音频信号分布在20Hz~20kHz的频带范围内,但在一定的瞬间,某一声音往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,在周期与周期之间,存在着一定的相关性。利用音频信号周期之间信息冗余度的编码器,比只利用邻近样值间的相关性的编码器效果要好,但编码器要复杂得多。1).时域冗余1).时域冗余2)频域冗余3).听觉冗余利用了人耳的听觉特性
人耳对语音信号的听觉特性表现在3个方面:一是人耳对语音信号的分辨率有限;二是人耳对语音信号某些失真不是很敏感;三是人耳的掩蔽效应。低速率高品质语音编码算法的实现就是基于人耳的这些听觉特性,既可以保证人耳感觉不到语音质量的下降,又降低了语音编码速率。2.音频信号压缩编码的分类4.2主流音频编解码标准4)音频编码技术发展的历史语音编码标准发展历史音频编码标准发展历史4.3话音编译码方法与原理波形编译码器(waveformcodecs)音源编译码器(sourcecodecs)混合编译码器(hybridcodecs)。一般来说,波形编译码器的话音质量高,但数据率也很高;音源编译码器的数据率很低,产生的合成话音的音质有待提高;混合编译码器使用音源编译码技术和波形编译码技术,数据率和音质介于它们之间。感知编码感知编码利用心理声学分析原理来实现音频压缩。例如MPEGAudioLayer3采用的算法ASPEC(AdaptiveSpectralPerceptualEntropyCodingofhighqualitymusicalsignal,高质量音乐信号自适应谱感知熵编码),将原始音频信息数据压缩率达到10:1甚至12:1。当然这是一种有损压缩,但是人耳却基本不能分辨出失真来。波形编解码器基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。优点是适应能力强、话音质量好、抗噪抗误码的能力强等特点,缺点是同其他的编解码器相比,要使用大量的带宽,当波形编解码器用于低带宽时,话音质量下降得非常快。
脉冲编码调制(PCM)、自适应增量调制(ADM或ΔM编码)、自适应差分编码(ADPCM)、自适应预测编码(APC)、自适应子带编码(ASBC)、自适应变换编码(ATC)等都属于波形编码。脉冲编码调制(PCM)脉冲编码调制(PCM)的概念PCM是pulsecodemodulation的缩写概念上最简单、理论上最完善、最早研制成功、使用最为广泛、数据量最大的编码系统脉冲编码调
您可能关注的文档
- 腰椎间盘突出症小讲课.pptx
- 胃痛中医课件.pptx
- 职业卫生管理制度(包括防尘、防毒管理).docx
- 老年心理状况评定表(含评分).docx
- 综合应急预案演练方案.docx
- 继电保护完整版本.ppt
- 统编版三下语文教材解读及教学建议.pptx
- 细胞增殖-一轮复习-课件.ppt
- 纺织专业英文术语.docx
- 纯电动汽车高压电气架构简介.pptx
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)