- 1、本文档共53页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 信源编码技术.ppt
共50页 第六章 信源编码技术 语音与图像压缩编码 信源编码技术 信源编码:将模拟信源信号转换为二进制数字信号,在接收端再将收到的数字信号还原为模拟信号的方法 这是由模拟网?数字网至关重要的一步 类别 语音编解码 图像编解码 目前在移动通信系统中,语音信号还是主要业务,在今后多媒体移动系统中,图像业务比重越来越大。 语音编码 概念: 把模拟语音信号变成数字语音信号,以便在信道中传输 意义 提高通话质量(数字化+纠错码) 提高频谱利用率(低码率编码) 提高系统容量(低码率+话音激活技术) 移动通信对语音编码要求 码率低、语音质量高 抗噪声和抗干扰能力强 编译码延时小,总延时在65ms以内 编译码复杂度低,便于大规模集成化 功耗小,便于应用于手持台 语音编码分类 语音编码方法 波形编码: 将时间域信号直接变换成数字代码,目的是尽可能精确再现原始语音波形。基本原理是在时间轴上对模拟语音按一定速率抽样,然后将幅度样本分层量化,并用代码表示。 参量编码: 又称声源编码,是将信源信号在频域或其它正交变换域提取特征参量,并转换成数字代码进行传输。基本原理是以发音机制的模型为基础,用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型,从模拟语音信号中提取这些特征参量并量化编码 混合编码: 将波形编码和参量编码结合起来 几种语音编码优缺点 波形编码 优点:对于比特速率较高的编码信号(16~64kbit s/s),波形编码技术能够提供相当好的话音质量 缺点:对低速语音编码(低于16kbits/s),波形编码的语音质量显著下降,所以不适合频谱资源紧张的移动通信系统 参量编码 优点:可实现低速语音编码,速率可达2~4.8k bits/s 缺点:语音质量只能达到中等 混合编码 吸收了上述两种编码的优点,是优选方向 语音编码与压缩技术 要实现低速、高质量的语音编码,必须采用压缩技术; 语音评价 客观评定方法: 用客观测量的手段来评价语音编码的质量,常用信噪比、加权信噪比、平均分段信噪比等方法;特点有 建立在度量均方误差基础上; 计算简单; 对于低速语音编码,不能完全反映人对语音质量的感觉 主观评定方法: 主观评定等级或平均评定得分(MOS)--由数十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分。要求 试听者人数足够多; 语音材料足够丰富; 试听环境尽量相同 主观评定等级 试听者对语音质量的感觉往往是和注意力集中程度相联系的,因此对于主观评定等级,还有一个收听注意力等级。 MOS分与语音质量 MOS分在4.0~4.5分为高质量语音编码,达到长途电话网的质量要求 MOS分为3.5分左右称作通信质量,听者能感觉到语音质量有所下降,但不影响正常通话,可以满足多数通信系统使用要求 MOS分为3分以下常称为合成语音质量,只有足够高的可懂度,但自然度较差,不容易识别讲话者 语音编码现状 语音质量与比特速率 语音波形编码 模拟语音信号?数字语音信号:时间和幅度离散化,即抽样与量化 抽样定理:采样率大于或等于信号带宽的2倍,离散信号可以无失真恢复成原始模拟信号 幅度量化:用有限个幅值表示样值幅度,从而离散化信号幅度的过程 量化阶距:相邻两量化值之差 均匀量化:量化阶距为常量--小信号的“信号与量化噪声比”小,因此对小信号不利 非均匀量化:量化阶距可变--压缩量化,即在均匀量化前,对大信号进行压缩,对小信号进行放大 压缩量化 压缩量化: 对输入信号的对数进行量化,以使量化信噪比与量化电平无关 ?律压缩: A律压缩: 压缩量化特性 A与?的物理意义:最大量化阶距与最小量化阶距之比 PCM调制 PCM(脉冲编码调制): 直接将样值编码为信号,特点为 64kbit/s:量化成128个正负各半的量值,用7位二进制数表示,再加上一位符号共8比特;采样率8kHz 采用A律或?律压缩 参量编码原理 原理: 模型化人类语音产生机制,提取模型参数,并且只传送模型参数--低码率编码,导致合成的语音波形失去了自然度和音质 语音信号的产生模型 语音的产生:声带与声道 不同语音产生原因:声音激励源和声道不同 声音分类:清音和浊音 浊音:声带振动 基音周期 波形:三角形周期脉冲波,含丰富谐音 清音:声带不振动,类似白噪声 发声过程:口腔和鼻腔形成时变滤波器 清音和浊音 语音产生模型 语音模型的建立:1、产生激励;2、响应 模型参数:基音、共振峰频率及强度、清浊音判决 特征提取参数 基于语音信号的短时准平稳特性-10~20ms 提取技术 自相关函数法 平均幅度差函数法 线性预测 短时波形分析 短时处理技术 加窗技术:方窗和哈明窗 基音周期估计: 基于短时自相关函数 基于短时平均幅度差函数 线性预测编码(LPC) 线性预测:一个语音采样的现在值可以用
文档评论(0)