- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
线性预测声码器;第9章 线性预测声码器;第9章 线性预测声码器
9.1 概述
线性预测声码器是一种参数编码方法。
参数编码利用生成模型,在幅度谱上逼近原语音,
但重建语音的波形与原语音信号的波形较大差别。
参数编码实现语音通信的设备通常称为声码器;
◆例:通道声码器、共振峰声码器、同态声码器、LPC声码器;
本章主要内容:语音压缩的原理与关键技术、
LPC声码器的基本原理、
LPC-10和LPC-10e标准、
混合激励LPC声码器。; 语音压缩的基本原理
压缩依据:语音信号的冗余度和人的听觉感知机理。
语音信号中存在多种冗余度,可在时域和/或频域中描述。
1. 时域冗余度
(1) 幅度非均匀分布。
◆语音中,小幅值样本出现的概率高。
(2) 语音信号样本间的相关性很强。
◆语音波形的最大相关性存在于邻近的样本之间。
◆8 kHz 取样时,相邻样本间的相关系数 0.85;
相距 10 个样本,相关系在 0.3 左右。
◆利用这种较强的一维相关性进行预测编码。; (3) 浊语音具有准周期性。
◆浊语音波形是对应于音调间隔周期的长期重复波形。
◆此音调间隔波形可用于预测编码。
(4) 声道的形状及其变化比较缓慢。
◆以较长的时间(如几十秒)进行统计,可得长时自相关函数;
◆长时自相关函数的统计表明,8 kHz 取样的相邻样本间,
平均相关系数高达沟通 0.9。
(5) 静止系数(语音间隙)。
◆统计表明,话音间隙使全双工话路的典型效率约为通话时间的40%(或静止系数为 0.6)。
◆话音间隙本身是一种冗余,可不传或少传静止段信息。 ; 2. 频域冗余度
(1) 非均匀的长时功率谱密度。
◆长时功率谱密度:长时段内功率谱的统计平均,如图9.1(a)。
◆长时功率谱密度呈现强烈的非平坦性。
◆统计观点:未充分利用给定频段,
或者说存在着固定的冗余度。
◆特点:功率谱的高频能量较低,
直流分量并非最大。
(2) 特有的短时功率谱密度。
◆图9.1(b):语音的短时功率谱密度。
◆存在共振峰频率和谷值。
◆前三个共振峰决定语音特征。
◆特??:形成高次谐波结构。; 3. 听觉感知机理
(1) 人类听觉系统具有掩蔽效应。
◆在不同声压、不同频率处,声音的掩蔽效应是不同的。
◆用掩蔽特性可抑制与信号共存的量化噪声,降低编码速率。
(2) 人耳对不同频段声音的敏感程度不同。
◆人的听觉对低频端比较敏感,而对高频端不太敏感。
即强的低频音能妨碍同时存在的高频音。
(3) 人耳对语音信号的相位变化不敏感。
合适的分析表明:语音压缩编码的极限速率为 80 ~ 100 bit/s。
◆此时,只能传送句子内容,
讲话者的音质、音调等重要信息已全部丢失。; 语音编码的关键技术
关键技术包括:LPC 分析、合成-分析法、感觉加权滤波器
1. LPC 分析
◆LPC 分析是常用技术,在语音识别、语音合成、语音编码和
说话人识别等领域获得成功的应用。
◆LPC 编码基于跟踪波形的产生过程,而不是波形本身,
它传送的是反映整个过程变化的参数。
◆LPC 基于全极点模型、时域方均误差最小准则估计模型参数。
◆应用这组模型参数能够有效地降低语音信号的编码速率。
语音信号存在短时相关性和长时相关性两种。
利用 LPC 对语音进行这两种相关性的去相关处理后,得到的是预测残差信号。 ;图9.2:含两种相关性的语音生成模型示意图。
◆短时相关性的传输函数为:
◆长时相关性(谱的精细结构)模型的传输函数为:
式中 T —— 基音周期。
b-q,b-q+1,…,br —— 长时预测系数,
个数在 1 (q = r = 0) 到 3 (q = r = 1) 之间;
◆通常,长时预测系数的更新周期约为 50 ~ 200 次/s。
◆长时滤波是估算短时残差信号中脉冲的周期、相位和增益,
◆ 再去除这些脉冲,得到了
长时滤波残差。
◆再编码,形成激励信号。; 2. 合成-分析法
在 LPC 算法中,对残差信号直接量化,且使其误差最小,
并不能使得原始语音信号和重建信号间的误差最小。
采用合成-分析法(AbS) 来求得残差信号的编码量化值,
才能使重建语音与原始语音的误差最小。
AbS是将综合器引入到编码器中,并与分析器结合,在编码器中生成和解码器端相同的重建合成语音。
◆根据误差原则,调整参数使合成语音与原始语音的误差最小。
◆例,在编码器中将激励信号输入 LPC 综合滤波器,其合成语音和原始语音相比,从而求
您可能关注的文档
- 心理学-第一章概论.ppt
- 内分泌系统常见症状与体征.ppt
- 热学气动压强温度.ppt
- 超滤治疗缩窄性心包炎剥脱术后顽固性心衰.ppt
- 病理学基础病理组织图谱.ppt
- 耳鼻咽喉头颈外科学鼻部疾病.ppt
- 六年级科学下我在成长.ppt
- 电大社会统计学第九章相关系数和简单回归.ppt
- 2024年江西省瑞安市六校联盟九年级数学第一学期开学调研试题【含答案】.doc
- 2024年江西省上饶县九年级数学第一学期开学学业质量监测模拟试题【含答案】.doc
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)