- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3 言语处理入门
3 言语处理入门
3.1 言语信号声学参数
3.1.1 言语信号及特征
语音是语言的物质外壳。语音信号是物理声学信号。语音信号具有如下特点:语音
信号是时间依赖的连续媒体。因此处理的时序性要求很高,如果在时间上有 25 ms 的延
迟,就会感到不连续。语音是人际交互的手段,因此语音起到了表事、表义、表情的作
用。故对语音信号的处理,不仅是信号处理问题,还要抽取语义等其他信息。语音交互
涉及言语链的全过程。语音处理应包括:语音信号特征表示、言语识别与理解、言语合
成、语音编码、说话人识别等。
语音的波形展示出时域信号的形状。波形的变化会反映在时域特征、频域特征和感
知的差异上。实验表明,人类对语音的感知与语音信号的频谱特性关系密切。人类的听
觉对语音的频谱特性更为敏感,如共振峰频率和带宽等。
波形图是语音幅度随时间变化的二维图。由于语音产生方式不同,在波形图上有不
同的形状。如图3.1 所示是汉语音节 zhi1 语音波形起始的一部分,以此图为例来说明语
音波形图中的几种主要形状。
图3.1 不同语音段的波形示意图
从波形图上的差异可以区分以下几类发音。
无音段或幅度较小的随机噪声段:特点是波形幅度明显小于发音段,波形无规则,
3.1 1
如图 中竖直线所分开的第 段。
辅音:包括塞音(爆破音)、塞擦音和擦音等,擦音的特点是波形幅度略大于无音
段,波形无规则,一般处于具有周期性波形的元音之前,如图 3.1 中竖直线所分开的第 3
段所示。爆破音:特点是时长很短,仅有一两个脉冲,幅度大于无音段,一般处于辅音
3.1 2
前端,如图 中竖直线所分开的第 段所示。
元音:特点是波形幅度明显大于无音段,波形具有周期性,如图 3.1 中竖直线所分
4
开的第 段所示。
要想根据波形分辨是什么音素或音节,是很困难的。但可以通过语音信号抽取其特
592 现代汉语音典
征以区分不同的音素或音节,如提取基频、样值幅度或能量、时长、语谱,以及这些特
4
征的变化和模式。具体算法请参见“基础与资源”第 节言语特征分析。本节将介绍相
关的概念。
3.1.2 时长
时长(duration,音长)是指音段(音素、音节等)在发音时的持续时间。通常时长
使用时间的单位来表示,如毫秒、秒等,它表示了声学单元的绝对长度。如果是数字语
音,有时也用抽样点的个数来表示。这时音长的持续时间等于抽样周期(抽样频率的倒
数)乘以抽样点的个数。涉及时长问题的研究包括语速、音段时长、韵律特征分析等。
语音音段可小可大,如音素、声母、韵母、音节、词语等。通常音段越大,时长越
长,这表示了音段的绝对长度。但音段相同,时长不一定相同。可以计算音段的平均长
度,如计算音节的平均时长,以比较说话速度的快慢。或计算相同声母的平均时长,以
分析发音方法对声母时长的影响,或区分不同的声母。
在语音分析中,应更关心在音段相同的情况下,音段的相对时长及其时长变化,如
轻声音节、普通音节、重读音节的时长差异;音段在不同韵律结构的位置,时长的变化;
语言的熟练程度导致辅音时长的差异等。
在普通话和多数汉语方言中,绝大多数情况下,时长对于区别字词的意义作用不大,
但对韵律、语气、感情的表达有影响。而英语中元音的长短有区别意义的作用,例如 ship
i sheep i
(船,短)和 (羊,长)。
1.声母时长
声母的持续时间较短,而且不同声母的时长也不同。数据表明:送气音时长比不送
气音长,塞擦音比塞音长,送气的塞擦音最长,不送气的塞音最短。本书统计了所附语
料录音的声母时长,单音节中的声母时长分布如表 3.1 的第二列所示。声母在词语中的
3.1
文档评论(0)