3 言语处理入门.PDFVIP

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3 言语处理入门

3  言语处理入门  3.1  言语信号声学参数  3.1.1  言语信号及特征  语音是语言的物质外壳。语音信号是物理声学信号。语音信号具有如下特点:语音 信号是时间依赖的连续媒体。因此处理的时序性要求很高,如果在时间上有 25 ms 的延 迟,就会感到不连续。语音是人际交互的手段,因此语音起到了表事、表义、表情的作 用。故对语音信号的处理,不仅是信号处理问题,还要抽取语义等其他信息。语音交互 涉及言语链的全过程。语音处理应包括:语音信号特征表示、言语识别与理解、言语合 成、语音编码、说话人识别等。  语音的波形展示出时域信号的形状。波形的变化会反映在时域特征、频域特征和感 知的差异上。实验表明,人类对语音的感知与语音信号的频谱特性关系密切。人类的听 觉对语音的频谱特性更为敏感,如共振峰频率和带宽等。  波形图是语音幅度随时间变化的二维图。由于语音产生方式不同,在波形图上有不 同的形状。如图3.1 所示是汉语音节 zhi1 语音波形起始的一部分,以此图为例来说明语 音波形图中的几种主要形状。    图3.1  不同语音段的波形示意图  从波形图上的差异可以区分以下几类发音。  无音段或幅度较小的随机噪声段:特点是波形幅度明显小于发音段,波形无规则, 3.1 1   如图 中竖直线所分开的第 段。 辅音:包括塞音(爆破音)、塞擦音和擦音等,擦音的特点是波形幅度略大于无音 段,波形无规则,一般处于具有周期性波形的元音之前,如图 3.1 中竖直线所分开的第 3 段所示。爆破音:特点是时长很短,仅有一两个脉冲,幅度大于无音段,一般处于辅音 3.1 2   前端,如图 中竖直线所分开的第 段所示。 元音:特点是波形幅度明显大于无音段,波形具有周期性,如图 3.1 中竖直线所分 4   开的第 段所示。 要想根据波形分辨是什么音素或音节,是很困难的。但可以通过语音信号抽取其特 592 现代汉语音典 征以区分不同的音素或音节,如提取基频、样值幅度或能量、时长、语谱,以及这些特 4 征的变化和模式。具体算法请参见“基础与资源”第 节言语特征分析。本节将介绍相 关的概念。  3.1.2  时长  时长(duration,音长)是指音段(音素、音节等)在发音时的持续时间。通常时长 使用时间的单位来表示,如毫秒、秒等,它表示了声学单元的绝对长度。如果是数字语 音,有时也用抽样点的个数来表示。这时音长的持续时间等于抽样周期(抽样频率的倒 数)乘以抽样点的个数。涉及时长问题的研究包括语速、音段时长、韵律特征分析等。  语音音段可小可大,如音素、声母、韵母、音节、词语等。通常音段越大,时长越 长,这表示了音段的绝对长度。但音段相同,时长不一定相同。可以计算音段的平均长 度,如计算音节的平均时长,以比较说话速度的快慢。或计算相同声母的平均时长,以 分析发音方法对声母时长的影响,或区分不同的声母。  在语音分析中,应更关心在音段相同的情况下,音段的相对时长及其时长变化,如 轻声音节、普通音节、重读音节的时长差异;音段在不同韵律结构的位置,时长的变化; 语言的熟练程度导致辅音时长的差异等。  在普通话和多数汉语方言中,绝大多数情况下,时长对于区别字词的意义作用不大, 但对韵律、语气、感情的表达有影响。而英语中元音的长短有区别意义的作用,例如 ship i sheep i   (船,短)和 (羊,长)。 1.声母时长  声母的持续时间较短,而且不同声母的时长也不同。数据表明:送气音时长比不送 气音长,塞擦音比塞音长,送气的塞擦音最长,不送气的塞音最短。本书统计了所附语 料录音的声母时长,单音节中的声母时长分布如表 3.1 的第二列所示。声母在词语中的 3.1

文档评论(0)

170****0571 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档