汉语TTS中的韵律建模与合成方法研究-电路与系统专业论文.docxVIP

下载本文档

7
0
约3.61万字
约 52页
2019-04-12 发布于上海
举报
版权申诉

汉语TTS中的韵律建模与合成方法研究-电路与系统专业论文.docx

1、本文档共52页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

山东大学硕士学位论文摘山东大学硕士学位论文摘要随着计算机技术的进步和其他相关学科的发展，在过去的几十年间，语音合成技术有了迅猛的发展，涌现出了大量的新理论和新技术。在现阶段，语音合成技术主要是以文语转换系统(Text—To—Speech，TTS) 为研究重点。这是一种将输入的文本转换为语音输出的技术。TTS系统一般由文本分析、韵律控制、语音合成和基元库四个模块组成。这西个模块并不是相互孤立的，每一个模块的性能都对最终输出语音豹质量有很大的影响。对合成系统输出语音音质的评价是多方面的，但主要集中在输出语音的清晰度，可懂度和自然度这三个方面。当前，TTS系统的输出语音在清晰度和可懂度方面已经达到了比较高的水平，而在语音的整体自然度方面还有待提高。本文主要研究了韵律控制和语音合成这两个模块，希望通过对这两个模块的研究与改进来提高合成语音的自然度。韵律控制模块对合成语音的自然度有报大的影响，对这部分的研究包括多个方面，这里选择韵律建模作为研究重点。韵律模型可以将一些定性的高层韵律信息转换为定量的声学参数，以便提供给后面的语音合成模块使用。本文运用人工神经网络技术设计并实现了一个用于预测汉语音节基频曲线、时长和停顿的模型。实验表明，这个模型在一定程度上能够较好的反映汉语陈述句中音节的基频曲线、时长和停顿的变化情况。语音合成模块负责最终语音的输出，现在普遍采用波形拼接技术。在选择最优的合成基元序列的同时，此模块也需要对其中一些语音波形做适当的修正，以使合成语音听上去更加流畅自然。本文在研究了最优基元选择算法的同时，也研究了一种基于傅立叶变换的语音频谱平滑算法。此算法能够较好的进行语音频谱平滑并且在一定程度上避免了传统算法使合成语音质量有较大下降的问题。为综合验证算法的性能，本文构建了一个简易的TTS系统，在其中采雳了上面介绍的算法。听音测试表明，此系统的合成语音自然度山东大学硕士学位论文J．L— 山东大学硕士学位论文 J．L—一坟局。关键字：语音合成；人工神经网络；韵律建模；频谱修正 Ⅱ 山东大学硕士学位论文ABSTRACT 山东大学硕士学位论文 ABSTRACT During the past few decades。with the development of computer and other related subjects，the speech synthesis technique progressed a lot。Nowadays， speech synthesis technique focuses on Text-To—Speech(-丌S)．1TS is a technique that can conved the input text into speech output．Generally speaking，a TTS system consists of four modules，including Text Analysis， Prosody Control，Speech Synthesis and Unit Database．However,the four modules are not independent．The quality of output speech is impacted greatly by every single module． The estimation to output speech relates to many aspects，but mainly to definition， understandability and naturalness．The definition and understandability of existing盯S systems are satisfactory now,but the overall naturalness still need to be improved．In this thesis，we research Prosody Control and Speech Synthesis these two modules to improve the output speech naturalness。 The Prosody Control module greatly impacts the naturalness of the output speech．There are many research subjects in Prosody Control，but we focus on prosody modeling。Prosody model