- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
构筑技术创新平台推动语音技术突破——中文语音合成技术研究进展及成果展示.pdf
构筑技术创新平台,推动语音技术突破
——中文语音合成技术研究进展及成果展示
单位名称:安徽中科大讯飞信息科技有限公司
联系方式:055I--5331800
网址:http://www.iflytck.COITI
一. 综述
计算机能够像人一样的说话,和人类自由地进行交谈,这一直是各种科幻片中的情节。而
中文信息领域的语音合成技术研究,则正是要努力把这一科幻变为现实。语音合成,又称
to
文语转换(Text
Speech)技术,它涉及声学、语言学、数字信号处理、计算机科学等多
个学科技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。通过语音台成
可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样
开口说话”。
过去的语音合成技术仅是研究人员在实验室所开展的一项甚音核心技术研究,技术水平仅
能实现机械地逐个音节的合成,与生动活泼、感情丰富多彩的人类语言相比相差甚远;但
随着近年来多样本合成、听感量化技术、基于超大规模语料库的波形拼接技术以及基于统
计建模和高性能声码器技术的参数化语音合成技术的研制成功,语音合成技术取得了飞速
的进步.必威体育精装版的语音合成系统在一般的信息播报方面,其合成效果已经超过了一般说话人
的水平,完全达到实用门槛。同时随着研究的深入,语音合成技术基本实现了模拟任何发
音人、实现高兴、悲伤等多种情感甚至歌唱的功能,效果都基本达到了实用水平。目前语
音合成技术的研究方向主要集中在如何进一步提高合成系统的表现力方面。
基于技术上的突破,语音合成技术已经走出实验室,并以大规模台成服务器、桌面软件以
及嵌入式软核、芯片等多种形式走进人{『』的日常工作生洒中的方方面面,广+泛应用于信息
查询服务(电话银行、号码百事通等).智能手机、掌上学习机、车载导航、智能手机阻及
语言辅助教学软件等,形成了巨大的经济效益和社会效益,形成了一批以科大讯飞公司为
代表的专注于智能语音技术研究、开发和推广的高新技术公司,实现了产、学、研的良性
循环。
二. 语音合成技术发展史
语音合成技术的研究已有二百多年的历史,但是真正有实用意义的近代语音技术是随着计
算机技术和数字信号处理技术的发展而发展起来的,士要是让计算机能够产生高清晰度、
高自然度的连续语音。
国内的汉语语音合成研究起步较晚些,但从八十年代初就基本上与国际上研究同步发展。
.8一
大致也经历了共振峰合成、LPC合成至应用PSOLA技术的过程。在国家863计划、国家自
然科学基金委、国家攻关计划、中国科学院有关项目等支持下,汉语语音合成系统研究近
年来取得了令人举目的进展,这些系统基本上都是采用基于方法的时域波形拼接技术,其
合成汉语普通话的可懂度、清晰度达到了很高的水平。然而同国外其它语种的语音合成系
统一样,这些系统合成的句子及篇章语音机器味较浓,其自然度还不能达到用户可广泛接
受的程度,从而制约了这项技术的大规模进入市场。
1998年中国科技大学在国家863计划和国家自然科学基金委支持下,研制成功KD.863
汉语语音合成系统。和采用国内外流行的PSOLA技术的系统相比,在输出语音的音质
和自然度上有了突破性的提高。KD.863采用了一种全新的基于语音数据库的语音台成
方法,该系统一经推出,就因其合成语音的高清晰度与高自然度引起了社会各方面的
重视。先后应用于深圳华为技术公司设计的“114自动电话报号系统”,和为国家工商
总局设计的“工商企业语音(传真)查询系统’’。使得汉语语音合成技术走出实验室,向
市场应用迈出了重要的一步。KD.863系统参加了在1998年4月国家科委组织的全国汉
语语音合成系统的性能评测,其输出语音的自然度居同类系统之首,是唯一达到用户可
以接受程度的系统。KD-863还在日本、新加坡、香港的有关研究所和大学进行过演示,
均得到了有关方面专家的认同。之后,中国科技大学不仅在语音合成技术方面有进一步
的发展,特别是在文本预处理中围绕层次化结构思想,运用大量的统计和规则的方法,
较好地解决了三个大的处理环节:特殊符号处理、分词处理和拼接处理,使得汉语语音
合成系统的整体性能有很大提高。
在最近几年,基于大规模语料库的语音合成方法逐渐成为主流的合成技术。在这个方法
中,合成语句的语音
文档评论(0)