- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于微软speech SDK的中英混合文本朗读器
摘要
Microsoft speech SDK 是微软提供的软件开发包,其中包含了语音识别和合成引擎相关组件、帮助文档和例程,它是—个语音识别和合成的二次开发平台。我们可以利用这个平台,在自己开发的软件里嵌入语音识别和合成功能,从而使用户可以用声音来代替鼠标和键盘完成部分操作,实现真正的“人机对话”。
本文先从本课题研究的背景开始介绍,紧接着讲解了speech SDK和文语转换(TTS)的一些基本概念,然后重点介绍了如何设计中英混合文本朗读器,以及功能的实现。最后对此次文本朗读器的设计进行了总结。
关键词:speech DSK,文语转换(TTS),中英混合文本朗读器
Abstract
Microsoft speech SDK is software development kit provided by Microsoft, which includes speech recognition and synthesis engine related components, to help document and routines, it is a speech recognition and synthesis of secondary development platform. We can use this platform to develop their own software in embedded speech recognition and synthesis, so that users can use voice to replace the mouse and keyboard to complete part of the operation, to achieve real man-machine dialogue.
This paper begins with background to the study of this subject , followed by some basic concepts to explain the speech SDK, text to speech (TTS), and then focuses on how to design a Chinese and English mixed text to speech, as well as functions to achieve. Finally, summarize the design of the text to speech.
Key words: speech SDK, text to speech(TTS),Chinese and English mixed text to speech
目录
第1章 绪论 4
1.1 研究背景 4
1.2 章节安排 5
第2章 基本概念介绍 6
2.1 Speech SDK简介 6
2.1.1 语音识别引擎接口 6
2.1.2 语音合成引擎接口 7
2.2 Speech SDK 5.1的工作原理 7
2.3 文语转换(TTS)简介 9
第3章 中英混合文本朗读器的实现 11
3.1 软件设计 11
3.1.1 需求分析 11
3.1.2 系统功能描述 11
3.2 软件设计流程 11
3.2.1 设计流程图 11
3.2.2 语言开发平台配置 12
3.2.3 导入对象到.NET中 13
3.2.4 SAPI SDK的导入 14
3.2.4 SpVoice类 15
3.3 功能实现 16
3.3.1 添加控件 16
3.3.2 智能朗读功能的实现 16
3.3.3 代码的编写 18
第4章 中英混合文本朗读器的功能介绍 20
4.1 朗读器整体界面介绍 20
4.2 按键功能演示 21
第5章 总结 24
致谢 25
参考文献 26
附件 27
第1章 绪论
1.1 研究背景
文语转换是复杂的语音处理技术,是涉及语音学、语言学、数字信号处理和计算机科学等领域的多学科综合性技术。文语转换技术把可视的文本信息转换为可闻的声音信息,其应用范围非常之广,如文本的有声校对,残疾人的辅助发音,报纸的机器阅读,机器翻译等等。因此,文语转换技术,作为一项理论性和实用性都很强的技术,倍受重视,在近十几年内得到了迅速发展,目前已接近达到了实用化的水平,并在市场上获得成功。
TTS技术和理论在不停地发展,其核心是如何提高合成语音的清晰度和自然度,以及文本处理的智能特性。另一方面, TTS技术的应用也在不断深化,从计算机终端应用,如编辑文本的校对,发展到通信网环境。
众所周知,通信网是不同媒体信息存储、交换、传输的载体和工具
您可能关注的文档
- MT电厂电气一次初步毕业设计-.doc
- 毕业论文(论文)LC带通滤波器的设计与仿真设计.doc
- 智能救援小车毕业论文(设计)完整版.doc
- 基于JAVA的数码商品网上商城的毕业设计与实现.doc
- 基于Java的图书管理信息系统的设计与实现毕业论文.doc
- 基于c#房屋租赁管理系统的设计和实现毕业设计(论文).doc
- 基于JSP技术的银行管理系统的毕业设计与实现.doc
- 基于MATLAB的三相整流电路仿真研究.doc
- 单片机最小系统设计与制作报告毕业设计(论文).doc
- 基于matlab的数字滤波的毕业设计与仿真论文.doc
- 甘肃省白银市会宁县第一中学2025届高三3月份第一次模拟考试化学试卷含解析.doc
- 2025届吉林市第一中学高考考前模拟生物试题含解析.doc
- 四川省三台县芦溪中学2025届高三下第一次测试生物试题含解析.doc
- 2025届江苏省启东市吕四中学高三适应性调研考试历史试题含解析.doc
- 浙江省宁波市十校2025届高三二诊模拟考试历史试卷含解析.doc
- 甘肃省甘南2025届高考生物必刷试卷含解析.doc
- 河北省石家庄市一中、唐山一中等“五个一”名校2025届高考历史四模试卷含解析.doc
- 江西省南昌市进贤一中2025届高考生物考前最后一卷预测卷含解析.doc
- 甘肃省白银市会宁县第四中学2025届高三第二次模拟考试历史试卷含解析.doc
- 宁夏银川市宁夏大学附属中学2025届高考化学押题试卷含解析.doc
文档评论(0)