- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第8章语音技术杨缨
目录页项目-语音识别语音合成技术简介项目-语音合成语音识别技术简介
过渡页项目-语音识别语音合成技术简介项目-语音合成语音识别技术简介
语音识别的基本概念语音识别,也被称为自动语音识别AutomaticSpeechRecognition(ASR),是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,也就是让机器听懂人类的语音,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
语音识别的应用场景语音输入:输入更快捷,沟通交流更顺畅语音有哪些信誉好的足球投注网站:解放双手让有哪些信誉好的足球投注网站更加高效语音指令:无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作社交聊天:社交聊天时让输入更加便捷;或在收到语音消息不适合播放时可以转为文字进行查看游戏娱乐:让用户在操作的同时也可直观看到聊天内容
过渡页语音识别技术简介语音合成技术简介项目-语音合成项目-语音识别
实现目标及解决方案实现目标:编写程序,将录制的语音识别成文字,并在终端输出。
解决方案输入语音文件名读取转换后的语音文件连接百度AI语音技术服务,调用百度AI短语音识别接口解析百度AI短语音识别接口返回结果将语音文件转换为百度AI语音接口推荐的语音格式(pcm类型、单声道、16000hz采样率)百度AI开放平台输出识别文字
实施前的准备环节在百度智能云创建“语音识别”应用录制一段单声道、8000hz采样率、16位深的wav格式的语音,时长在60秒以内
任务1-最简单的语音识别任务目标对单声道、8000hz采样率,16位深wav格式的语音进行识别,输出识别结果完成任务在PyCharm中新建工程新建存放语音的文件夹并复制语音文件安装百度AI的PythonSDK建立并编写任务1程序pipinstallbaidu-aip==2.2.18.0
task8-1-1.py
任务2-格式转换的语音识别任务目标改进任务1程序,识别不同格式的语音文件,提高程序的通用性和适应性完成任务下载并安装Ffmpeg配置环境变量录制一段语音并测试格式转换,文件类型是m4a建立任务2程序,复制任务1程序全部代码修改任务2程序
task8-1-2.py
过渡页语音识别技术简介项目-语音识别项目-语音合成语音合成技术简介
语音合成的基本概念语音合成,又称文语转换(TexttoSpeech)技术,是通过机械的、电子的方法产生人造语音的技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。
语音合成的应用场景阅读听书:阅读类APP能够为用户提供多种音库的朗读功能,释放用户的双手和双眼资讯播报:让手机、音箱等设备化身专业主播,随时随地为用户播报新闻资讯订单播报:应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成进行订单播报智能硬件:集成到儿童故事机、智能机器人等设备,使用户与设备的交互更自然、更亲切
过渡页语音识别技术简介项目-语音识别语音合成技术简介项目-语音合成
实现目标及解决方案实现目标:编写程序,根据用户设置的语音合成选项如语速、音调、音量和发音人,将输入的文字合成语音并播放
解决方案连接百度AI语音技术服务调用百度AI语音合成接口将百度AI返回的数据保存成语音文件播放语音百度AI开放平台输入要合成语音的文字、选择语音合成选项(语速、音调、音量和发音人)
实施前的准备环节在百度智能云创建“语音合成”应用
任务1-最简单的语音合成任务目标将程序中指定的文字合成语音,并保存成语音文件完成任务在PyCharm中新建工程建立存放语音文件的文件夹安装百度AI的PythonSDK建立并编写任务1程序pipinstallbaidu-aip==2.2.18.0
task8-2-1.py
任务2-个性化的语音合成任务目标在运行时由用户输入要合成语音的文本选择语音合成参数如发音人、语速、音调和音量语音合成后自动打开媒体播放器程序播放语音完成任务建立任务2程序,复制任务1程序全部代码修改任务2程序
task8-2-2.py
本章小结本章讲解了语音识别与语音合成技术的概念和应用领域,通过实践项目讲解了借助百度AI开放平台开发语音识别及语音合成应用程序的方法,通过本章内容的学习,读者应理解语音识别和语音合成的基本概念,掌握这两种语音技术的应用方法
谢谢聆听
文档评论(0)