- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
学而优教有方
PAGE2/NUMPAGES2
第5节体验语音合成与人脸识别技术
一、教材分析
本节课主要通过让学生动手操作米体验语音合成与人脸识别技术。具体来说,一是使用科大讯飞的产品播放文本和生成个人声库,二是利用百度人工智能服务平台体验人脸识别功能。在其中恰当地穿插技术原理的讲解。
二、学情分析
经过上一节课的学习,学生已经知道人工技能技术可以实现“看懂”和“听懂”,对本节课的内容理解起来难度不大,主要是要结合实际操作懂得技术原理。
三、教学目标
1.知识与技能:
理解语音合成技术和人脸识别技术的原理:能利用程序生成个人声库。
2.过程与方法:
安装讯飞有声应用,体验文本转语音技术;学习语音合成技术的过程;利用讯飞留声公众号合成个人声库;让一位学生示范美颜应用的使用,体验人脸识别技术,带着活跃的课堂氛围学习常用人脸识别技术的知识;利用百度人工智能服务平台,体验人脸识别。
3.情感态度与价值观:
激发学生对人工智能技术及应用的喜爱和兴趣,鼓励学生接触新技术、利用新技术,培养创新意识。
四、教学重难点
语音合成技术和人脸识别技术的原理。
五、教学方法
任务驱动法、讲授法、展示法。
六、教学过程
【导入新课】
师:上节课我们了解了各种类型的人工智能技术,我想考考同学们,让人工智能实现“看懂”和“听懂”的分别是什么技术?
生:回答问题。
师:没错,是分别是机器视觉和语音识别技术。还有同学记得我们讨论的这两种技术分别有什么应用吗?
生:回答问题。
师:总结学生的回答。
这节课,我们来更加深入地亲身体验这两种技术。
【设计意图】回顾上节课的知识,进入课堂状态。
【新课讲授】
一、体验并探究语音合成技术
1.体验文本转换为语音的技术师:首先请同学们下载安装“讯飞有声”应用。
生:安装应用。
师:请同学们按照操作步骤,在文本框中输入需要播放的文字内容,文字内容可以直接录入,也可以从网站或文档中复制并粘贴进来。试着选择不同主播的声音进行播放。
生:动手操作。
师:请大家思考这几个问题:
(1)更换主播后,声音播放的具体内容是否发生了变化?
(2)更换主播操作究竟改变了什么?
(3)从文字的录入到语音播出,你认为经历了哪些过程?
师:带着这几个问题,让我们进入下一个环节。
2.了解语音合成技术的主要过程师:将文字信息转换为流利的可听懂的口语输出技术,称为语音合成。这是一项综合技术,不仅需要计算机理解信息含义,保证信息正常输出,还需要利用声学相关知识,使内容可以转换成恰当的声学模型进行语音输出。
(1)理解文本信息的含义
在语言学家和计算机科学家的共同努力下,将文本中的语法规则转化成相应的程序输入计算机中,系统根据相应算法,为文本进行断句,准确获取文本需要表达的内容,这是文本分析的过程。
(2)韵律处理
在理解文本的内容后,通常需要考虑在读取这段文本时使用的节奏、时长、频率等,从而使计算机的发音更接近于人类说话的声音。
(3)创建声学模型模拟发音
这个过程类似我们模仿他人声音,需要考虑语种、音色、响度、音调等。计算机模拟的方法是在原始的语音库中提取相关的声音信息,采用单元合成与拼接技术将信息进行拼接,从而达到模拟发声的效果。
3.模拟自己的声音
(1)明确任务
师:了解了语音合成技术的原理,同学们想不想让程序模拟你自己的声音呢?接下来我们利用“讯飞留声”程序复刻自己的声音,然后让机器模仿自己的声音,进行一段双语朗诵。
(2)解决问题要点分析
计算机完成对人类声音的模仿,有以下两个关键内容:
第一,形成个人的声音库,为计算机提供声学模型。通过形成个人的音库,将具有个人特色的声学信息(音色、音调、响度等)存储在其中,使计算机能够提取出相关数据。
第二,通过和个人音库匹配,完成合成。
通过语音合成技术,在识别文本内容的前提下,通过与个人音库中的信息自匹配,从而使计算机可以模仿我们的声音进行输出。
(3)模拟声音的步骤
第一步,关注微信公众号“讯飞留声”,选择“复刻声音”,进入程序。单击“去复刻我的声音”按钮,开始进入工作状态。
第二步,根据要求,朗读10段文字,按“话筒键”开始,“停止键”结束。注意录制时声音要清晰,内容要准确。在朗读文字过程中,采用的是语音识别技术,对我们读取的语音进行识别,并和提供的文字进行对比。录制声音完成后,系统会自动制作并生成个人音库。
第三步,在“讯飞留声”的“声音应用一玩转好声音”应用中,选择“我是歪果仁”选项卡,选定任意一条文本,选择个人音库进行双语朗诵,听取合成声音,也可以将声音分享到微信群中。
(4)效果评价
将生成的声音分享到微信群,同学们互相倾听、评价,填写下表。(见课件)
生:按步骤操作,讨论,填写表格。
【设计意图】使学生在动手实操的过程中感受语音合成技术的乐趣,发掘其中的奥秘,与学习理解技术原理知识内
文档评论(0)