网站大量收购闲置独家精品文档,联系QQ:2885784924

+2.3《让机器能听会说》课件++2024—2025学年甘教版(2022)初中信息技术八年级下册.pptxVIP

+2.3《让机器能听会说》课件++2024—2025学年甘教版(2022)初中信息技术八年级下册.pptx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2.3让机器能听会说

;了解智能语音技术的定义

理解智能语音技术的基本原理

了解智能语音技术的发展及应用

探讨智能语音技术的应用案例;如何让机器具备听说能力?

智能语音技术是让机器具备人的听说能力的人工智能技术,包括语音识别及语音合成技术。;其中,语音识别技术模仿人的听觉能力,能够将人的语音转换为文字;语音合成技术模仿人的说话能力,能够将文本内容转换成语音,也可以让计算机模仿其他人的语音。;机器的听说过程是通过语音识别技术和语音合成技术来实现的。就像人通过学习获得听说能力一样,计算机也可以通过机器学习获得听说能力。;1.语音识别技术

语音识别(AutomaticSpeechRecognition,ASR),是一种让机器从语音中获取语言内容的技术,目的是将语音信息转变成人类可以理解的文字内容,使机器具备听觉器官,其原理如图2-3-1所示。;根据识别内容的范围,语音识别被分为“封闭域识别”和“开放域识别”。封闭域识别通常需要预先设定好需要识别的语音指令,机器只能识别这些特定的语音指令;开放域识别则不需要预先指定识别词的范围。;目前主流的语音识别是将日常生活语音转化成文本,属于开放域语音识别,看起来应用场景非常广,但如果不与人工智能结合,其应用场景还不如封闭域语音识别广。

封闭域语音识别应用场景:

1、语音做题app(或小程序)

2、远程授课语音做题

;例如,用语音做数学题,除了要有结果还要有步骤,用开放域语音识别来做,基本是不可能的,但如果用只含有数学语言的封闭域(简称数学域,其他类推)语音识别来做,就会很流畅。在远程授课过程中,教师和学生都可以通过语音做题,内容即时显示在屏幕上,这不仅极大的还原了真实课堂的授课体验,而且还有真实课堂无法比拟的优势。

;语音识别是机器学习中常见的一个应用,分两个阶段。第一个是“训练”阶段,第二个是“识别”阶段,如图2-3-2所示。;在训练阶段,需要准备语音和对应的文字。计算机首先对输入的语音进行预处理(去除噪声和不相干的声音),然后从语音信号中提取声学??征,最后再利用机器学习方法建立语音与对应的文字之间的对应关系,也就是识别模型。在识别阶段,计算机对待识别的语音进行相同的预处理和特征提取过程,然后将提取的特征与模型库中的模型进行匹配,进而识别出相应的结果。;语音和其他声音一样,也具有物理上的音高、音强、音长和音质四种要素。

音高:声音的高低,取决于发音体振动的快慢(对应于频率的高低)。音高取决于声带的形状。

音强:表示语音的强弱,主要与声带振动幅度的大小有关(对应于振幅大小)。音强取决于发音时用力的大小。

音长:语音的长短,对应于声波持续的时间。

音质:又称为“音色”,指的是语音的特色,是人的语音区别于其他声音的根本特点,音色与声道有关。;2.语音合成技术

语音合成又叫文语转换(TexttoSpeech,TTS),是一种把文字转变成语音的技术(如图2-3-3所示),使机器能够像人一样开口说话。;语音合成技术也包括“训练”阶段和“合成”阶段。如图2-3-4所示,在训练阶段,需要准备文本及其对应的语音。;首先利用“文本分析”提取出文本中每个字发音单元的发音符号,以及发音符号对应的上下文信息,同时从语音中提取出声学特征参数。然后采用机器学习算法,训练获得发音符号与声学参数的对应关系,也就是声学模型。在合成阶段,对输入的任意文本,首先经过文本分析获得文字的发音符号及其上下文信息,然后匹配声学模型产生语音参数,进而利用语音生成算法通过语音参数合成语音。;目前,常用的语音合成方法主要有三种:发音器官语音合成、共振峰语音合成、拼接语音合成。

发音器官语音合成让计算机模仿人的发音器官来产生语音。

共振峰语音合成用电路的形式模拟人的发声过程。

拼接语音合成将发音单元(如音素、声韵母、音节等)拼接在一起产生语音。;早在18世纪,奥地利发明家沃尔夫冈·冯·肯佩伦(Wolfgangvonkempelen)在他生命的最后20年里一直试图模拟人类的声音,他做了一个满是洞的空盒子。空盒子与一个形状奇特的鼓风机相连。当鼓风机被按下时,它会使内置的簧片振动。这个过程模拟了人类的声音,它确实发出了声音,这也是最早的语音合成机器之一。

以此为开端,AI智能语音技术在长达一个世纪的时间里,不断飞跃提升,并最终成为了我们现在听到的样子。;近年来,随着技术的不断进步,智能语音技术的应用场景越来越广泛。例如,通过智能语音技术,可以自动评测讲话人的发音水平。智能客服利用语音识别技术获取客户的需求,并

您可能关注的文档

文档评论(0)

课件制作、方案代写能手 + 关注
实名认证
服务提供商

教师资格证持证人

专业写作,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务

领域认证该用户于2022年12月31日上传了教师资格证

1亿VIP精品文档

相关文档