智能科学技术导论-乐昌-第11讲 智能接口.docx

智能科学技术导论-乐昌-第11讲 智能接口.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
智能科学技术导论-乐昌-第11讲 智能接口

第11讲智能接口导语提高传统信息处理系统智能化程度的一个简捷方法就是开展智能接口的研究,其目的就是要使得人机之间的互动交流更加自然、方便与友好,提高机器系统的灵活性,更好地为人类社会服务。这一讲,我们就是围绕着智能接口话题,专门介绍智能科学技术在人机交互方面的应用技术,并着重介绍既具有代表性,有具有前沿性的人机会话、情感计算以及脑机接口三个方面的内容。第11.1节人机会话人机会话技术有着悠久的历史,是智能化人机接口最具代表性的智能化技术,其目标就是要通过语音识别与生成方法与技术,来实现人机之间直接采用自然语言进行对话,并应用于智能机器人、聊天机以及各种智能系统的人机接口中。我们实验室开发的智能会话机器人演示要实现上述自然化的人机对话,除了涉及到有关机器人行为控制(第09讲)、语言理解(第06讲)与情思表达(第08讲)的相关课程内容外,还必须要解决机器的语音识别、对话管理以及语音生成三个环节的功能实现问题,本小节我们分别就其中的主要内容介绍如下。首先是语音识别。所谓语音识别就是要将语音信号转变为机器内部处理的文本符号。简单地讲,这一过程分为三个方面的内容,即特征提取、模式匹配以及模型训练,如图所示。语音特征提取模式匹配符号模型训练模型库应该说,针对特定人或小规模词汇量的语音识别技术基本上成熟,但对于非特定人或者大规模词汇量的语音识别问题还是一个需要解决的科学难题。目前针对非特定人的语音识别方法大致包括:(1)隐码尔柯夫模型(HMM)方法,也是语音识别的主流方法;(2)基于知识(利用构词、句法、语义、会话背景等方面的知识)的语音识别方法,并与大规模语料统计模型相结合;(3)神经网络、遗传算法、免疫算法、蚁群算法等自然计算方法。根据语音识别的目标不同,可以将语音识别任务大体可分为3类:(1)孤立词识别(isolated word recognition),(2)关键词识别(keyword spotting),以及(3)连续语音识别。根据针对发音对象的不同,还可以把语音识别分为(4)特定人语音识别和(5)非特定人语音识别。不管是什么具体的语音识别任务,大致上语音识别主要需要解决的问题包括:(1)话语要素的分割问题:将连续的话语分解为词、音素等基本单位单位;(2)确定语音模式区分标准:不同的说话人有不同的语音模式,即使同一个说话人,在不同的场合、不同的状态以及不同的时期,也会有不同的语音模式,这就为语音识别模式的分类带来了困难;(3)模糊性问题:说话的含混现象、语言中普遍存在的同义词现象等,使得语音识别成为一个依赖于上下文与会话背景的复杂研究课题;(4)词语发音的动态性:单个字母或词、字的语音特性会受到上下文影响而变化,包括读音、重音、音调、音量和发音速度等方面的改变;(5)环境噪音干扰:人类具有鸡尾酒效应,可以在噪杂环境下排除干扰,但这一问题对于机器而言却没有有效的解决方法。比如单单同音字现象,就是一个十分棘手的问题。我们知道,汉语有五万多汉字,却共用仅仅两千多个音节,因此同音字现象非常普遍。甚至会出现赵元任指出的《施氏食狮史》这种极端情况而使语音的机器识别研究陷于困境之中:石室诗士施氏嗜狮,誓食十狮,氏时时适市视狮。十时,氏适市,适十狮适市。是时,氏视是十狮。恃十石矢势,使是十狮逝世,氏拾是十狮尸适石室。石室湿,使侍试拭石室。石室拭。氏始试食是十狮尸。食时,始识是十狮尸实石十狮尸。是时,氏始识是实事实。试释是事。赵元任的《熙戏犀》:西溪犀,喜嬉戏。嵇熙夕夕携犀徙,嵇熙细细习洗犀。犀吸溪,戏袭熙。嵇熙嘻嘻希息戏。惜犀嘶嘶喜袭熙。杨富森的《于瑜与余欲渔遇雨》:于瑜欲渔,遇余于寓。语余:“余欲渔于渝淤,与余渔渝欤?”余语于瑜:“余欲鬻玉,俞禹欲玉,余欲遇俞于俞寓。”余与于瑜遇俞禹于俞寓,逾俞隅,欲鬻玉于俞,遇雨,雨逾俞宇。余语于瑜:“余欲渔于渝淤,遇雨俞寓,雨逾俞宇,欲渔欤?鬻玉欤?”于瑜与余御雨于俞寓,俞鬻玉于余禹,雨愈,余与于瑜踽踽逾俞宇,渔于渝淤。《饥鸡集矶记》:唧唧鸡,鸡唧唧。几鸡挤挤集矶脊。机极疾,鸡饥极,鸡冀己技击及鲫。机既济蓟畿,鸡计疾机激几鲫。机疾极,鲫极悸,急急挤集矶级际。继即鲫迹极寂寂,继即几鸡既饥,即唧唧。从应用的角度看,根据语音识别应用设施的不同,语音识别则可以分为PC语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。考虑到不同应用设施提供的采集信道会使人们的发音特性产生变形,因此在具体的应用系统开发中,还需要针对性地解决各种技术问题。我国开展语音识别技术研发的主要单位有中科院声学所、自动化所、清华大学、北方交通大学、哈尔滨工业大学、中国科技大学、四川大学、厦门大学等,开发了不少语音识别系统并应用到具体的智能手机、智能玩具以及其他应用系统中(如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行

文档评论(0)

zyongwxiaj8 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档