人机交互基础教程第4章.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
三维交互技术 直接操作 三维光标必须有深度感,即必须考虑光标与观察者距离,离观察者近的时候较大,离观察者远的时候较小。 为保持三维用户界面的空间感,光标在遇到物体时不能进入到或穿过物体内部。 为了增加额外的深度线索,辅助三维对象的选择,可以采用半透明三维光标。 三维光标可以是人手的三维模型 三维交互技术 三维Widgets 三维交互界面中的一些小工具 三维空间中漂浮的菜单、用于拾取物体的手的三维图标、平移和旋转指示器等。 1992年美国Brown大学计算机系提出三维Widget设计原则 三维Widget的几何形状应能表示其用途(eg:一个用来扭曲物体的Widget,最好本身就是一个扭曲的物体) 适当选择Widget控制的自由度-由于三维空间有六个自由度,有时会使三维交互操作变得过于复杂,因此在用户使用某种Widget时,可以固定或者自动计算某些自由度的值 根据三维用户界面的用途确定Widget的功能。例如,用于艺术和娱乐的三维用户界面的Widget,只要能够完成使画面看起来像的操作就可以了,而用于工业设计和制造的用户界面,则必须保证交互操作参数的精确性。 三维交互技术 三视图输入 用二维输入设备在一定程度上实现三维的输入。 如果输入一个三维点,只要在两个视图上把点的对应位置指定后便唯一确定了三维空间中的一个点; 把直线段上两端点在三视图上输入后便可决定三维空间的一条直线; 把一个面上的各顶点在三视图上输入后,也唯一确定了三维空间中的一个面; 如果把一个多面体上的各面均用上述方法输入, 也就在三维空间中输入了一个多面体。 语音识别(Speech Recognition)是计算机通过识别和理解过程把语音信号转变为相应的文本文件或命令的技术,其所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。 一个完整的语音识别系统大致可分为语音特征提取,声学模型与模式匹配,以及语言模型与语义理解三部分。 语音特征提取 从语音信号中提取语音的特征,既可以获得语音的本质特征, 也起到数据压缩的作用。 输入的模拟语音信号首先要进行预处理,包括预滤波、采样和量化、加窗、端点检测、预加重等。 声学模型 声学模型对应于语音到音节概率的计算。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。 目前采用的最广泛的建模技术是隐马尔科夫模型HMM建模和上下文相关建模。 笔式输入具有连续性、使用笔的连续线条绘制可以产生字符、手势或者图形等特点。其优点是便于携带,输入带宽信息量大,输入延迟小;其缺点是翻译困难,再现精度低。 手写识别技术是笔交互中的一种基本技术,目前已经嵌入到各种设备中,得到广泛应用。 脱机识别:机器对已经写好或印刷好的静态语言文本图像的识别。 联机识别:用笔在输入板上写,用户一边写,机器一边识别,可以实时人机交互。 联机手写文字的识别过程中,系统通过记录文字图像抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理。 脱机手写识别比印刷体汉字识别、联机手写体识别都要困难。 脱机手写识别得到的描述则是点阵图像,要得到笔段的点阵通常需要细化运算。 细化会损失一些信息,并且不可能得到时间顺序信息。 脱机识别中,笔画与笔画之间经常粘连,很难拆分,而且笔段经过与另一笔段交叉分成两段后,也难以分清是否应该连起来。 结构识别 统计识别 神经网络方法 结构识别 结构识别方法的出发点是汉字的组成结构。汉字是由笔划(点、横、竖、撇、捺等)、偏旁、部首构成,通过把复杂的汉字模式分解为简单的子模式直至基本模式元素,对子模式的判定以及基于符号运算的匹配算法,实现对复杂模式的识别。 结构识别法的优点是区分相似字的能力强,缺点是抗干扰能力差。 统计识别 统计识别方法是将汉字看为一个整体,其所有的特征是从整体上经过大量的统计而得到的,然后按照一定准则所确定的决策函数进行分类判决。 统计识别的特点是抗干扰性强,缺点是细分能力较弱。 神经网络 神经网络具有学习能力和快速并行实现的特点,因此可以通过神经网络分类器的推广能力准则和特征提取器的有效特征提取准则,对手写字符进行识别。 识别率是手写汉字识别研究中最重要的环节,影响识别率的因素也是手写识别技术研究中的难点。 笔顺问题 书写习惯影响笔划的书写顺序,单纯通过串匹配进行识别难以达到理想效果。对汉字进行描述时,仅仅采用一维串也就显得不够,必须利用一些二维方法来描述,但其会极大地增加匹配的难度。 连笔问题 对于结构识别而言,连笔一方面使笔划种类大大增加,甚至达到难以归纳的程度;另一方面,连笔又使得笔段抽取难度大增,连笔会增加一些冗余笔段,连笔造成的畸变又会使笔段方向严重离散。 相似字区分 汉字种类繁多,很多汉字彼此

文档评论(0)

369221 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档