计算机视觉的手势识别研究.docxVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

??

?

??

计算机视觉的手势识别研究

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

摘要:随着信息化的高速发展,人们进入了人工智能的时代,智能设备的不断涌现,使人机交互的方式发生了深层次的改变。在此背景下,本文研究了一种基于视觉的手势识别技术,改变了传统情况下,相对单一的遥控器控制无人机飞行的方式。以实现操控无人机的目的,改善用户体验方式,推动人工智能时代的发展。

关键词:人工智能;人机交互;手势识别;无人机

1研究意义

在当前科技研发飞速推进的背景下,人工智能领域也取得了长足的进步。各种智能终端设备的出现,使人机交互方式发生重大的变化。逐步以人为中心的人机交互方式,大大减少了用户在语言文化、地区差异等因素影响下使用先进科学技术产生的障碍,而手势识别,作为大家常用的传递信息的手段,应用在计算机上可以给人一种直观的感觉,使人们更容易、更轻松地与计算机进行交流[1-2]。

作为新一轮科技革命和世界工业革命的热点,无人机将得到越来越广泛的应用,目前,在航拍,农业灌溉,高速运输,灾情检测,电力检测,影视拍摄等应用领域大大扩展了无人机本身的使用范围,其未来的应用前景将更加广阔。

2国内外研究现状

作为人机交互的重要构成,手势识别在人工智能实现的过程中扮演着重要的角色,对手势识别研发的深度和广度决定这人机交互的灵活性以及自然性。现阶段的研究中,相关学者的关注点在于如何识别不同的手势,在这一过程中,手势的背景通常需要采取简化处理,进而利用算法来实现对手势的分割,最终采用既定的手势识别方法分析出相应手势具有的意义。

目前国内对手势识别的研究主要集中在大学和研究机构。四川大学吕华富采用了卷积神经网络的方法实现对手势的识别,他们以ThomasMoeslund手势识别数据集为基础,以24种静态手势为研究对象进行识别工作,准确率高达98%以上。中科院钟习、陈益强、于汉超等构建基于超限学习机算法的手势识别模型,并利用softmax函数运算出手势的可信度。江南大学王兵和浙江大学董洪伟等人通过Kinect实现对人体手部动作的采集,并以像素分类的方法实现手指个数的分析,进而识别出该手势表达的含义。

国外方面,韩国的李金石,李振恩等采用熵分析法分割人体手势,从复杂的背景提取特征,然后计算从手心到边缘的距离,但这种系统的识别率比较低。Yubaiz使用数据手套来收集手部信息,实现了对阿拉伯手语的高度识别。Yuchenglong等人使用基于视觉的特征信息来进行手势识别,结合手势的基本信息例如手掌大小、手势长度等,以此来提高识别率。

在无人机研究中,Mantecn等利用Kinect达到了人机交互的目的,以地面的Kinect传感器实现对无人机动作的识别。Pfeil等没有识别人的整个身体,而是通过识别手掌的动作,完成对无人机的控制。Naseer等把摄像头挂载在无人机上,但是,由于RGB-D传感器的距离有限,这种方法只能近距离使用。

3计算机视觉的手势识别概述

3.1Opencv简介

OpenCV是一个非常实用并且功能强大的开源计算机视觉库。拥有成套的图像处理算法,不仅简单而且高效,受广大开发者喜爱。它主要运用于图像检测、跟踪、分割、识别和3D重建等高级处理。在工业产品的质量检验,医学图像处理,安全性,交互操作,相机校准,双目视觉和机器人等各个领域中,都能找到对应的OpenCv库所包含从计算机视觉各个领域衍生出来函数。由于开放源代码简洁而有效,其中大多数函数都经过汇编进行了优化,因此,在使用的过程中,表现出更为强大的运算以及对图像的处理能力,加之其在Windows和Linux系统中都可稳定运行,因此本文的研究中,采用的运行环境为Windows+VS2012+OpenCv2.48+AndroidStudio。

3.2手势识别分类

手势识别是一种计算机科学和语言文化相结合的人机交互的方式。通常情况下手势识别包括静态手势动作和动态手势动作。静态手势是二位平面下的图形,而动态手势则是对应三维空间坐标下的一条运动轨迹,有时候还需要使用随着时间变换的四维特征空间来表示。

从目前来看,手势识别系统主要有两种,一种是基于数据手套的识别,利用传感器感知手部活动信息,通过串口传递控制指令。还有一种就是基于计算机视觉的手势识别,一般利用摄像头拍摄进行手势的识别。作为当前热门的手势识别系统,它们有各自的优缺点。

基于数据手套的手势识别系统,是通过检测手套的传感器数据和坐标位置信息的改变来识别相应的手势。它能够直接获得手在空间中三维信息和手指运动的信息,具备多种识别模式,效率非常高。缺点就是设备复杂,不易灵活运动。

而基于计算机视觉的手势识别目前在神经网络中更常用。因为神经网络可以使用静态和动态输入,所以它们非常适合以快速,交互的方

文档评论(0)

木槿流年 + 关注
实名认证
文档贡献者

悟已往之不谏,知来者之可追

1亿VIP精品文档

相关文档