- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Kinect-for-Windows-2.0入门介绍要点
初识Kinect 2010年,Kinect是微软推出的必威体育精装版的基于体感交互的人机交互设备。Kinect最初作为Xbox360游戏机的外接设备发布,利用即时动态追踪、影像识别、麦克风输入、语音识别等功能让玩家摆脱传统游戏手柄的束缚,通过自己的肢体动作来控制游戏。 2012年,微软并没有将这一先进的技术局限在游戏行业,而是紧接着将Kinect技术推广到Windows平台,开发了Kinect for Windows,旨在鼓励众多开发者设计基于Kinect体感交互技术的应用,从而在各个行业领域里改变人们工作、生活和娱乐的方式。 2014年,微软发布第二代Kinect for Windows,从硬件上对第一代做了很大改进。 与此同时,Kinect for Windows SDK也在不断升级中。 第一代 SDK1.8 第二代 SDK 2.0 Public Preview Kinect 的最大创新之处 ——对人机交互方式的变革 Kinect v2 的“三只眼睛”和“四只耳朵” 三只眼睛:彩色摄像头、深度(红外)摄像头、红外线投影机 彩色摄像头:用于拍摄视角范围内的彩色视频图像。 红外投影机:主动投射近红外光谱,照射到粗糙物体、或是穿透毛玻璃后,光谱发生扭曲,会形成随机的反射斑点(称为散斑),进而能被红外摄像头读取。 深度(红外)摄像头:分析红外光谱,创建可视范围内的人体、物体的深度图像。 坐标系映射转换AIP Kinect 高级功能 手势跟踪与识别 人脸识别 语音识别 3D建模:KinectFusion 第三方框架:Unity3D、MATLAB 、OpenCV 附属开发工具 手势跟踪与识别 Body :Hand states 手势跟踪与识别 Body :Hand states 两种基本属性:HandLeftState, HandRightState Unknown Not tracked Open Closed Lasso(半握拳) 两种置信度属性:HandLeftConfidence, HandRightConfidence High、Low 手势跟踪与识别目前只支持两个人 人脸识别 人脸识别 Body :Activities, Appearance, Expressions Activities 面部活动 EyeLeftClosed EyeRightClosed MouthOpen MouthMoved LookingAway Appearance 外貌 WearingGlasses Expressions 表情 Happy Neutral 语音识别 基本功能:声源定位 采用四元线性麦克风阵列,4个麦克风从4个角度采集声源,经过音频处理后可以判断出声源的来源方向和大小。硬件设备灵敏度高,可以过滤背景噪声,对人的声音较敏感。 语音识别 基本功能:声源定位 采用四元线性麦克风阵列,4个麦克风从4个角度采集声源,经过音频处理后可以判断出声源的来源方向和大小。硬件设备灵敏度高,可以过滤背景噪声,对人的声音较敏感。 扩展功能:语言识别 安装相关插件和语言包:Speech Platform SDK v11、Speech Platform Runtime v11、K4W Language Models,可以根据已定义的语法识别出有限的词组或短语,然后根据语音指令控制应用程序。目前不支持汉语。 3D建模 - KinectFusion Kinect 传感器是一种RGB-D 传感器,即可以同时获得环境颜色值(RGB)和深度值(depth)的传感器。 KinectFusion 算法通过将Kinect 采集到的深度数据进行匹配定位与融合来实现3D场景重构。 KinectFusion V1算法流程: 深度数据处理,是将传感器原始的深度数据转换成3D点云,得到点云中顶点的3维坐标和法向量; 相机跟踪,是将当前帧3D 点云和由现有模型生成的预测的3D点云进行ICP(迭代最近点 )匹配,计算得到当前帧相机的位姿; 点云融合,是根据所计算出的当前相机位姿,使用TSDF点云融合算法将当前帧的3D 点云融合到现有模型中; 场景渲染,是使用光线跟踪的方法,根据现有模型和当前相机位姿预测出当前相机观察到的环境点云,一方面用于反馈给用户,另一方面提供给相机跟踪进行ICP 匹配。 第三方框架:Unity3D、MATLAB and OpenCV Unity3D是由Unity Technologies开发的一个让玩家轻松创建诸如三维视频游戏、建筑可视化、实时三维动画等类型互动内容的多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。 微软的Kinect提供对Unity3D的支持。已经提供第三方工具包:Kinect.uni
您可能关注的文档
- JQuery属性选择器讲解.doc
- 2010年上期二年级数学(下册)期中学情调查.doc
- 贵州初中8年级第8单元第8课_《降水和降水的分布》.ppt
- JS-06聚合工序工艺技术规程(新更改版).doc
- 2010年体育教师招聘试题及答案.doc
- JSHL-2防洪防汛应急预案.doc
- 贵州小学二年级第14单元第16课_火烧云.ppt
- 2010年国际贸易术语解释通则.ppt
- 贵州毕节黔西重新公需科目大数据培训考试.doc
- JS54拨叉零件工序卡及工艺卡.doc
- 艺术疗法行业商业机会挖掘与战略布局策略研究报告.docx
- 智能家庭娱乐系统行业商业机会挖掘与战略布局策略研究报告.docx
- 医疗纠纷预防和处理条例与医疗事故处理条例的思考分享PPT课件.pptx
- 新冀教版(2025)七年级数学下册《6.1 二元一次方程组》习题课件.pptx
- 新冀教版(2025)七年级数学下册精品课件:6.2.3 二元一次方程组的解法代入、加减消元法的综合应用.pptx
- 导演节目行业市场发展趋势及投资咨询报告.docx
- 制作和服培训行业风险投资态势及投融资策略指引报告.docx
- 医疗转诊的行政服务行业消费市场分析.docx
- 文件装订行业市场发展趋势及投资咨询报告.docx
- 在线语言艺术教育行业分析及未来五至十年行业发展报告.docx
文档评论(0)