- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重庆大
重庆大学硕士学位论文
英文摘要
PAGE
PAGE IV
Key words: human action recognition, spatio-temporal interest point, K-means clustering, bag-of-words model, support vector machine
重庆大学硕
重庆大学硕士学位论文
目
录
目 录
中文摘要I
英文摘要 II
1 绪 论 1
1.1 课题研究背景与意义 1
1.2 国内外研究现状 2
1.2.1 序列图像法 3
1.2.2 时空整体法 5
1.2.3 现有识别方法的不足 6
1.3 本文研究内容与章节安排 7
2 时空兴趣点检测 9
2.1 常用时空兴趣点检测算法 9
HYPERLINK \l _TOC_250005 Cuboid 检测器 9
HYPERLINK \l _TOC_250004 Hessian 检测器 10
2.1.3 密集采样检测器 10
HYPERLINK \l _TOC_250003 2.1.4 3-D Harris 角点检测器 10
HYPERLINK \l _TOC_250002 2.2 二维 Harris 角点检测 11
HYPERLINK \l _TOC_250001 2.3 三维时空 Harris 角点检测 13
2.4 多尺度角点检测 15
HYPERLINK \l _TOC_250000 2.5 三维 Harris 角点检测实验结果 15
2.6 本章小结 17
3 局部特征描述子提取 18
3.1 常用局部特征描述子 18
Cuboid 描述子 18
HOG/HOF 描述子 18
三维 SIFT 描述子 19
3-D HOG 描述子 19
3.2 3-D HOG 描述子建立 19
3.2.1 时空梯度计算 21
3.2.2 梯度方向量化 21
3.2.3 直方图建立 22
3.2.4 描述子建立实验结果 22
3.3 人体动作表征 25
3.3.1 视觉词袋模型 26
3.3.2 K-means 聚类算法 27
3.3.3 初始聚类中心选择的改进 27
3.3.4 动作表征实验结果 31
3.4 本章小结 34
4 人体动作分类识别 35
4.1 k 近邻分类器 35
4.2 支持向量机 36
4.2.1 最优分类超平面 36
4.2.2 核函数 39
4.2.3 SVM 之多类分类 41
4.3 本章小结 42
5 实验结果与分析 43
5.1 视频库介绍 43
5.2 人体动作识别实验结果 44
5.2.1 基于 Weizmann 视频库的实验结果 44
5.2.2 基于 KTH 视频库的实验结果 47
5.2.3 实验结果比较 50
5.3 本章小结 52
6 总结与展望 53
6.1 全文总结 53
6.2 工作展望 54
致 谢 55
参考文献 56
重庆大学
重庆大学硕士学位论文
1 绪 论
PAGE
PAGE 10
1 绪 论
1.1 课题研究背景与意义
在科学技术飞速发展的今天,各种前沿的科学研究和面向现实需求的技术应用 层出不穷,特别是在现代生活信息化、自动化、智能化的时代背景下,计算机视 觉成为了科学界研究热点领域之一,而人体动作识别又是近年来具有挑战性又极 其重要的研究课题。视频中人体动作识别主要涉及计算机视觉、图像处理、模式 识别、计算机图形学、数据挖掘等多学科领域,是一个以计算机视觉技术为核心、 学科交叉、相互融合的研究方向[1]。而视觉是人类认知外界、获取信息的主要来源, 人体通过视觉获取的信息占人类通过眼睛、耳朵、鼻子等感官器官获取的总信息 量的 60%之多,视觉除了对光信号具有感知能力外,也包括对信息的获取、传输、 处理、存储和理解的整个过程,由此可见,视觉是人类认知世界的一个重要的渠 道。
研究人员依据动作的复杂程度将与人体相关的待识别的动作模式分为四个层 次:人体姿态、单人动作、双人交互、群体行为。目前大部分的研究工作仍主要 集中于前两个层次,而较为复杂的后两个层次的研究是以人体基本动作的识别为 基础的,单个人体动作的稳定、准确识别是人体复杂行为理解需要解决的核心问 题,是现代智能视觉系统能否有效处理现实生活中多种多样的人类活动的前提。 所以,针对人体简单、基本动作的识别成为了近年来的研究热点。
人体动作识别在智能监控、人机交互、视频检索以及行为分析等领域有广泛的 应用[2]。例如医院常常采用的看护系统,使用摄像头对看护现场采集视频信息,计 算机通过分析识别出观察到的人体动作,判断出看护对象的潜在意图,在紧急情 况下可以及时通
您可能关注的文档
- 基于条件随机场与纠错输出码的图像自动标注方法研究-电子与通信工程专业论文.docx
- 基于遗传算法的最小组播路由算法-应用数学专业论文.docx
- 基于深度信息的人体动作识别-计算机科学与技术专业论文.docx
- 基于纹理的图像分割方法研究-电路与系统专业论文.docx
- 基于西门子PLC的超纯水处理控制系统设计-控制理论与控制工程专业论文.docx
- 基于网络探究式的个性化学习系统的设计与实现-软件工程专业论文.docx
- 基于利益相关者的公立医院院长绩效评价指标体系研究-社会医学与卫生事业管理专业论文.docx
- 基于数字图像处理的圆形物体检测研究-控制理论与控制工程专业论文.docx
- 基于图像的物体识别算法研究-软件工程专业论文.docx
- 基于三阶段DEA对于我国保险公司集团化效率测度研究-保险专业论文.docx
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
文档评论(0)