- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
TLD算法原理及应用实例全解
汇报内容 1 TLD概述 TLD:Tracking-Learning-Detection TLD是英国萨里大学的一个捷克籍博士生Zdenek Kalal在其攻读博士学位期间提出的一种新的单目标长期跟踪算法。该算法与传统跟踪算法的显著区别在于将传统的跟踪算法和检测算法相结合来解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。同时,通过一种改进的在线学习机制不断更新跟踪模块和检测模块,从而使得跟踪效果更加稳定和可靠。 TLD可以解决的问题: 极其复杂的视频,比如跟踪失败的情况经常发生的视频,目标经常丢失的视频 如果前后的视频帧中没有包含很相关的信息,比如说目标物体发生了严重形变,检测器的效果也从不会被弱化 实时运作 1 TLD概述 1 TLD概述 2 TLD关键技术 2.1 跟踪器设计 TLD的跟踪部分改进了基于Lucas-Kanade光流的跟踪方法,提出一种Median Flow(中值光流法)跟踪方法,并在此基础上囊括了跟踪失败时候的检测。中值光流跟踪器跟踪矩形框里的目标,并估计他的运动。跟踪器估计出矩形框内的一些点的移动,估计他们的可靠性,然后,通过取一些最可靠的移动的中值作为最后的矩形框的移动。 跟踪器实现流程 跟踪点的选择 选择了一种brute force selection mechanism(强制选择机理): 在整个图像序列中跟踪第一帧中的每个像素; 通过FB错误方法来估计轨迹; 计算每个像素的误差。最后得到Error Map(误差图),表示整个图像序列中跟踪点的可靠性。 左边的图是第一帧图像,红色的点表示最可靠像素的1%。右边的图是Error Map。深色表示低的FB错误:A区域表示树影,B区域表示行人的身体部分。亮色区域是很难或者不可能跟踪的:被遮挡的(C),从相机视野中消失的(D),缺少纹理信息的(E)。这个实验表明FB错误方法能够用于选择可用于可靠追踪的特征点。 前后向错误(Forward-Backward Error) 2.2 检测器设计 检测器采用滑动窗口的方法在图像中寻找目标,利用级联分类器输出结果。级联分类器包含三部分:方差比较、合并分类器以及最近邻分类。 滑动窗口的扫描策略为:每次尺度变化为1.2,水平和垂直位移为宽度和高度的10%,最小框图大小为20个像素。 方差比较:对滑窗图像与目标图像计算灰度值方差,将结果低于原图50%的结果抛弃。 合并分类器:首先对于输入图像进行平滑滤波处理降噪,而后在图像内部生成13个像素比较对,最终的像素比较结果输出为一个13位的二进制像素编码,该二进制编码将映射到某后验概率。依据各基分类器输出的后验概率结果平均,如果其得分大于0.5,将进入下一步,否则将被舍弃。 最近邻分类器:合并分类器的输出结果再经过最近邻分类器输出检测器的结果。 2.3 P-N学习 P-N学习的主要思想就是检测器的错误能够被两种类型的约束标识出。 P-expert的作用是发现目标的新的外观(形变),并以此来增加正样本的数量,从而使得检测模块更具鲁棒性。 N-expert的作用是生成负的训练样本。N-expert的前提假设是:(被跟踪的)前景目标仅可能出现在视频帧中的一个位置,因此,如果前景目标的位置时确定的,那么其周围必然是负样本。 2.3 P-N LEARNING 这一部分介绍TLD算法的学习模块,学习模块(learning)通过对视频的在线处理来提升检测器(detector)的性能。在每一帧里,我们希望评估当前的检测器,发现它产生的错误(identify its errors),不断更新检测器以避免将来它再次犯错。PN学习的关键思想是检测器产生的错误结果可以被“P专家”和“N专家”发现和识别。P专家识别假的负样本,N专家识别假的正样本。当然P专家和N专家本身也会犯错。然而,P专家和N专家是相互独立的,它们可以相互弥补对方发生的错误。P专家发生的错误,N专家纠正,反之亦然。 P-N学习过程 P-N学习步骤如下: 在当前帧评估检测器; 利用P-N约束来估计检测器的误差; 根据由P-N约束所产生的标注样本来更新检测器; 在训练学习的最后所获得的检测器就叫做最终检测器。 P-N学习实例 3 TLD局限性 目前的TLD架构只训练检测器,而跟踪器则固定不变。这样的结果就是跟踪器会总是产生相同的错误。一个比较好的改进就是对跟踪模块也进行训练和学习。 TLD目前还只能跟踪一个目标。 TLD目前还不能很好地处理黏连的目标情形,比如多行人的情况。 在一些受限制的场景下,比如说摄像机是固定的,TLD可以实现进行背景提取,这样会获得更好的跟踪能力。 汇报完毕 敬请批评指正
您可能关注的文档
最近下载
- 网络空间信息安全(第2版)习题与思考题参考答案.pdf
- 微肿瘤PTC体外药敏检测服务2023年.pdf VIP
- 教科版四年级科学上册第三单元《第1课让小车运动起来》优秀教学设计.docx VIP
- 病例报告表完整版.doc
- 电影售票管理平台.docx
- 统编版语文三年级上册《对话中提示语的位置及标点》课件.pptx VIP
- AQ_ 4272-2016 铝镁制品机械加工粉尘防爆安全技术规范.pdf
- 4第四章-金融市场及其构成(货币金融学(蒋先玲编著)第3版ppt课件可编辑).pptx
- 部编版语文二年级下册 第三单元大单元任务群“发现汉字的秘密”(一等奖创新教学设计).pdf VIP
- 《活着》读书分享.pptx VIP
文档评论(0)