视频语义物体的分割和跟踪.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视频语义物体的分割与跟踪 曹翔徐光祜 清华大学计算机系人机交互与媒体集成研究所,北京100084 摘要:提出并实现了一个对视额序列中的语义物体进行分割和跟踪的系统,从视巅序列 的各帧中提取所关注枷体的轮廓.流程分两个步骤:初始帧的物体分割和后续帧的抽体跟 踪.在手工勾画和修正算法帮助下,获得初始帧中所关注物体的轮廓;应用光漉估计预测 出下一帧中谊新体的轮廓,并对其施以修正,获得后一帧物体的真实轮廓.依此类推,提 取出后续各帧中物体.本文提出了多分辨率分水岭修正算法,具有令人满意的修正足度和 准璃性,在多数情况下可以取代运动估计. 关键词:分制,罪踪,运动估计,轮廓修正,多分辨率分水岭方法,光流估计 1 引言 视频语义物体是指视频中具有物理意义的一个买体,例如人脸、汽车、建筑等,它对 应于现实世界中的某个物体,是视频信息的基本语义单位。对视频语义物体的抽取是视频 信息理解的前提。但鉴于物体自身的复杂性,目前采用基于颜色、运动或二者结合的方法, 都不能够完全自主的完成抽取,其主要问题在于计算机不能够真正理解物体的含义,而在 通用性的要求下。过多先验知识是不被允许的。因此,较为现实的方案是结合人工指导和 计算机运算,由人进行计算机难于完成的物体范围的埘定工作,使其获知物体的大概概念; 而对于计算机能够较好的进行的工作,如物体边界的准确提取、物体运动估计和对既定物 体的跟踪,由系统自主完成。前人如onangGu&Ming_chj曲LeeIl】等基于这一思想作了 —些有益的工作。本文亦从该思想出发,构建了一个物体分割与跟踪系统,完成在较少人 工指导的条件下,对完整的视频序列中感兴趣物体的分割和跟踪,并提出了多分辨率的分 水蛉修正算法。 本文第2节简单描述基本工作流程;第3节介绍初始帧物体分割的机理并一连多分辨 率分水岭算法的思想和性能;第4节介绍后续帧物体跟踪的机制;第5节描述对系统流程 的改进;第6节总结实验结果并讨论。 2基本流程 根据有无人工指导的区别,流程可被分为有指导的初始帧(I.帧)分期和无指导的后 续赣(P-帧)跟踪爵个步骤。初始帧分割中,由用户在初始帧中勾嘶出所关注物体的大致 轮奔,并应用多分辨率分水岭修正算法对其进行修正,得蓟物体的初始轮廓。此后,在整 个视囊序列中对该物体进行跟踪,即对每一帧,根据前一杖的物体形状和帧间运动信息, 做出本帧中物体轮廓的估计,并对其进行修正,获得物体的糖确轮廓。本文采用Ihn. ·34。 Schnk法光流估算完成运动估计,修正算法依然采用初始帧分割中使用的多分辨率分水岭 算法。第5节将陈述,基于修正算法的性能和提高速度的考虑,实际流程将在此基础上加 以优化。 3初始帻分割与多分辨率分水岭修正算法 初蛔杖分胡包括人工勾画和算法修正两个步骤。人工勾画即用鼠标在初始帧图像上依 次点出各关键点。关键点联成的闭合多边形即为人勾出的物体大致轮廓BjlIit,然后对该轮 廓进行修正得甍勃体精确轮廓B。 3.1簟级分槭修正算法 本文修正算法的基本思想是:鉴于待修正轮廓BilIit与物体真实轮廓B相差不会太大, 对BiIIit作一定尺度的腐蚀与膨胀,腐蚀所得结果称作“内”轮廓Bin,膨胀所得结果蒋作 “外”轮廓Bout。选择恰当的腐蚀膨胀尺度,则有理由相信,物体真实轮廓B就落在B妯 和B0ut之间:Bin以内的像素必位于物体内部,胁t以外的像素必位于物体外部,而对物 体边界的确定就转化为分别以B.m和BOVt上的点为聚类中心,对B缸与踟ut之间像素的 分类问题,且此前所作腐蚀与膨胀的尺度就是该修正算法的最大修正尺度。 在视频中,物体的基本性质之一是空间上的连续性,为体现这一连续性,选择分水岭 方法进行像素的分类,较之近邻法等独立考虑各像素的分类方法具有较大的优越性。其基 本思想是:对于若干空间上互不接触的聚类中心.根据一定的原则(相似度或阈值)使它 们在空间上逐渐扩展.直到其边界互相接触,即完成了对它们之间点的分类,接触线即为 分界线。基于灰度阈值的分承蛉方法被广泛运用于图像区域自动分割问题中,雨针对本文 的问题,基于颜色似度的分水岭方法表现出良好的性能。 分水岭方法运用于本文问题的 具体过程如下: i.由8讯i£俸魄蚀s黪强.褥韵8讯和Bom.它们选强是鼹个聚类韵初始边界: t 2.对当前聚类边界上的每—个点tB分类1.分鄹计算它与其糨邻

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档