- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视频语义物体的分割与跟踪
曹翔徐光祜
清华大学计算机系人机交互与媒体集成研究所,北京100084
摘要:提出并实现了一个对视额序列中的语义物体进行分割和跟踪的系统,从视巅序列
的各帧中提取所关注枷体的轮廓.流程分两个步骤:初始帧的物体分割和后续帧的抽体跟
踪.在手工勾画和修正算法帮助下,获得初始帧中所关注物体的轮廓;应用光漉估计预测
出下一帧中谊新体的轮廓,并对其施以修正,获得后一帧物体的真实轮廓.依此类推,提
取出后续各帧中物体.本文提出了多分辨率分水岭修正算法,具有令人满意的修正足度和
准璃性,在多数情况下可以取代运动估计.
关键词:分制,罪踪,运动估计,轮廓修正,多分辨率分水岭方法,光流估计
1 引言
视频语义物体是指视频中具有物理意义的一个买体,例如人脸、汽车、建筑等,它对
应于现实世界中的某个物体,是视频信息的基本语义单位。对视频语义物体的抽取是视频
信息理解的前提。但鉴于物体自身的复杂性,目前采用基于颜色、运动或二者结合的方法,
都不能够完全自主的完成抽取,其主要问题在于计算机不能够真正理解物体的含义,而在
通用性的要求下。过多先验知识是不被允许的。因此,较为现实的方案是结合人工指导和
计算机运算,由人进行计算机难于完成的物体范围的埘定工作,使其获知物体的大概概念;
而对于计算机能够较好的进行的工作,如物体边界的准确提取、物体运动估计和对既定物
体的跟踪,由系统自主完成。前人如onangGu&Ming_chj曲LeeIl】等基于这一思想作了
—些有益的工作。本文亦从该思想出发,构建了一个物体分割与跟踪系统,完成在较少人
工指导的条件下,对完整的视频序列中感兴趣物体的分割和跟踪,并提出了多分辨率的分
水蛉修正算法。
本文第2节简单描述基本工作流程;第3节介绍初始帧物体分割的机理并一连多分辨
率分水岭算法的思想和性能;第4节介绍后续帧物体跟踪的机制;第5节描述对系统流程
的改进;第6节总结实验结果并讨论。
2基本流程
根据有无人工指导的区别,流程可被分为有指导的初始帧(I.帧)分期和无指导的后
续赣(P-帧)跟踪爵个步骤。初始帧分割中,由用户在初始帧中勾嘶出所关注物体的大致
轮奔,并应用多分辨率分水岭修正算法对其进行修正,得蓟物体的初始轮廓。此后,在整
个视囊序列中对该物体进行跟踪,即对每一帧,根据前一杖的物体形状和帧间运动信息,
做出本帧中物体轮廓的估计,并对其进行修正,获得物体的糖确轮廓。本文采用Ihn.
·34。
Schnk法光流估算完成运动估计,修正算法依然采用初始帧分割中使用的多分辨率分水岭
算法。第5节将陈述,基于修正算法的性能和提高速度的考虑,实际流程将在此基础上加
以优化。
3初始帻分割与多分辨率分水岭修正算法
初蛔杖分胡包括人工勾画和算法修正两个步骤。人工勾画即用鼠标在初始帧图像上依
次点出各关键点。关键点联成的闭合多边形即为人勾出的物体大致轮廓BjlIit,然后对该轮
廓进行修正得甍勃体精确轮廓B。
3.1簟级分槭修正算法
本文修正算法的基本思想是:鉴于待修正轮廓BilIit与物体真实轮廓B相差不会太大,
对BiIIit作一定尺度的腐蚀与膨胀,腐蚀所得结果称作“内”轮廓Bin,膨胀所得结果蒋作
“外”轮廓Bout。选择恰当的腐蚀膨胀尺度,则有理由相信,物体真实轮廓B就落在B妯
和B0ut之间:Bin以内的像素必位于物体内部,胁t以外的像素必位于物体外部,而对物
体边界的确定就转化为分别以B.m和BOVt上的点为聚类中心,对B缸与踟ut之间像素的
分类问题,且此前所作腐蚀与膨胀的尺度就是该修正算法的最大修正尺度。
在视频中,物体的基本性质之一是空间上的连续性,为体现这一连续性,选择分水岭
方法进行像素的分类,较之近邻法等独立考虑各像素的分类方法具有较大的优越性。其基
本思想是:对于若干空间上互不接触的聚类中心.根据一定的原则(相似度或阈值)使它
们在空间上逐渐扩展.直到其边界互相接触,即完成了对它们之间点的分类,接触线即为
分界线。基于灰度阈值的分承蛉方法被广泛运用于图像区域自动分割问题中,雨针对本文
的问题,基于颜色似度的分水岭方法表现出良好的性能。 分水岭方法运用于本文问题的
具体过程如下:
i.由8讯i£俸魄蚀s黪强.褥韵8讯和Bom.它们选强是鼹个聚类韵初始边界:
t
2.对当前聚类边界上的每—个点tB分类1.分鄹计算它与其糨邻
您可能关注的文档
最近下载
- 施工现场的交通指挥与安全预警.pptx VIP
- 2024年7月宁夏普通高中地理会考试卷.docx VIP
- 江苏海安市瑞海公司招聘笔试题库2023.pdf VIP
- 2025年全国文物行业职业技能大赛北京市选拔赛理论参考题库及答案(泥瓦作文物修复师314题).docx VIP
- 采购人员廉洁从业课件培训.pptx VIP
- 贯彻落实八项规定扎实推进作风建设工作专题党课简洁ppt课件.pptx VIP
- 2020 同步调相机变压器组继电保护整定计算导则.docx VIP
- 2025年中央八项规定精神应知应会100题测试卷【含答案详解】.docx VIP
- 2022-2023学年四川省成都市青羊区四年级下学期期末数学真题及答案.pdf VIP
- 计数型MSA测量系统分析报告(KAPPA).xls VIP
文档评论(0)