基于显著视觉特征的三维模型检索方法研究与设计2精要.pptx

下载文档 降价啦

4
0
约2.18千字
约 12页
2017-03-29 发布于湖北
举报
版权申诉
保障服务

基于显著视觉特征的三维模型检索方法研究与设计2精要.pptx

1、本文档共12页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于显著视觉特征的三维模型检索方法研究与设计2精要

基于显著视觉特征的与三维模型检索方法研究设计导师：王琳答辩人：曾嘉年学号：2012117333 班级：电子信息工程第一章序言三维图像在当今的社会和科技的发展中中发挥着越来越大的作用，随着三维图像的运用不断加强。对三维模型的检索技术运应而生。三维模型检索方法，即通过输入三维模型图像，经过计算机匹配。得出该模型的归属等信息的检索方法。现有的三维模型检索技术已经渐臻成熟，在工业生产，国防，教学中发挥着重要的作用。我的毕业设计将探索三维模型检索的基本方法和基本思路，并完成三维模型检索的全部过程和观察在不同参数设置下的检索成功率和检索效果。第二章理论和实证准备一是SIFT算法，即尺度不变特征转换是用于图像处理领域的一种描述子。该算法先用高斯函数构造尺度空间。然后用DOG算子进行关键点测量在剔除了不佳点后会用梯度函数来指定每个关键点的方向。之后就可以跟距方向点的角度确定方向直方图，方向直方图就是一个图像的SIFT特征 Bag-of-words model (BoW model) 最早出现在自然语言处理（Natural Language Processing）和信息检索（Information Retrieval）领域.。该模型忽略掉文本的语法和语序等要素，将其仅仅看作是若干个词汇的集合，文档中每个单词的出现都是独立的。BoW使用一组无序的单词(words)来表达一段文字或一个文档.。近年来，BoW模型被广泛应用于计算机视觉中。图像的BoW模型即 “图像中所有图像块的特征向量得到的直方图”。 SIFT算法和Bow码书的概念是构成三维模型检索方法的核心理论。第二章理论和实证准备聚类算法是是一种基于距离的迭代式算法，它是数据点到原型的某种距离作为优化的目标函数，利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度。 KL距离又称熵距离，可以解释为在相同的事件空间P(x)中两个概率P(x)和Q(x)分布的差异若P（X）=Q（X），他们的KL距离为0；否则，差异越大，距离越大。 K聚类算法用于将训练集三维模型的SIFT聚类生成词典。而KL距离用来进行模型之间的距离测定。第三章实验及其过程多视角图像的生成测试集三维模型训练集三维模型生成各自三维模型的SIFT特征将所有的训练集三维模型的SIFT特征合并起来进行Kmans聚类生成词典将各自的三维模型的SIFT特征和词典进行距离度量生成码书将训练集的码书和测试集的码书进行距离度量。确定检索效果三维模型的预处理第三章实验及其过程一，三维模型的预处理（1）这一步首先先对三维模型分类，三维模型取自普林斯顿大学beanchmark三维模型数据库。我共使用了6类三维模型，将这6类三维模型分为训练集和测试集两部分。训练集用于训练词典的生成。三维模型的具体情况如下表示。（2）第二步是进行三维模型的尺度归一化和平移归一化，为的是使以后的处理更加准确。归一化之前和归一化之后的模型如下图示。（图1为归一化之前，图2为归一化之后）图1 图2 第三章实验及其过程二，多视角图像的生成本次实验将对比9个多视角图，12个多视角图和19个多视角图的效果。模型m0生成的9个多视角图如下所示。三，SIFT特征提取每个三维模型的SIFT特征是提取三维模型的每个多视角图的SIFT特征，然后合并起来生成的，模型m0的SIFT特征如下图示。m0的特征为5148*128维的向量，下图只截取了部分的向量。第三章实验及其过程三，词典的生成词典的生成是将训练集里所有三维模型的SIFT特征进行Kmeans聚类。生成的数据为150*128维的向量。词典的部分图入下图示，词典的每个词代表角度。四，码书的生成码书的生成是将训练集和测试集里三维模型的SIFT特征和词典进行距离度量，比如m0里5148*128和150*128维的词典进行距离度量。就是依次计算m0里的每一个SIFT特征到词典里150个词的距离，并将其映射到距离最近的视觉词中（即将该视觉词的对应词频+1）。归一化后就成为码书。m0的码书如下图示。码书为一个1*150维的向量。码书的每个值代表概率。第三章实验及其过程五，三维模型之间的相似性度量三维模型之间的相似性度量，是将训练集的码书和测试集的码书用KL距离进行距离的度量。训练集的码书离测试集的码书哪个近，就将其归类到测试集的码书对应的类中。这一步就完成了三维模型检索的全部过程六，下图展示的是不同多视角图下的检索效果。第四章总结和展望本次毕设基本实现了三维模型的基本过程和基本方法，能够检索出部分三维模型。并分析了在不同视图投影下的结果。总代码量在2000行左右