- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种新基于内容自组织图像检索方法
一种新基于内容自组织图像检索方法
【摘 要】如何实现图像的快速浏览和查询使得基于内容图像检索的应用受到了很大限制。针对这一问题,本文提出在检索之前,先对图像库进行基于内容自组织的结构划分,给出了一种新的确定模糊权值的定义。实验结果表明,该算法能够大大缩短检索的时间。
【关键词】基于内容的图像检索 模糊c均值(FCM) 自组织结构划分 聚类
一、引言
九十年代早期,由于大规模图像数据库的出现,由手工进行图像标注基于文本的图像检索所带来的问题变得十分明显,为了克服这一困难,研究者们提出了基于内容的图像检索(Content-Based Image Retrieval, CBIR)对图像内容进行机器自动分析,直接根据图像内容特征信息建立索引,并且通过图像特征向量间的近似度量进行图像相似性匹配,从而实现图像的检索。
伴随着时代的发展,科技的进步,图像的资源越来越丰富,图像库中的图像往往也是海量的,这就给人们使用图像库带来了不便,那么我们如何从海量的图像库中能够方便的找到自己想要的图像呢?本文提出了对图像库进行基于内容自组织的结构划分,使无序的图像库变成有一定的规律,现在基于内容的图像检索技术还主要是靠图像的底层特征(如颜色、纹理、形状、空间关系等)来进行的。本文中应用模糊c均值聚类来对图像库进行分类的。模糊c均值聚类关键的就是模糊权值的确定,常用的算法是利用特征向量间的距离计算模糊权值,但是当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类,为了解决这一问题,更好的反映聚类的分布,本文给出了一种新的确定模糊权值的定义。图像库经过基于内容相似性的划分后,使图像在图像库中存放的位置有了一定的规律,如果这时再查找自己想要的图像,就不必对图像库进行逐幅查找了,而只要找到跟示例图像距离最近的类的中心,然后在该类中进行查找就可以了,最后把检索结果输出给用户。
本文在第二部分给出了基于内容自组织检索系统的框图,第三部分详细介绍了改进的模糊C均值聚类算法,最后是实验结果和结论。
二、系统框图
目前,基于内容的图像检索是通过计算示例图像与图像库中图像之间的视觉特征的相似度来完成的,而且所提取的特征大都可以表示成向量的形式,即可以把图像表示为向量形式,所以可以把它们看作是特征空间中的点,而检索的过程实质上就是寻找特征空间中离查询向量最近的那些点所对应的图像。
对图像库中的图像进行基于内容的自组织结构划分实际上就是对特征空间中的点进行划分,即模式识别中的数据聚类问题。
三、改进的模糊c均值(FCM)算法
模糊聚类是无监督模式识别的一个重要分支,在模式分类、图像处理和模糊规则提取等众多的领域中获得了广泛的应用。在众多的聚类算法中,模糊c均值(FCM)算法是最重要也是最为人们熟悉的方法之一。
该算法实质上是通过对目标函数的迭代优化实现集合划分,它可以表示出各个象素属于不同类别的程度,与此对应的硬c均值聚类算法则将每个象素都直接和唯一的划分到某个类别中去。本文中采取聚类算法的基本思想是:若Q为图像库中的图像数目,N为特征向量维数,则整个图像库可表示为Q个N维特征向量。首先,选取K个类中心,将库内图像与每个类中心求欧氏距离,然后按最小距离原则分配给相应的类中心,这样每个类别中平均包含Q/K幅图像。聚类算法如下:
(一)初始聚类数K与初始类中心的确定
1.初始聚类数:
根据经验理论和实验数据,很容易得到初始聚类数
2.初始聚类中心:
首先从图像的特征数据库中选取距离最远的两个特征向量作为第一、二初始类中心,假设已经确定了k个初始类中心,则第k+1个初始类中心是与前k个类中心距离累加和最大的特征向量,如此得到K个初始类中心。
3.样本初步分配
初始模糊权取(0-1)之间的随机数。然后将其进行规一化
根据初始模糊权 将库内样本与各初始聚类中心进行比较,归入距离最近的类中心。
4.样本合并
若两初始聚类中心间距离小于阈值T,两样本中心合并。
count[k]:每类中所包含图像个数。
5、更新聚类中心
将各类成员的质心作为新聚类中心。
(二)图像样本隶属度的权值确定
从上面的分析可以看出常用的FCM算法采用特征向量间的距离计算模糊权值(如式3.3),如果图像与聚类中心之间距离越远,那么该图像属于这一类的隶属程度就会越小,但当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类。下面就这一问题本文进行了深入的研究,给出了一种新的确定模糊权值的定义。
定义1:给定图像序列,其中Q是图像库中图像的数目,初始聚类中心序列,其中K是初始聚类
您可能关注的文档
- “挂证族”背后灰色利益链条.doc
- “按照自己内心去拍”.doc
- “悲喜交加”概念、测量及相关研究述评.doc
- “摄影是一个自我完善过程”.doc
- “文人论政”对我国新闻舆论监督启示.doc
- “新三板”扩容下新机遇.doc
- “新书限折令”反垄断法分析.doc
- “新农保”存在问题和解决推行阻力对策.doc
- “新华体”形成与博古贡献.doc
- “微”时代下微电影浅谈.doc
- 2025年安徽工商职业学院单招职业技能测试题库带答案(典型题).docx
- 2025年洛阳科技职业学院单招职业技能测试题库带答案(新).docx
- 2025年荆门职业学院单招职业技能测试题库及答案(易错题).docx
- 2025年宣化科技职业学院单招职业技能测试题库(精练).docx
- 2025年包头职业技术学院单招职业技能测试题库带答案(新).docx
- 2025年江西工商职业技术学院单招职业技能测试题库带答案(精练).docx
- 2025年黑龙江农业经济职业学院单招职业技能测试题库精编.docx
- 2025年山东艺术设计职业学院单招职业技能测试题库带答案(基础题).docx
- 2025年陕西工商职业学院单招职业技能测试题库带答案(突破训练).docx
- 2025年承德护理职业学院单招职业技能测试题库【word】.docx
最近下载
- 跨境电子商务基础:跨境电子商务平台PPT教学课件.pptx
- 2025年芜湖职业技术学院单招职业技能测试题库有完整答案.docx VIP
- 2023-2024学年江西师大附中八年级(下)月考数学试卷(含答案).docx
- 企业碳排放影响因素研究-浙江工商大学杂志社.pdf VIP
- 2024年银行知识财经金融知识竞赛-中国农业发展银行信贷标准化知识笔试考试历年高频考点试题摘选含答案.docx
- 定向越野识图用图课件.ppt
- 2024年心血管内科(副高)考试历年真题常考点试题带答案.docx VIP
- 丹东银行2021年年度报告.docx
- 给水排水管道工程施工及验收规范GB 50268-2008上.ppt
- GB51057-2015 种植塑料大棚工程技术规范.docx
文档评论(0)