- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式识别
作业 题目: C均值聚类算法实现
学 院: 电气信息工程学院
专 业: 电子工程系
班 级: 电子 10-1班
姓 名: 赵南兵
学 号: 11号
指导教师: 钱 云
C均值聚类实验报告
一、考试题目
基于聚类方法分类器设计
二、考试要求
1.掌握C均值基本原理。
2.掌握流程图的画法。
3.熟悉归一化的算法。
4.掌握聚类方法分类器设计方法。
三、考试分析
1、C均值聚类的算法原理
c均值聚类算法的步骤还是比较简单的,c均值聚类,即众所周知的模糊ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。1973年,Bezdek提出了该算法,作为早期硬c均值聚类(HCM)方法的一种改进。
FCM把n个向量xi(i=1,2,…,n)分为c个模糊组,并求每组的聚类中心,使得非相似性指标的价值函数达到最小。FCM与HCM的主要区别在于FCM用模糊划分,使得每个给定数据点用值在0,1间的隶属度来确定其属于各个组的程度。与引入模糊划分相适应,隶属矩阵U允许有取值在0,1间的元素。不过,加上归一化规定,一个数据集的隶属度的和总等于1:
那么,价值函数(或目标函数)就是:
,
这里uij介于0,1间;ci为模糊组I的聚类中心,dij=||ci-xj||为第I个聚类中心与第j个数据点间的欧几里德距离;且是一个加权指数。
构造如下新的目标函数,可求得使(3.2)式达到最小值的必要条件:
这里(j,j=1到n,是(3.1)式的n个约束式的拉格朗日乘子。对所有输入参量求导,使式(3.2)达到最小的必要条件为:
和
上述算法也可以先初始化聚类中心,然后再执行迭代过程。由于不能确保FCM收敛于一个最优解。算法的性能依赖于初始聚类中心。因此,我们要么用另外的快速算法确定初始聚类中心,要么每次用不同的初始聚类中心启动该算法,多次运行FCM。
设被分类的对象的集合为:X = { x1 , x2 ,…,xN},其中每一个对象xk有n 个特性指标,设为xk = ( x1k ,x2k , …, xnk) T , 如果要把X 分成c 类,则它的每一个分类结果都对应一个c×N 阶的Boolean矩阵U= [ uik ] c×N,对应的模糊c划分空间为:
2、C均值聚类的实现步骤
C-均值算法步骤:
① 给出n个混合样本,令 ,表示迭代运算次数,选取c个初始聚合中心
② 计算每个样本与聚合中心的距离:
若
则
③令 计算新的集合中心:
计算误差平方和 值:
④ 对每个聚合中的每个样本,计算:
表示 减少的部分 。
表示 增加的部分:
若 ,则把样本 移到聚合中心 中,并修改聚合中心和 值。
⑤ 判断:若 则 ,返回④。否则,算法结束。
3、C均值聚类实验流程图
四.ATLAB程序及其注解
归一化程序
function a = Data_Normalized(a)
amax = max(max(a)); %求矩阵中最大数
amin = min(min(a)); %求矩阵中最小数
[m,n]= size(a);
for i = 1: m
for j = 1: n
a(i,j)= (a(i,j)-amin)/(amax-amin);
end
end
C均值聚类程序
a=fopen(data.txt);%打开文件
b=fscanf(a,%f %f %f %f,[4,150]);%按格式读入文件
b=b;%转置
aa=zeros(1,4);%用于计算內积的数据暂存矩阵
bb=zeros(1,4);
key=1;%循环条件判断值
Jet=0;%临时误差
ex=0;%交换变量
lac=0;%位置记录值
tem=0;%临时比较变量
max=0;%最大误
您可能关注的文档
- 2018年希望杯五年级培训题100题及答案1.doc
- 2018年高考物理全国卷复习研讨把握高考命题新动向必考点深度探究.ppt
- 201X年春开学典礼大队辅导员讲话稿.doc
- 202职业访谈报告.doc
- 29092、旭辉集团2009年十大工作目标总结.ppt
- 2EG0002新产品导入管制程序.doc
- 30m预应力混凝土简支T梁计算方案.doc
- 32专业灯具应急照明灯安装工程检验批施工质量验收.doc
- 337民族社会学教学大纲.doc
- 3x35简支转连续小箱梁计算方案.doc
- 2024年奥瑞金分析报告:金属包装拐点已至,盈利能力持续改善.pdf
- 2024年特种电子树脂企业组织架构部门职能和业务流程.docx
- 2024年川仪股份分析报告:国产工业自动化仪器仪表领先企业.pdf
- 2024年品牌终端形象展示企业组织架构部门职能和业务流程.docx
- 2024年汽车行业剖析:阿维塔入股引望,加速智能化落地,夯实高端化定位.pdf
- 2024年重组胶原蛋白原料化妆品企业组织架构部门职能和业务流程.docx
- 2024年通信行业:“合成数据+强化学习”-大模型进化的新范式.pdf
- 2024年中煤能源分析报告:低估值央煤,高分红与高成长潜力足.pdf
- 2023年铜陵有色分析报告:米拉多铜矿注入开启发展新篇章.pdf
- 2024年盛邦安全分析报告:深化安全细分赛道,守护网络空间安全.pdf
最近下载
- 7《短歌行》《归园田居(其一)》 对比联读 教学设计 2024-2025学年统编版高中语文必修上册.docx
- 沪教版 七年级(上)数学 秋季课程 第4讲 整式的乘法(解析版).doc VIP
- 2024年萍乡卫生职业学院单招职业适应性测试模拟试题及答案解析.docx
- 生物 生命活动的主要承担者——蛋白质 专题练习.doc VIP
- 《摩登时代》-公开课件(设计).ppt VIP
- A7-10-制冷系统部件的检修.pdf
- Unit 2 I think that mooncakes are delicious! Section A(Grammar Focus-4c) 课件-九上英语.pptx VIP
- 2024年萍乡卫生职业学院单招职业技能测试题库及答案解析.docx VIP
- 父母借用子女名义购房协议书.doc
- 团体操花球串词.doc
文档评论(0)