- 1、本文档共95页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用R软件做聚类分析的例子0
应用统计分析实验 —— R软件 SPSS:这是一个很受欢迎的统计软件 容易操作, 输出漂亮, 功能齐全, 价格合理。 对于非统计工作者是很好的选择。 SAS:这是功能非常齐全的软件; 美国政府政策倾斜(“权威性”) 许多美国公司使用。 价格不菲,每年交费.即使赠送,条件苛刻 尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。 R软件:免费的,志愿者管理的软件。 编程方便,语言灵活,图形功能强大 有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包. 这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。 对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。 Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。 Eviews:这是一个主要处理回归和时间序列的软件。 GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。 MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。但是统计方法不多。 R的历史 S语言在1980年代后期在ATT实验室开发. R 项目由Auckland 大学统计系的Robert Gentleman和Ross Ihaka于1995年开始的. 它很快得到广泛用户的欢迎. 目前它是由R核心发展团队维持;它是一个由志愿者组成的工作努力的国际团队 基本语法 向量 列表和数据框 读写数据文件 控制语句控制语句与自定义函数 自定义函数 统计量 数据中心化与标准化 数据的图形表示 x=seq(-10,10,2); y=rnorm(11) plot(x, y) plot(x, y,main=散点图,xlab=横坐标x,ylab=纵坐标y) text(x,y, 1:length(x),-1) # 写入点序号,第三个参数默认如此 plot(x,y,type = o, col = red,pch=2,lty=3) Bayes判别 五.聚类分析 系统聚类 快速聚类 实验三:回归分析中的自变量的挑选 四.判别分析 距离判别 Bayes判别 fisher判别 #计算马氏距离 mahalanobis(x, center, cov, inverted=FALSE, ...) 距离判别 某总体的中心即均值向量 某总体的协方差阵 若设为TRUE,表明cov已求逆。默认为False dda1=function(x,newx=NULL) #x 为训练样本,最后一列为类别, newx为待判样本 { x=as.matrix(x); p=ncol(x)-1; #变量个数 k=max(x[,p+1]); #类别个数 n=nrow(x); #已知数据的个数 if(is.null(newx)||ncol(newx)!=p) newx=x[,1:p] #如果待判样本newX为空,则为训练样本 m=nrow(newx); #待判数据的个数 md=matrix(-1,m,k); #距离矩阵k列,分别为到k个总体的距离 colnames(md)=paste(Dis,1:k,sep=); newClass=rep(-1,m); #新的类别 cov_each=matrix(0,nrow=p,ncol=p) ; for(i in 1:k){ temp=x[x[,p+1]==i,1:p]; center=apply(temp,2,mean); #计算当前总体的中心 cov_each=cov(temp) md[,i]=mahalanobis(newx,center,cov_each);# 计算待判样本到当前总体的马氏距离 } newClass=apply(md,1,which.min); #距离矩阵md每一行最小的列就是归属类 list(matrix_Distance=md,newClass=newClass) } 假设各总体协方差阵不相等时的距离判别 例1 湿度差 压温差 q 1 -1.9 3.2 1 2 -6.9 10.4 1 3 5.2 2.0 1 4 5.0 2.5 1 5 7.3 0.0 1 6 6.8 12.7 1 7 0.9 -15.4 1 8 -12.5 -2.5 1 9 1.5 1.3 1 10
文档评论(0)