I基础统计与R作图.doc

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
I基础统计与R作图

一、数值变量的统计描述 在R中没有一个直接的统计描述命令,可以把常见的指标都一起算出来。如概述中所说,R往往是提供一些比较基础的统计命令,需要使用者自己编程组合。 ? 1、 mean(x) 例如:c(12,13,14)-x mean(x) ??????? 将输出x的均数13。 ? 2、 median(x) ? 3、 例如:log(x,10)-y?? ――――――――――将x取自然对数 mean(y)-z??? ――――――――――计算y的算术平均数 10^z???????? ――――――――――将z取反对数,即得x的几何平均数 ? 4、 max(x)-min(x) ? 5、 var(x) ? 6、 sd(x) 请注意都是“样本”。 ? 7、 (sd(x)/mean(x))*100 ? 通过以上命令和程序,可以求出想要的描述指标。? 二、分类变量的统计描述 1、 table(x)??????? ? 2、 table(x/sum(x))? *百分比,不过我没有找到更好的方法。 ? 3、 table(x,y)????? ??? 分类资料的描述,我还没有找到较好的命令。如有人知道,请指教。 三、正态性检验 可采用Shapiro-Wilk检验。程序如下: library(ctest)――――――先加载ctest模块,许多检验方法都在此模块中。 shapiro.test(x)―――――-可对x进行正态性检验。? 四、方差齐性检验 程序如下: var.test(x,y)――――――可对x和y进行方差齐性检验。? 五、统计图制作 R是统计制图的高手。 1、 hist 例如:rnorm(1000)-gg――――――――――――产生样本量为1000的正态样本 hist(gg)――――――――――――――――制图 ??????? 结果如下: ? 2、 pie 例如:c(1,2,2,5)-x――――――――――――――――――赋值 y-x/sum(x)――――――――――――――――――计算x的构成比 names(y)-c(“tom”,”bill”,”reed”,”jane”)―――――――给每一个赋名 pie(y,col=c(“green”,”red”,”brown”,”white”))―――――制图,col为取色 结果如下: ? ?3、 plot 例如:c(1,6,5,8,3,2,1,6,5,4,8,5,4,7)-x c(6,5,4,8,7,4,6,5,8,4,7,1,4,5)-y plot(x,y) ??????? 结果如下: ? 4、 boxplot 例如:rnorm(10)-x boxplot(x) 结果如下: ? ??? R的制图功能非常强大,是R的亮点之一。 一、变量数据直接输入 1、数值变量 如果有一个变量,变量名为x,其数据如下:12,15,46,23,15。命令语句如下: x-c(12,15,46,23,15)? 或?? c(12,15,46,23,15)-x 其中:x为变量名;-与-为赋值符;c( )为向量建立函数,表示把括号中的数据建立为一个向量。 以上命令语句建立了一个数值变量x。 ? 2、字符变量 字符变量的建立与数值变量一致。字符串使用引号(单、双均可),如: y-c(“er”,”sdf”,”eir”,”jk”,”dim”)?? 或?? c(“er”,”sdf”,”eir”, ”jk”,”dim”)-y 将建立字符变量y。 ? 3、逻辑变量 逻辑变量中的元素是:TRUE(或简写为T)、FALSE(F)、NA(表示缺省)。 请注意必须都是大写。 逻辑变量可以直接输入,如: z-c(TRUE,FALSE,F,T,NA) 可建立逻辑变量z。 ? 1可以表示T,0可以表示F。所以可以直接写成: z-c(1,0,0,1,NA) 在计算时,T和F也是当作1和0来用的。? 二、建立数据集 在上面,我们建立起了三个变量:x,y,z。如果要建立起一个三变量的数据集,即含有x、y、z的二维表,则可使用data.frame()函数。当然,在这种情况下,要求变量的长度是一样的。 dd-data.frame(x,y,z) 便可建立数据集dd。 ? edit(dd) 可调用R中的数据编辑器显示、编辑数据集dd。如图2-1。 ? 如果eidt( )编辑的是一维的向量,如:edit(x),那么它便会调用记事本来编辑,而不会调用数据编辑器。如图2-2。 图2-1 ? 图2-2 ? 三、从其他文件中读取数据 在应用统计学中,数据量一般是比较大的,变量也很多。如果用上述方法来建立数据集,好像辛苦了一些。上述方法适用于少量数据、少量变量的分析。对于大量数据和变量,一般应在其他软件中输好,再读R中处理。 ? 1、 若数据

文档评论(0)

huhongjun + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档