网站大量收购闲置独家精品文档,联系QQ:2885784924

基础统计及R作图.doc

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基础统计及R作图

一、数值变量的统计描述 在R中没有一个直接的统计描述命令,可以把常见的指标都一起算出来。如概述中所说,R往往是提供一些比较基础的统计命令,需要使用者自己编程组合。 ? 1、 算术均数:mean(x) 例如:c(12,13,14)-x mean(x) ??????? 将输出x的均数13。 ? 2、 中位数:median(x) ? 3、 几何均数:我没有找到计算几何均数的命令,但可以通过对数函数来算几何均数。 例如:log(x,10)-y?? ――――――――――将x取自然对数 mean(y)-z??? ――――――――――计算y的算术平均数 10^z???????? ――――――――――将z取反对数,即得x的几何平均数 ? 4、 极差:max(x)-min(x) ? 5、 样本方差:var(x) ? 6、 样本标准差:sd(x) 请注意都是“样本”。 ? 7、 变异系数:(sd(x)/mean(x))*100 ? 通过以上命令和程序,可以求出想要的描述指标。? 二、分类变量的统计描述 1、 table(x)??????? 该命令可以输出变量中各个值的绝对频数。 ? 2、 table(x/sum(x))? 可输出相对数的频数。这个方法一般,还要把频数*百分比,不过我没有找到更好的方法。 ? 3、 table(x,y)????? 可输出绝对频数的交叉表 ??? 分类资料的描述,我还没有找到较好的命令。如有人知道,请指教。 三、正态性检验 可采用Shapiro-Wilk检验。程序如下: library(ctest)――――――先加载ctest模块,许多检验方法都在此模块中。 shapiro.test(x)―――――-可对x进行正态性检验。? 四、方差齐性检验 程序如下: var.test(x,y)――――――可对x和y进行方差齐性检验。? 五、统计图制作 R是统计制图的高手。 1、 直方图:hist 例如:rnorm(1000)-gg――――――――――――产生样本量为1000的正态样本 hist(gg)――――――――――――――――制图 ??????? 结果如下: ? 2、 饼图:pie 例如:c(1,2,2,5)-x――――――――――――――――――赋值 y-x/sum(x)――――――――――――――――――计算x的构成比 names(y)-c(“tom”,”bill”,”reed”,”jane”)―――――――给每一个赋名 pie(y,col=c(“green”,”red”,”brown”,”white”))―――――制图,col为取色 结果如下: ? ?3、 散点图:plot 例如:c(1,6,5,8,3,2,1,6,5,4,8,5,4,7)-x c(6,5,4,8,7,4,6,5,8,4,7,1,4,5)-y plot(x,y) ??????? 结果如下: ? 4、 箱式图:boxplot 例如:rnorm(10)-x boxplot(x) 结果如下: ? ??? R的制图功能非常强大,是R的亮点之一。 一、变量数据直接输入 1、数值变量 如果有一个变量,变量名为x,其数据如下:12,15,46,23,15。命令语句如下: x-c(12,15,46,23,15)? 或?? c(12,15,46,23,15)-x 其中:x为变量名;-与-为赋值符;c( )为向量建立函数,表示把括号中的数据建立为一个向量。 以上命令语句建立了一个数值变量x。 ? 2、字符变量 字符变量的建立与数值变量一致。字符串使用引号(单、双均可),如: y-c(“er”,”sdf”,”eir”,”jk”,”dim”)?? 或?? c(“er”,”sdf”,”eir”, ”jk”,”dim”)-y 将建立字符变量y。 ? 3、逻辑变量 逻辑变量中的元素是:TRUE(或简写为T)、FALSE(F)、NA(表示缺省)。 请注意必须都是大写。 逻辑变量可以直接输入,如: z-c(TRUE,FALSE,F,T,NA) 可建立逻辑变量z。 ? 1可以表示T,0可以表示F。所以可以直接写成: z-c(1,0,0,1,NA) 在计算时,T和F也是当作1和0来用的。? 二、建立数据集 在上面,我们建立起了三个变量:x,y,z。如果要建立起一个三变量的数据集,即含有x、y、z的二维表,则可使用data.frame()函数。当然,在这种情况下,要求变量的长度是一样的。 dd-data.frame(x,y,z) 便可建立数据集dd。 ? edit(dd) 可调用R中的数据编辑器显示、编辑数据集dd。如图2-1。 ? 如果eidt( )编辑的是一维的向量,如:edit(x),那么它便会调用记事本来编辑,而不会调用数据编辑器。如图2-2。 图2-1 ? 图2-2 ? 三、从

文档评论(0)

ldj215323 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档