基础统计及R作图.doc

下载文档 降价啦

9
0
约2.72万字
约 35页
2018-08-27 发布于江苏
举报
版权申诉
保障服务

基础统计及R作图.doc

1、本文档共35页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基础统计及R作图

一、数值变量的统计描述在R中没有一个直接的统计描述命令，可以把常见的指标都一起算出来。如概述中所说，R往往是提供一些比较基础的统计命令，需要使用者自己编程组合。 ? 1、算术均数：mean(x) 例如：c(12,13,14)-x mean(x) ??????? 将输出x的均数13。 ? 2、中位数：median(x) ? 3、几何均数：我没有找到计算几何均数的命令，但可以通过对数函数来算几何均数。例如：log(x,10)-y?? ――――――――――将x取自然对数 mean(y)-z??? ――――――――――计算y的算术平均数 10^z???????? ――――――――――将z取反对数，即得x的几何平均数 ? 4、极差：max(x)-min(x) ? 5、样本方差：var(x) ? 6、样本标准差：sd(x) 请注意都是“样本”。 ? 7、变异系数：(sd(x)/mean(x))*100 ? 通过以上命令和程序，可以求出想要的描述指标。? 二、分类变量的统计描述 1、 table(x)??????? 该命令可以输出变量中各个值的绝对频数。 ? 2、 table(x/sum(x))? 可输出相对数的频数。这个方法一般，还要把频数*百分比，不过我没有找到更好的方法。 ? 3、 table(x,y)????? 可输出绝对频数的交叉表 ??? 分类资料的描述，我还没有找到较好的命令。如有人知道，请指教。三、正态性检验可采用Shapiro-Wilk检验。程序如下： library(ctest)――――――先加载ctest模块，许多检验方法都在此模块中。 shapiro.test(x)―――――－可对x进行正态性检验。? 四、方差齐性检验程序如下： var.test(x,y)――――――可对x和y进行方差齐性检验。? 五、统计图制作 R是统计制图的高手。 1、直方图：hist 例如：rnorm(1000)-gg――――――――――――产生样本量为1000的正态样本 hist(gg)――――――――――――――――制图 ??????? 结果如下： ? 2、饼图：pie 例如：c(1,2,2,5)-x――――――――――――――――――赋值 y-x/sum(x)――――――――――――――――――计算x的构成比 names(y)-c(“tom”,”bill”,”reed”,”jane”)―――――――给每一个赋名 pie(y,col=c(“green”,”red”,”brown”,”white”))―――――制图，col为取色结果如下： ? ?3、散点图：plot 例如：c(1,6,5,8,3,2,1,6,5,4,8,5,4,7)-x c(6,5,4,8,7,4,6,5,8,4,7,1,4,5)-y plot(x,y) ??????? 结果如下： ? 4、箱式图：boxplot 例如：rnorm(10)-x boxplot(x) 结果如下： ? ??? R的制图功能非常强大，是R的亮点之一。一、变量数据直接输入 1、数值变量如果有一个变量，变量名为x，其数据如下：12，15，46，23，15。命令语句如下： x-c(12,15,46,23,15)? 或?? c(12,15,46,23,15)-x 其中：x为变量名；-与-为赋值符；c( )为向量建立函数，表示把括号中的数据建立为一个向量。以上命令语句建立了一个数值变量x。 ? 2、字符变量字符变量的建立与数值变量一致。字符串使用引号（单、双均可），如： y-c(“er”,”sdf”,”eir”,”jk”,”dim”)?? 或?? c(“er”,”sdf”,”eir”, ”jk”,”dim”)-y 将建立字符变量y。 ? 3、逻辑变量逻辑变量中的元素是：TRUE(或简写为T)、FALSE(F)、NA(表示缺省)。请注意必须都是大写。逻辑变量可以直接输入，如： z-c(TRUE,FALSE,F,T,NA) 可建立逻辑变量z。 ? 1可以表示T，0可以表示F。所以可以直接写成： z-c(1，0，0，1,NA) 在计算时，T和F也是当作1和0来用的。? 二、建立数据集在上面，我们建立起了三个变量：x，y，z。如果要建立起一个三变量的数据集，即含有x、y、z的二维表，则可使用data.frame()函数。当然，在这种情况下，要求变量的长度是一样的。 dd-data.frame(x,y,z) 便可建立数据集dd。 ? edit(dd) 可调用R中的数据编辑器显示、编辑数据集dd。如图2-1。 ? 如果eidt( )编辑的是一维的向量，如：edit(x)，那么它便会调用记事本来编辑，而不会调用数据编辑器。如图2-2。图2-1 ? 图2-2 ? 三、从