- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基础统计及R作图
一、数值变量的统计描述
在R中没有一个直接的统计描述命令,可以把常见的指标都一起算出来。如概述中所说,R往往是提供一些比较基础的统计命令,需要使用者自己编程组合。
?
1、 算术均数:mean(x)
例如:c(12,13,14)-x
mean(x)
??????? 将输出x的均数13。
?
2、 中位数:median(x)
?
3、 几何均数:我没有找到计算几何均数的命令,但可以通过对数函数来算几何均数。
例如:log(x,10)-y?? ――――――――――将x取自然对数
mean(y)-z??? ――――――――――计算y的算术平均数
10^z???????? ――――――――――将z取反对数,即得x的几何平均数
?
4、 极差:max(x)-min(x)
?
5、 样本方差:var(x)
?
6、 样本标准差:sd(x)
请注意都是“样本”。
?
7、 变异系数:(sd(x)/mean(x))*100
?
通过以上命令和程序,可以求出想要的描述指标。?
二、分类变量的统计描述
1、 table(x)??????? 该命令可以输出变量中各个值的绝对频数。
?
2、 table(x/sum(x))? 可输出相对数的频数。这个方法一般,还要把频数*百分比,不过我没有找到更好的方法。
?
3、 table(x,y)????? 可输出绝对频数的交叉表
???
分类资料的描述,我还没有找到较好的命令。如有人知道,请指教。
三、正态性检验
可采用Shapiro-Wilk检验。程序如下:
library(ctest)――――――先加载ctest模块,许多检验方法都在此模块中。
shapiro.test(x)―――――-可对x进行正态性检验。?
四、方差齐性检验
程序如下:
var.test(x,y)――――――可对x和y进行方差齐性检验。?
五、统计图制作
R是统计制图的高手。
1、 直方图:hist
例如:rnorm(1000)-gg――――――――――――产生样本量为1000的正态样本
hist(gg)――――――――――――――――制图
??????? 结果如下:
?
2、 饼图:pie
例如:c(1,2,2,5)-x――――――――――――――――――赋值
y-x/sum(x)――――――――――――――――――计算x的构成比
names(y)-c(“tom”,”bill”,”reed”,”jane”)―――――――给每一个赋名
pie(y,col=c(“green”,”red”,”brown”,”white”))―――――制图,col为取色
结果如下:
?
?3、 散点图:plot
例如:c(1,6,5,8,3,2,1,6,5,4,8,5,4,7)-x
c(6,5,4,8,7,4,6,5,8,4,7,1,4,5)-y
plot(x,y)
??????? 结果如下:
?
4、 箱式图:boxplot
例如:rnorm(10)-x
boxplot(x)
结果如下:
?
??? R的制图功能非常强大,是R的亮点之一。
一、变量数据直接输入
1、数值变量
如果有一个变量,变量名为x,其数据如下:12,15,46,23,15。命令语句如下:
x-c(12,15,46,23,15)? 或?? c(12,15,46,23,15)-x
其中:x为变量名;-与-为赋值符;c( )为向量建立函数,表示把括号中的数据建立为一个向量。
以上命令语句建立了一个数值变量x。
?
2、字符变量
字符变量的建立与数值变量一致。字符串使用引号(单、双均可),如:
y-c(“er”,”sdf”,”eir”,”jk”,”dim”)?? 或?? c(“er”,”sdf”,”eir”, ”jk”,”dim”)-y
将建立字符变量y。
?
3、逻辑变量
逻辑变量中的元素是:TRUE(或简写为T)、FALSE(F)、NA(表示缺省)。
请注意必须都是大写。
逻辑变量可以直接输入,如:
z-c(TRUE,FALSE,F,T,NA)
可建立逻辑变量z。
?
1可以表示T,0可以表示F。所以可以直接写成:
z-c(1,0,0,1,NA)
在计算时,T和F也是当作1和0来用的。?
二、建立数据集
在上面,我们建立起了三个变量:x,y,z。如果要建立起一个三变量的数据集,即含有x、y、z的二维表,则可使用data.frame()函数。当然,在这种情况下,要求变量的长度是一样的。
dd-data.frame(x,y,z)
便可建立数据集dd。
?
edit(dd)
可调用R中的数据编辑器显示、编辑数据集dd。如图2-1。
?
如果eidt( )编辑的是一维的向量,如:edit(x),那么它便会调用记事本来编辑,而不会调用数据编辑器。如图2-2。
图2-1
?
图2-2
?
三、从
文档评论(0)