网站大量收购闲置独家精品文档,联系QQ:2885784924

R语言常用统计方法实现.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R中内嵌的分布 R提供了四类有关统计分布的函数: 密度函数、(累积)分布函数、分位数函数、随机数函数. 它们都与分布的英文名称(或者其缩写)相对应. 对于所给的分布名称,加前缀“d”就是密度函数(对于离散分布, 指分布律);加前缀“p”就是分布函数; 加前缀“q”就是分位数函数; 加前缀“r”就是随机数发生函数. 这四类函数的第一个参数是有规律的: 形为dfunc的函数为x,pfunc的函数为q,qfunc的函数为p,rfunc的函数为n(但rhyper和rwilcox是特例,他们的第一个参数为nn). 若R中分布的函数名为func, 则四类函数的调用格式为: 1) 概率密度函数: dfunc(x, p1, p2, ...), x为数值向量; 2) (累积)分布函数: pfunc(q, p1, p2, ...), q为数值向量; 3) 分位数函数: qfunc(p, p1, p2, ...), p为由概率构成的向量; 4) 随机数函数: rfunc(n, p1, p2, ...), n为生成数据的个数, p1, p2, . . .是分布的参数值. R提供的常用分布(要加前缀) 分布名称 R名称 选项 beta beta shape1, shape2 binomial binom size, prob Cauchy cauchy location=0, scale=1 chi-sqaured (?2) chisq df, ncp exponential exp rate Fisher-Snedecor (F) f df1, df2, ncp gamma gamma shape, scale=1 geometric geom prob hypergeometric hyper m, n, k lognormal lnorm meanlog=0, sdlog=1 logistic logis location=0, scale=1 multinomial multinom size, prob normal norm mean=0, sd=1 negative binomial nbinom size, prob Poisson pois lambda Students (t) t df uniform unif min=0, max=1 Weibull weibull shape, scale=1 Wilcoxons statistics wilcox m, n signrank n 茎叶图 茎叶图也是考查数据分布的重要方法 R中用stem()制作茎叶图: stem(x, scale = 1, width = 80, atom = 1e-08) 其中x是数据向量,scale控制茎叶的长度,width控制宽度, atom控制容差;如果选择scale = 2,即将10个个位数分成两段,0?4为一段,5?9为 另一段 . x-c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84, 84,84,85,86,86,86,87,89,89,89,90,91,91,92,100) stem(x) stem(x, scale = 2) stem(x, scale = .5) 直方图 直方图是探索性数据分析的基本工具,它给出了数据的频率分布图形,在组距相等场合下常用宽度相等的长条矩形表示,矩形的高低表示频率的大小在图形上,横坐标表示所关心变量的取值区间,纵坐标表示频率或频数的大小。这样就得到频数或频数直方图。图形的形状与我们选择的各组区间端点 有关,故选择区间端点时我们要谨慎。 R中使用函数hist( )来画直方图,其常用的调用格式如下: hist(x, breaks = Sturges, freq = NULL, probability = !freq,col = NULL,main = paste(Histogram of , xname),xlim = range(breaks), ylim = NULL,xlab = xname, ylab,axes = TRUE, nclass = NULL) 说明:若选项breaks取向量,则用于指明直方图区间的分割位置; 若取正整数,则用于指定直方图的小区间数. freq取T表示使用频数画直方图, 取F则使用频率画直方图. probability与freq恰好相反. col用于指明小矩形的颜色. 直方图示例 已知15位学生体重w w - c(75.0, 64.0, 47.4, 66.9, 62.2,

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档