- 1、本文档共80页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sas软件与统计应用教程ss软件与统计应用教程sas软件与统计应用教程sas软件与统计应用教程
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形 2.1 描述性统计的基本概念 2.1.1 统计学的基本概念 2.1.2 表示数据位置的统计量 2.1.3 表示数据分散程度的统计量 2.1.4 表示数据分布形状的统计量 2.1.5 其它统计量 2.1.1 统计学的基本概念 1. 总体与样本 总体(population):总体是指所研究对象的全体组成的集合。 样本(sample):样本是指从总体中抽取的部分对象(个体)组成的集合。样本中包含个体的个数称为样本容量。容量为n的样本常用n个随机变量X1,X2,…,Xn表示,其观测值(样本数据)则表示为x1,...,xn,为简单起见,有时不加区别。 2. 参数与统计量 参数(parameter):参数是用来描述总体特征的概括性值。如总体平均值(μ)、总体方差(?2)、总体比例(π)等。 统计量(statistics):统计量是用来描述样本特征的概括性值。如样本均值( )、样本方差(s2)、样本比例(P)等。 2.1.2 表示数据位置的统计量 如果要用简单的数字来概括一组观测数据x1,...,xn,可以使用“位置统计量”来作为数据的总体代表,常见的位置统计量有:均值、中位数、分位数、众数等。 1. 均值(Mean) 均值是所有观测值的平均值,是描述数据取值中心位置的一个度量: 2. 中位数(Median或Med) 中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点是它不受个别极端数据的影响,具有稳健性。中位数的计算方法是:首先将数据从小到大排序为:x(1),...,x(n),然后计算 3. 众数(Mode) 观测值中出现最多的数称为众数。众数用得不如均值和中位数普遍。在属性变量分析中,常需考虑频数,因此众数用得多些。 4. 百分位数(Percentile) 分位数也是描述数据分布和位置的统计量。0.5分位数就是中位数,0.75分位数和0.25分位数又分别称为上、下四分位数,并分别记为Q3和Q1。 2.1.3 表示数据分散程度的统计量 1. 极差(Range)与半极差(Interquartile range) 极差就是数据中的最大值和最小值之间的差: 极差 = max{xi} – min{xi} 上、下四分位数之差Q3 – Q1称为四分位极差或半极差,它描述了中间半数观测值的散布情况。 2. 方差(Variance或Var) 方差是由各观测值到均值距离的平方和除以观测量减1: 3. 标准差(Standard deviation或Std Dev) 方差的开方称为标准差: 标准差的量纲与原变量一致。 4. 变异系数(Coefficient of Variation或CV) 变异系数是将标准差表示为均值的百分数,是观测数据分散性的一个度量,它在比较用不同单位测量的数据的分散性时是有用的: 2.1.4 表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。 1. 偏度(skewness) 偏度是刻画数据对称性的指标。偏度的计算公式为: 在SAS中: ● 关于均值对称的数据其偏度为0; ● 左侧更为分散的数据,其偏度为负,称为左偏; ● 右侧更为分散的数据,其偏度为正,称为右偏。 2. 峰度(kurtosis) 峰度描述数据向分布尾端散布的趋势。峰度的计算公式为: 利用峰度研究数据分布的形状是以正态分布为标准(假定正态分布的方差与所研究分布的方差相等)比较两端极端数据的分布情况,若 ● 近似于标准正态分布,则峰度接近于零; ● 尾部较正态分布更分散,则峰度为正,称为轻尾; ● 尾部较正态分布更集中,则峰度为负,称为厚尾。 2.1.5 其它统计量 1. 均值的标准误(Std Error Mean或Std Mean或Std error) 2. 校正平方和(Corrected sum of squares) 3. 未校正平方和(Uncorrected sum of squares) 4. k阶原点矩 其中A1即为均值 。 5. k阶中心矩 2.2 在SAS中计算统计量 2.2.1 用INSIGHT计算统计量 2.2.2 用“分析家”计算统计量 2.2.3 编程实现描述性统计 2.2.1 用INSIGHT计算统计量 INSIGHT可以非常方便地计算各种统计量。 1. 实例数据 【例2-1】表2-1为
您可能关注的文档
- qc七大手法-培训版qc七手法-培训版qc七大手法-培训版qc七大手法-培训版.ppt
- qml入门教程.doc
- pra设计 第 2 章 速实训pra设计 第 2 章 速写实训pra设计 第 2 章 速写实训pra设计 第 2 章 速写实训.ppt
- qms---qp-015采控制程序qms---qp-015采购控制程序qms---qp-015采购控制程序qms---qp-015采购控制程序.doc
- qc质量检验员培训教程qc量检验员培训教程qc质量检验员培训教程qc质量检验员培训教程.ppt
- qcc实施相关表格qcc实相关表格施相关表格.doc
- qp-10(d1)基础设施理 newqp-10(d1)基础设施管理 newqp-10(d1)基础设施管理 newqp-10(d1)基础设施管理 new.doc
- qe大潮退却 美联储引而不qe大潮退却 美联储引而不发qe大潮退却 美联储引而不发qe大潮退却 美联储引而不发.doc
- ps教案--修复画笔工具组s教案--修复画笔工具组ps教案--修复画笔工具组ps教案--修复画笔工具组.ppt
- qq餐厅问题答案(按菜名字排序)qq餐厅问题答案(按菜名字母排序)qq餐厅问题答案(按菜名字母排序)qq餐厅问题答案(按菜名字母排序).doc
- 书面表达之建议信(讲义)-中考英语一轮复习(含答案).pdf
- 中考历史复习小众题型类:填空题、改错题、判断题(70题).pdf
- 2024年吉林省县乡教师选调考试《教育学》真题汇编带解析必背【基础题】.pdf
- 2025年中考语文备考之《朝花夕拾》名著导读及考题.pdf
- 小说标题的含义和作用(模拟突破)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 阅读理解之应用文(练习)-中考英语一轮复习(含答案).pdf
- 小说情节作用(模拟突破)-2025年中考语文考点突破之小说阅读(原卷版).pdf
- 小说段落作用(模拟突破)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 小说段落作用(试题专练)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 2025年上海市16区初三语文一模试题汇编之现代文阅读二(记叙文)学生版.pdf
最近下载
- 2025年八省联考山西陕西宁夏青海高考化学试卷(含答案解析).docx
- 一元二次方程的解法——配方法ppt省公开课获奖课件说课比赛一等奖课件.pptx
- 国家及行业标准_J-B_T 5285-2008 真空净油机.pdf
- 必威体育精装版通用BIQS审核检查表中英文版.xlsx
- 老年学概论(第3版) 第十二章.ppt VIP
- 卫生部临床路径全部病种目录(含病种名称、ICD码及文件号)--吐血整理.pdf VIP
- 大学考试试卷《安全监测监控技术》及参考答案.doc VIP
- 全国性行业协会商会参考名单.pdf
- 公司基本情况介绍范文(二篇).pdf
- 某市人大2024年贯彻落实中央八项规定精神情况报告.docx VIP
文档评论(0)