- 1、本文档共173页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch1数据和数据展示课案
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 数据A 数据B 数据C 数据D 数据A、B、C、D的频数图 变量之间的因果关系 固定资产投资增加和GDP增长 二氧化碳排放量和平均气温上升 吸烟数量和年限与肺癌的发病率 变量之间的统计关系 海水平均温度与灾害性天气天数(厄尔尼诺现象) 公司高尔夫球水平与公司股票市场表现 超市啤酒销售量和纸尿布销售量 具有因果关系的变量不一定有统计关系,有统计关系的变量也不一定有因果关系。 了解变量的统计关系对管理决策具有重要意义。 变量之间的统计关系 变量的相关系数 中国足球超级联赛2006赛季15支球队战绩统计数据如下: 中国足球超级联赛(简称“中超”)“进球数” 和“平均进球数” 的相关系数为0.999,它们的散点图如下。可以看出它们正相关: “进球数”和“失球数”的相关系数为-0.453,可以看出它们负相关。 “负场次”和“积分”的散点图,相关系数为-0.929。可以看出它们负相关。 “失球数”和“平均积分”的散点图,相关系数为-0.808。可以看出它们负相关。 相关(Correlation)就是两个变量之间存在线性关系。相关系数(Correlation Coefficient)用来测定两个变量之间的相关程度。变量X与Y的总体相关系数为: 其中, 称为协方差(Covariance),μx,μy,σx,σy分别是变量X和Y的平均值和标准差。 类似地,样本的相关系数为: 相关系数在-1和+1之间。相关系数表示两个变量之间是否线性关系,是正线性关系还是负线性关系。 即 x y r0 r0 r=0,两个变量完全没有线性关系; r=1,两个变量有完全的正线性关系; r=-1,两个变量有完全的负线性关系; r越接近0,变量的线性关系越弱; r越接近+1或-1,变量的线性关系越明显; 计算两个变量的相关系数的函数是CORREL; 多个变量,其中两两的相关系数组成相关矩阵。相关矩阵可以用Excel菜单:“工具/数据分析/相关系数”得到。 选择“相关系数” 选择变量范围,“输出选项”选择“新工作表组”,单击“确定”。 得到变量“胜”、“平”、“负”、“进球”、“失球”、“平均进球”、“平均失球”、“积分”的相关矩阵。 计算两个变量相关系数的Excel函数为:CORREL。例如,计算变量“进球”和变量“平均进球”的相关系数: CORREL(G4:G18,J4:J18)=0.9986。 * * * * * * * * * * * * * * * * * 得到饮料销售量356个数据的频数和频数直方图: $J$2 在指定位置J2生成发生频数统计表和频数直方图 接收(箱) 频率(天) 累积 % 130 1 0.27 140 9 2.74 150 41 13.97 160 61 30.68 170 40 41.64 180 37 51.78 190 26 58.90 200 30 67.12 210 39 77.81 220 36 87.67 230 24 94.25 240 14 98.08 250 6 99.73 260 1 100.00 其他 0 100.00 合计 365 注:Excel2003中文版直方图工具输出结果中,frequency误译为“频率”,在统计学中应译为“频数”。 用Excel函数FREQUENCY生成数据频数图 先用鼠标选择准备好的频数区域I2:I15,然后在函数栏中输入函数“=FREQUENCY( )”。从提示可以看出,这个函数有两个参数,第一个参数data_array为销售量 B2:B366,第二个参数bin_array为区间H2:H15。 输入完毕后,按组合键“CTRL+SHIFT+ENTER”,频数就出现在I2:I15区域中。 Excel有一些函数,它们的输出结果不是产生的一个单元格中,而是同时产生的一个区域中,这样的函数称为“向量函数”。FREQUENCY就是一个向量函数。 绘制I2:I15频数柱形图如图1.54,得到和“工具数据分析直方图”同样的结果。 数据的分布属性 数据的分布属性包括数据的集中属性、数据的分散属性以及数据频数的形态三大类: 数据集中属性的指标 均值 Average 中位数 Median 众数 Mode 数据的分散属性的指标 极差 Range 方差 Va
您可能关注的文档
- ch07-2康华光数字电子技术第六版.ppt
- ch05_FSM.ppt
- ch06-6康华光《数字电子技术》第六版.ppt
- CFB锅炉的调试与运行PPT2013.11.ppt
- ch14.触发器和时序逻辑电路(修改).ppt
- 八上2.3.pptx
- CH12西北工业机械设计ppt.pptx
- 八年级-2.2.2三种乐器-控制变量法.ppt
- 八大浪费课程.ppt
- 八年物理竞赛选拔赛试题.doc
- 2020版 沪科技版 高中生物学 必修2 遗传与进化《第4章 生物的进化》大单元整体教学设计[2020课标].docx
- 情绪价值系列报告:春节消费抢先看-国证国际证券.docx
- 精品解析:北京市东直门中学2023-2024学年高二下学期3月阶段性考试(选考)物理试题(解析版).docx
- 2020版 沪科技版 高中生物学 必修2 遗传与进化《第4章 生物的进化》大单元整体教学设计[2020课标].pdf
- 2020版 沪科技版 高中生物学 选择性必修1 稳态与调节《第1章 人体的内环境和稳态》大单元整体教学设计[2020课标].pdf
- 2020版 沪科技版 高中生物学 选择性必修1 稳态与调节《第1章 人体的内环境和稳态》大单元整体教学设计[2020课标].docx
- 液冷盲插快接头发展研究报告-全球计算联盟.docx
- 精品解析:北京市东直门中学2023-2024学年高二下学期3月阶段性考试(选考)物理试题(原卷版).docx
- 精品解析:北京市东直门中学2024届高三考前练习数学试卷(解析版).docx
- 2020版 沪科技版 高中生物学 选择性必修1 稳态与调节《第2章 人体的神经调节》大单元整体教学设计[2020课标].docx
文档评论(0)