- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
消费者对新款车型打分 满分10 一款车7.5分,另一款车5分 该投产那款? 得5分的可能是1半人打了9分和10分,另外一半人打了1分和0分 有人狂热喜欢,有人极端厌恶! 得7.5分的可能每个人都打了7分或8分,没有人讨厌,但也没有激情 推出了80%不喜欢20%为之疯狂的车型,极大的提高了市场占有率 4.3 数据变换 改变数据尺度和分布的变换 改变变量连续性的变换 曲线化直变换 增加数据可解释性的变换 改变数据尺度和分布的变换 标准化-zScore 极差-range 0,1 均匀化 标准差变换 极差变换 均匀化 反余弦和反正弦 平方根 对数变换 连续变量转换为离散变量 曲线化直 * 与概念相关的变量术语在概论中我们已经介绍过了 * 对于得到的数据,例如纸张指标的测定结果,考试成绩,工资收入与食物购买等,我们考虑的问题不同。。。 * 在“概率论与数理统计”,我们已经学过。。 * 草地蝗虫的例子 * 费歇耳(Fisher,1954)认为,由于莱伊尔(Lyell,1833)的贡献,地理学已逐步成为一间较为定量的科学。反对这种发展的势力很快达到如此的地步,他们竟然将莱伊尔精心编制的第三纪地层划分表和统计论证(长达60页)从他的《地质学原理》一书以后的版本中删去了。 * 1.等可能。结果是:朝上的面是正正、反反、正反和反正 ,1/4 2. 13/52+4/52-1/4x1/13=4/13 * 主观性 推理和背景知识很重要 * 2007-10-25 begin * 对于药物的不良反应率来说,平均1%可能太低了。 但是,对于人的体重来说,精度1%则已经很高了。 由于不同的测量或使用设备的差异,并不是每次测量得到的结果都会相同。由此会产生一些不确定性。 描述性统计,是从调查/观测中学习的第一步。 * 我们必须考虑数据的分布。 例如,失业率1%,必须知道该值在多大的范围内变化。是10-0%,还是0-2%之间? * 累计频率百分比 * QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图. 要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值. * 参Spss中的描述性统计-探索性分析 问题 有没有关系 关系是否显著 关系是直接还是间接的 影响方式如何 两两变量的关系 两组变量的关系 x4 X1 + P=0.001 X2 ? ? x3 2.2 因子分析 使用数学方法建立起来的通过变量相互组合而形成的模型 观察到的变量之间的关系可以用潜在的不能观察的变量来描述,这些不能观察的变量往往与现象背后的过程相联系。 因子分析 问题 相关的变量可以形成组合吗? 怎么解释这种组合? 这种组合与什么过程有联系? X1 X2 x3 F1=f(x1,x2,x3) F2=f(x1,x2,x3) F3=f(x1,x2,x3) X1:O X2:H X3:N F1=f(x1,x2) F2=f(x1,x3) F3=f(x1,x2,x3) 2.3 回归分析 使用统计回归方法,建立起的因变量与解释变量之间的关系表达式 Y=f(x1,x2,…,xn) 多元回归 逐步回归 岭回归 逻辑回归 问题 关系表达式是什么? 线性的还是非线性的 显著性如何? 解释变量的独立性如何? 简约的? 是否满足假设条件? Y x2 + P=0.001 x1 ? x3 ? ? P=0.1 P=0.8 小结 相关模型-因子模型-回归模型之间的联系是什么? 描述性统计与推断性统计的区别联系是什么? 什么是总体普查 总体和样本之间有什么联系,为什么要进行采样估计? 三 建模方法和步骤 建模方法 建模步骤 3.1 建模方法 实验设计 观察 统计描述 统计推断 实验设计 重复性 随机性 分组 观察 统计描述 统计推断 参数估计 假设检验 统计关系与确定关系 在经典的物理学中,变量之间具有函数关系,这种关系是确定性的。在统计学中,我们依赖的是统计关系,主要处理的是随机变量,即有概率分布的变量。而在确定性关系中,变量不是随机的 “一个统计关系,不管多强,也不管多么有启发性,永远不能确定因果方面的联系。对因果关系的确定,必须来自于统计学以外,最终来自这种或那种理论”(Kendall,1961) 3.2 建模步骤 参数选择 运行模型 结果检验 问题定义 概念模型 数学模型 数据整理 数据预处理 数据整理 变量命名是否规范 明确变量的测量尺度和数据类型 检查样本 编码 数据录入 填写说明日志 四、数据预处理 统计特征描述 正态分布检验 数据变换 4.1 统计特征描述 -描述性统计分析 平均特征描述 期望(Expected Value) 均值(Mean
您可能关注的文档
最近下载
- 第一单元龙的传人第1课我的名字 教案(表格式)一年级美术人教版(2024版).docx
- 广州数控GSK988Ti系列 编程操作手册2017年1月.pdf
- 台达伺服ASDA-AB系列应用技术手册.pdf
- (宪法)完整版课件.ppt
- 20241103-高盛-美国经济分析:2025年消费支出展望,回归正常稳健增速(摘要).docx VIP
- 高盛-中国房地产行业2025年展望-触底在望(摘要).pdf VIP
- 张毅—潜在失效模式与效应分析(三)课件.pptx VIP
- 茶文化考核试题及答案.pdf VIP
- 人教版(2024)七年级地理上册4.2《气温的变化与分布》优质课件.pptx
- 教科版科学三年级上册2空气占据空间吗 (说课课件)(共13张PPT).pptx
文档评论(0)