- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3单元 数据的采集与统计分析
第3章 数据的采集与统计分析 主要内容 3.1 数据的采集 3.2 分布的识别 3.3 参数估计 3.4 拟合度检验 3.5 随机变量的生成 引言 引言 引言 常用随机分布 离散 两点分布 二项式分布 泊松分布 引言 常用随机分布 连续 均匀分布 指数分布 正态分布 韦伯分布 3.1 数据的采集 什么是数据采集? 数据采集的意义? 数据采集的基本态度? 3.1 数据的采集-技巧 做好模拟计划,详细规划模拟所需要收集的数据 确定应该收集些什么样的数据、何时进行采集以及以什么样的方式进行采集。 数据采集的类型应该尽量广泛,而不应该仅仅局限于实际建模时要用到的数据类型。 例如,在采集工人使用机床加工零件的时间时,如果除了采集工人加工一个零件所使用的时间外,同时再采集一些诸如工人的性别、年龄、身体状况等辅助数据,这样在以后的数据分析中如发现某些数据与其它数据有明显差异,就可利用辅助数据,判别数据是否具有合理性与代表性,或者指导我们对所采集数据进行合理的修正。 数据采集的时间应有一定的跨度,以免所采集的样本数据带有某种片面性。 为了对某个交通道口的堵车情况进行模拟,采集车流数据的时间不能只是在一天中的某一段时间,如早晨,也不能只是在一个星期中的某一天 3.1 数据的采集-过程监控 由于数据的采集工作可能并不是进行一次就能完成的,而是可能历时几天、几个星期甚至几个月。 一般讲,系统在不同时间所处的环境不同,而在不同环境下采集的数据会有一定的统计差异性。 我们要知道在数据采集过程中,所采集的数据是否具有统计上的一致性,或者说在采集过程中系统的特征是否发生了变化。 可以运用控制图对数据的采集过程进行监控。 3.1 数据的采集-过程监控 主要对数据样本的均值与极差进行监控 先确定一个数据采集的初始阶段,在这阶段中采集到的数据用于建立控制图,为以后的采集过程的监控提供依据。 假设在初始阶段我们已采集到了N个数据,将这N个数据按采集的顺序分成k批,每批n(一般取n =5或6为好)个数据。 记第i批第j个数据为xij,则我们可以计算出每批的均值 极差 3.1 数据的采集-过程监控 批均值的平均值和极差的平均值 的控制限为 R的控制限为 3.2 分布的识别-数据特征分析 数据特征分析的目的是帮助我们用一些简单的统计特征指标来描述大样本数据,从而揭示样本数据的一些基本特征。 样本均值、中位数、方差、偏差系数 、莱克塞斯比率、偏斜系数 3.2 分布的识别-直方图 对于离散系统的统计分析中,一般用频率统计的分析方法来计算分布函数。其图形描述用的就是直方图。 3.2 分布的识别-直方图分组区间数量的选取 分组区间的组数依赖于观察次数以及数据的分散或散布的程度。 一般分组区间组数近似等于样本量的平方根。即: 3.2 分布的识别- 直方图分组区间数量的选取 合适的区间选择(m值)是直方图制作,分布函数分析的基础。 3.3 参数估计-作用 通过对随机过程的样本值的直方图分析,我们已经得到了随机过程的分布假设,即假设随机过程的概率分布符合某一种标准随机分布。这是一种定性分析的结果。 在给定了一种随机分布函数后,需要进一步获取这一分布函数的特征参数 在收集到的实际系统随机变量的实际数据基础上,对分布类型重点未知总体参数进行估计的过程称为参数估计 3.3 参数估计-分布参数的类型 位置参数γ 确定分布函数取值的范围 当γ变化时,分布函数仅仅在坐标系上的位置发生变化 比例参数β 用于确定在分布范围内取值的大小比例 β的改变只压缩或扩张分布函数,不改变其基本形状 形状参数α 是决定分布函数基本形状,从而改变分布函数性质的参数 3.3 参数估计-方法 矩估计法、极大似然法、最小二乘拟合估计 模拟中常用的一些分布参数建议值 3.4 拟合度检验 为了测试随机样本量为n的随机变量X服从某一特定分布形式的假设,常用?2拟合度检验。 这种检验方法首先是把n个观察值分成k个分组区间或单元。检验的统计量由下式给出(k为分布的阶数) 式中,Ni是在第i个分组区间的观察频数。 Ni = ni /n 3.4拟合度检验-拟合程度的判定 3.4 拟合度检验-指定拟合度的检验 我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数?,根据设定的显著性指数?以及?2分布的自由度数f = k-s-1,可以查?2表得到??,f2 。 如果 则检验未通过,H0不成立。 如果 则检验通过, H0成立。 3.5 随机变量的生成 概述 随机数的生成 随机数的检验 随机变量的生成 3.5.1 概述-随机变量
文档评论(0)