专题二数据的统计分析.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模专题二 数据的统计分析 引言 内容提纲 1.Matlab相关命令介绍 2.常见概率分布 3.频数直方图与频数表 4.参数估计 5.假设检验 Matlab相关命令 对随机变量x,计算其基本统计量的命令如下: 均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x) 偏度和峰度的说明 Matlab相关命令介绍 Matlab相关命令介绍 Matlab相关命令介绍 Matlab相关命令介绍 Matlab相关命令介绍 Matlab相关命令介绍 常见的概率分布 连续分布:正态分布 正态分布举例 连续分布:均匀分布 连续分布:指数分布 指数分布举例 离散分布:几何分布 离散分布:二项式分布 离散分布: Poisson 分布 Poisson 分布举例 离散分布:均匀分布 抽样分布: ?2分布 抽样分布: F 分布 抽样分布: t 分布 频数直方图或频数表 频数直方图或频数表 频数直方图或频数表 频数直方图或频数表 参数估计 参数估计:点估计 点估计举例 参数估计:区间估计 区间估计举例 假设检验 正态假设检验 正态假设检验举例 正态假设检验举例 x=load(data5.txt); x=x(:); hist(x) fiugre histfit(x) % 加入较接近的正态分布密度曲线 例 5:现累积有100次刀具故障记录,当故障出现时该批刀具完成的零件数见 data5.txt,试画出其直方图。 从图形上看,较为接近正态分布 当我们可以基本确定数据集 X 符合某种分布后,我们还需要确定这个分布的参数。 由于正态分布情况发生的比较多,故我们主要考虑正态分布的情形。 对于未知参数的估计,可分两种情况: 点估计 区间估计 构造样本 X 与某个统计量有关的一个函数,作为该统计量的一个估计,称为点估计。 Matlab 统计工具箱中,一般采用最大似然估计法给出参数的点估计。 泊松分布 P (?) 的 ? 最大似然估计是 指数分布 Exp (?) 的 ? 最大似然估计是 正态分布 N (?, ?2) 中, ? 最大似然估计是 , ?2 的最大似然估计是 x=load(data1.txt); x=x(:); [mu,sigma]=normfit(x) 例 6:已知例 1 中的数据服从正态分布 N (?, ?2) ,试求其参数 ? 和 ? 的值。 使用 normfit 函数 构造样本 X 与某个统计量有关的两个函数,作为该统计量的下限估计与上限估计,下限与上限构成一个区间,这个区间作为该统计量的估计,称为区间估计。 x=load(data6.txt); x=x(:); [mu,sigma,muci,sigmaci]=normfit(x,0.01) 例 8:从自动机床加工的同类零件中抽取16件,测得长度值见 data6.txt,已知零件长度服从正态分布 N (?, ?2) ,试求零件长度均值 ? 和标准差 ? 的置信度为 99% 的置信区间。 对总体的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这就是假设检验问题。 以正态假设检验为例,来说明假设检验的基本过程。 正态假设检验的一般过程: 假设检验:利用 Matlab 统计工具箱给出的常用的假设检验方法的函数 ttest,进行显著性水平为 alpha 的 t 假设检验,以检验正态分布样本 x(标准差未知)的均值是否为 m。运行结果中,当 h=1 时,表示拒绝零假设;当 h=0 时,表示不能拒绝零假设。 对比正态分布的概率密度函数分布图,判断某统计量的分布可能服从正态分布 利用统计绘图函数 normplot 进行正态分布检验 Lxy, China Jiliang Universty 数学建模专题二 -数据的统计分析 Lxy, China Jiliang Universty 现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。 本专题的主要目的是:熟悉各种常见分布的概率密度函数及其曲线,会利用数据分布的形态猜测其分布类型;能够对密度函数进行参数估计;进行简单的正态假设检验。 基本统计量 pdf 概率密度函数 y=pdf(name,x,A) y=pdf(name,x,A,B) 或 y=pdf(name,x,A,B,C) 返回由 name 指定的单参数分布的概率密度,x为样本数据 name 用来指定分布类型,其取值可以是: b

文档评论(0)

wendan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档