- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DAY3-GB-A-05 置信区间
置信区间 (Confidence Intervals);Define;目录;抽样估计: 根据样本提供的信息对总体的某些特征进行
估计或推断。
估计量或统计量: 用来估计总体特征的的样本指标;
总体参数: 待估计的总体指标。
所以对总体数字特征的抽样估计也叫参数估计。
可分为:点估计和区间估计。;区间估计:根据样本估计量以一定可靠程度推断总体
参数所在的区间范围。
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。;设总体参数为θ , θL、 θ U为样本确定的两个样本量,
对于给定的α( 0 < α<1),有
P( θL ≤ θ≤ θ U ) = 1- α
则称( θL ,θ U )为参数θ的置信度为1- α的置信区间。
该区间的两个端点θL 、θ U分别称为置信下限和置信上限,
通称为置信限。
α为显著性水平;
1- α则称为置信度,
; 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。
置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知总体参数的区间。
置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体参数真值。;绝大多数情况下,我们计算95%的置信区间(CI)
这可解释为
100中大约95的CI将包含总体参数,或者
我们95%确信总体参数在此区间内
反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内 (正态分布时 Z= ±2s内的概率约为95%.)
如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%. ;求参数置信区间时可参考下面的通用格式:
置信区间= 统计量±K*(标准误差)
这里,统计量 = 均值、方差、Cp等
K = 基于某统计分布的常数
置信区间反映我们的点估计的样本与样本间的散布
我们将考虑如下的置信区间:
1)总体均值u的置信区间;
2)总体方差σ的置信区间;
3)工程能力Cp的置信区间;
4)总体比例P的置信区间;;;;;;;;;;; 假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。自由度(??为16-1 或 15。 Sigma的 95% (? = .05)置信区间是: ;[ 例题4 ];④结论:样本的标准差是 17.14 , 总体标准差的95%的置信区间在
11.79和31.78之间。;C;我们将定义一个过程,其目标值为70,USL=100,LSL=40.
班上的每个人都从一个平均值=70,标准差=10的分布中产生 20个随机正态数字
假设我们的“真实的”Cp = 1.00.
产生数据后,先用Minitab计算出Cp;
再用前面的公式计算 Cp的95%置信区间;
假设班里的人数为 50,我们期待至少一个 CI 不包含1.00
准备发表你的结果 ;1. 产生20个随机数据,并保存在C1
2. 求其工程能力;3. 统计 → 基本统计量→图形化汇总
4.求总体标准差的置信区间的上限和下限.;总体标准差的置信区间
下限 Sigma 上限 样本大小
8.689 11.425 16.687 20 ;;;1. 在班上随机选了10名学员,调查他们考试总成绩的结果参考下面的数
据。 求总体均值的 95% 置信区间。
730, 640, 540, 880, 710, 660, 890, 910, 430, 590
2. 对某公司的未婚员工的月平均收入进行调查的数据如下。
求出月平均的 收入的标准差的 95% 置信区间。 (单位元)
825, 500, 450, 280, 920, 1010, 590, 770, 860, 740
文档评论(0)