- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]5-5充分统计量
充分统计量 1 充分性的概念 2 因子分解定理 充分性的概念 引例 为研究某个运动员的打靶命中率,我们对该运动员进行测试,观测其10次,发现除第三、六次未命中外,其余8次都命中。这样的观测结果包含了两种信息: (1)打靶10次命中8次; (2)2次不命中分别出现在第3次和第6次打靶上。 第二种信息对了解该运动员的命中率是没有什么帮助的:设想我们对该运动员的观测结果是第一、二次未命中,其余都命中,虽然样本观测值是不一样的,但他们提供的关于命中率的信息是一样的。 因此,在绝大多数实际问题中,试验编号信息常常对了解总体或其他参数是无关紧要的,所以人们通常在试验前对样品进行随机编号。 一般地,设我们对该运动员进行n次观测,得到 ,每个 取值非0即1,命中为1,不命中为0。 令 ,T为观测到的命中次数,在这种场合仅仅纪录使用T不会丢失任何与命中率有关的信息,统计上将这种“样本加工不损失信息”称为“充分性”。 我们知道,样本 有一个样本分布 ,这个分布包含了样本中一切有关 的信息。 而统计量 也有一个抽样分布 ,当我们期望用统计量 代替原始样本 并且不损失任何有关 的信息时,也就是期望抽样分布 像 一样概括了有关 的一切信息。 从概率层面对之进行分析: 依赖于参数 ,此条件分布仍含有 的信息; 不依赖于参数 ,此条件分布已不含有 的信息。 换言之,我们考察在统计量 的取值为 的情况下样本的条件分布 可能有两种情况: 当已知统计量 的取值之后,也就知道了样本中关于 的所有信息,这正是统计量具有充分性的含义。 后者表明,条件 的出现使得从样本分布 到条件分布 ,有关 的信息消失了,这说明有关 的信息都含在统计量 之中。 例 设总体为两点分布 , 为样本令 ,则在给定 的取值 后,对任意的一组 ,有 , = = = = = 该条件分布与 无关。若令 ,由于 只是用了前面两个样品观测值,显然没有包含样本中所有关于 的信息,在给定 的取值 后,对任意的一组 = 有 = = 这个分布依赖于未知参数 ,这说明样本中有关于 的信息没有完全包含在统计量 中。 定义 设 是来自某个总体的样本,总体分布函数为 ,统计量 称为 的充分统计量,如果在给定 的取值后, 的条件分布与 无关。 应用中条件分布可用条件分布列或条件密度函数来表示。 例3 设 是来自 的样本, 则 ,易计算 = 该分布与 无关,这说明 是 的充分统计量。 其中最后一个等式成立是因为有如下的平方和分解: = 因子分解定理 在统计学中有一个基本原则:在充分统计量存在场合,任何统计推断都可以基于充分统计量进行,这可以简化统计推断的程序,通常将该原则称为充分性原则,然而在一般场合直接由定义出发验证一个统计量是充分的是困难的,因为条件分布的计算通常不那么容易。 幸运的是,我们有一个简单的办法判断一个统计量是否充分,这就是--因子分解定理,它由统计学家奈曼(Neyman)给出。 在连续型场合, 表示 的概率密度函数: 为简便起见,我们引入一个在两种分布类型通用的概念——概率函数。 称为随机变量 的概率函数: 在离散型场合, 表示 的概率分布列。 设总体概率函数为 , 为样本,则 为充分统计量的充分必要条件是:存在两个函数 和 使得对任意的 和任意一组观测值 ,有, 其中 是通过统计量 的取值而依赖于样本的。 因子分解定理 证明 此处给出离散型随机变量下的证明, 此时, 与 无关,记为 或 , 令
文档评论(0)