- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
贝叶斯统计与经典统计比较.doc
贝叶斯统计与经典统计比较
摘 要:贝叶斯统计与经典统计学作为当今统计学两个重要的分支,本文就对经典统计学派和贝叶斯统计学派在思想和方法上的联系与区别进行了比较分析。
关键词:贝叶斯;经典统计;统计思想;统计方法
贝叶斯方法是由英国学者Bayes在其发表的论文《论有关的机遇问题的求解》中提出来的,并且在和经典学派的争论中发展起来。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两统计学派的比较研究中发现,相比于经典统计方法,贝叶斯统计方法在直观性、易于理解等很多方面更具有优势。
一、 基本理论的差异
1.概率的解释不同
一直以来,经典统计学派对贝叶斯统计的主要批评在于贝叶斯统计在概率理解上的“主观性”。经典统计学认为概率必须是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。贝叶斯统计是完全同意概率公理化,但认为概率也可以用经验确定,一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。
2.统计推断利用的信息不同
贝叶斯统计与经典统计在统计推断最主要的不同在于贝叶斯统计运用先验信息。经典统计学的统计推断是基于总体信息和样本信息。总体信息即总体分布或总体所属分布族中包含的信息,包括总体认识、参数范围、变量的方式和特征等;样本信息是从总体中抽取的样本中所包含的信息,这是最“新鲜”的信息。而贝叶斯统计方法在此基础上还利用了先验信息,先验信息主要来源于经验和历史资料。
3.样本和总体参数的利用与认识不同
经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”,即只靠考已经出现的数据(样本观测值),而认为未出现的数据与推断无关。基于在样本利用方式上的差异,使得贝叶斯统计不承认经典统计中的“无偏性”这一评判标准。
三、点估计与区间估计
1.贝叶斯定理与似然函数
贝叶斯定理是贝叶斯统计学的理论基础,贝叶斯公式的密度函数表示形式为:
θ为模型的参数向量,x表示为数据向量,即样本观察值,其中,函数 p(x |θ )集中了总体信息和样本信息,被称为似然函数,它是未知参数θ 的函数。
在似然函数上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ 的函数,而样本x 在似然函数中是一组观察值,所有与试验有关的θ的信息都被包含在似然函数之中,使似然函数值达到最大的θ 值有比其他θ 值更大的说服力,此θ 值即为经典统计中的最大似然估计;而我们可以证明,在贝叶斯统计中,当在“无信息 ”的条件下, θ 的最大后验估计就是经典统计中的最大似然估计。
在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。
2.置信区间
在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。例如,一家电生产企业为估计其产品的平均寿命的可信区间。贝叶斯统计中的可信区间由后验分布求得,参数被认为是随机变量,因此我们可以说,平均寿命θ 落入最终区间的概率是90%。而在经典统计中,参数θ 是一个常量,而求出的置信区间要么包含平均寿命 θ ,要么θ 在此区间之外,很多人在实际应用经典统计的过程中,误把置信区间理解为平均寿命θ 落入某个区间的概率是90%,而事实上,我们只能说重复做100 次此实验,大约有90 次求出的置信区间能使之包括真实的产品寿命θ ,而这对于只做一两次实验的人来说是毫无意义的。
相反,贝叶斯统计的方法清晰明了,而且在置信区间的寻求和计算上也简单得多。在条件方法下,对给定的样本x和可信水平1-α通过后验分布可求的具体的可信区间,计算方便。而在经典统计中寻求置信区间有时是困难的,要构造一个枢轴量(含有被估参数的随机变量),使它的分布不含有未知数。这是一项技术很强的工作,比求可信区间复杂的多。
四、假设检验
1.基本检验思想的比较
经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0 为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(X|H0 为真),X 是样本向量。
而在贝叶斯统计中,可以直接求得在样本X 给定的条件下,参数的后验概率,因而得出H0 和H1 和后验概率,即判定的是P(H0 为真|X)和P(H
文档评论(0)