网站大量收购闲置独家精品文档,联系QQ:2885784924

核密度估计.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
核密度估计

核密度估计对于一组关于和观测数据,我们假设它们存在如下关系:,通常我们的目的在于估计的形式。在样本数量有限的情况下,我们无法准确估计的形式。这时,可以采用非参数方法。在非参数方法中,并不假定也不固定的形式,仅假设满足一定的光滑性,函数在每一点的值都由数据决定。显然,由于随机扰动的影响数据有很大的波动,极不光滑。因此要去除干扰使图形光滑。最简单最直接的方法就是取多点平均,也就是每一点的值都由离最近的多个数据点所对应的值的平均值得到。显然,如果用来平均的点越多,所得的曲线越光滑。当然,如果用个数据点来平均,则为常数,这时它最光滑,但失去了大量的信息,拟合的残差也很大。所以说,这就存在了一个平衡的问题,也就是说,要决定每个数据点在估计 的值时要起到的作用问题。直观上,和点越近的数据对决定的值所应起越大的作用,这就需要加权平均。因此,如何选择权函数来光滑及光滑到何种程度即是我们这里所关心的核心问题。一、核密度估计对于数据,核密度估计的形式为:这是一个加权平均,而核函数(kernal function) 是一个权函数,核函数的形状和值域控制着用来估计在点的值时所用数据点的个数和利用的程度,直观来看,核密度估计的好坏依赖于核函数和带宽的选取。我们通常考虑的核函数为关于原点对称的且其积分为1,下面四个函数为最为常用的权函数:Uniform:Epanechikov:Quartic:Gaussian:对于均匀核函数,作密度函数,则只有的绝对值小于1(或者说离的距离小于带宽的点)才用来估计的值,不过所有起作用的数据的权重都相同。对于高斯函数,由的表达式可看出,如果离越近,越接近于零,这时密度值越大,因为正态密度的值域为整个实轴,所以所有的数据都用来估计的值,只不过离点越近的点对估计的影响越大,当很小的时侯,只有特别接近的点才起较大作用,随着增大,则远一些的点的作用也随之增加。如果使用形如Epanechikov和Quartic核函数,不但有截断(即离的距离大于带宽的点则不起作用),并且起作用的数据他们的权重也随着与x的距离增大而变小。一般说来,核函数的选取对和核估计的好坏的影响远小于带宽h的选取。二、带宽的选取带宽值的选择对估计量的影响很大,如果太小,那么密度估计偏向于把概率密度分配得太局限于观测数据附近,致使估计密度函数有很多错误的峰值,如果太大,那么密度估计就把概率密度贡献散得太开,这样会光滑掉的一些重要特征。所以,要想判断带宽的好坏,必须了解如何评价密度估计量的性质。通常使用积分均方误差,作为判断密度估计量好坏的准则。,其中,称作渐进均方积分误差。要最小化,我们必须把设在某个中间值,这样可以避免有过大的偏差(太过光滑)或过大的方差(即过于光滑)。关于最小化表明最好是精确地平衡中偏差项和方差项的阶数,显然最优的带宽是 (1)以下是几种常用的贷款选择方法: 1、拇指法则简便起见,我们定义,针对最小化AMISE得到的最优带宽中含有未知量,Silverman提出一种初等的方法,rule of thumb(拇指法则,即根据经验的方法):把用方差和估计方差相匹配的正态密度替换,这就等于用估计其中为标准正态密度函数,若取K为高斯密度核函数而使用样本方差,Silverman 拇指法则得到2、Plug-in 方法该方法即是所谓的代入法,其考虑在最优带宽中使用某适当的估计 来代替,在众多的方法中,最简单且最常用的即是Sheather and Jones (1991;JRSSB)所提出的而的基于核的估计量为其中为带宽,为用来估计的核函数。在对其平方并对积分后即可得到。估计的最优带宽和估计或的最优带宽是不同的。根据理论上以及经验上的考虑,Sheather and Jones 建议用简单的拇指法则计算带宽,该带宽用来估计,最后通过(1)式来计算带宽。

文档评论(0)

zhanghc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档