- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
線性模型参数的多种估计方法的随机模拟
线性模型参数的多种估计方法的随机模拟问题的陈述:人们常常使用线性模型对数据进行回归与预测,在假定了数据的自变量X与响应变量Y具有线性关系Y=之后,我们可以对参数值进行估计,从而达到对模型进行估计的效果。这是本次模拟要处理的主要问题,即各种估计方式的优劣判别。目的的陈述:对于给定的数据X,Y(两列数据),我们将对4种距离:d1(a, b)=|(y – a – b*x)/|;d2(a, b)=|(y – a – b*x)|;d3(a, b)=|(y – a – b*x)/b|;d4(a, b)=||与3种计算方式、、(每个元素平方)进行优劣比较。试验的设计:对一组给定的数据X,Y,我们将通过极小化目标函数f1、f2、f3的方式来求得a与b。第零部分,比较通过随机数产生的样本点与固定样本点对参数估计带来的影响。第一部分,比较距离函数d1、d2、d3、d4对参数估计带来的影响。方法如下:对每一个计算方式f1、f2、f3,与每一组数据,我们分别计算使用4种不同距离函数得到的参数值并且将其对比。第二部分,比较计算方式f1、f2、f3的优劣。方法如下:对4种距离中的每一种,我们都用3种计算方式来得到估计的参数值,并将其对比。关于参数估计的其他兴趣:参数估计值的渐近性质。对上文的任意一个单项的检验,我们都遵从如下步骤:Step1:产生n个样本点(固定样本点等距离取定即可,随机样本点Xi ~ iid U(0,1)或Xi ~ iid N(2,1)),产生对应于n个样本点的随机误差,可以取1与0.1,或者Cauchy(0,1)。对应的Yi=。从而,我们得到了“数据”,(X1, Y1), (X2, Y2) … (Xn, Yn)。Step2:利用上文产生的“数据”,我们分别通过最小化对应的f函数的方式来得到参数与的估计,a与b。Step3:重复Step1 Step2 n_repeat次,得到若干组估计值a、bStep4:对得到的估计数据进行分析。1、通过方差、偏倚直接描述估计值,2、通过假设检验的方式比较不同的计算方式得来的结果。第零部分:探究X取固定样本点与随机样本点的关系(代码统一见1.txt,在代码里,可供修改的参数处已经做好批注),,比较两者在参数估计上的效果。计算方式采用d2与f3的结合。单次试验样本数n=100,试验重复数n_repeat=10000。结果展示:Part1:采用随机样本点得到的a、b的估计值的直方图均值与方差:有关a的估计值:mean=0.9999975,var=0.0004027有关b的估计值:mean=2.000021,var=0用固定样本点得到的a、b的估计值的直方图均值与方差:有关a的估计值:mean=1.000002,var=0.0004017有关b的估计值:mean=2.000052,var=0.0012546Part2:检验两种估计方式的均值和方差是否相同均值是否相同?由于这里两种估计方式的样本数量都高达10000,远大于30,我们可以认为这是大样本的检验,我们计算两次估计得到的样本的z值对a的估计值:z==-0.01539,这个值的绝对值远远小于1.96(95% significance),于是我们便没有充分的理由拒绝两者均值相同的假设。对b的估计值:同上计算得到z=-0.06282,同样,我们也没有充分的理由拒绝两者有相同的期望方差是否相同?计算F-ratio,F=max{,},对自由度为(9999,9999)的F分布,,对a的估计值:F=1.002618,于是我们便没有充分的理由来拒绝两者有相同的方差对b的估计值:F=1.041891,同样我们有95%可信度来拒绝关于b的估计两者具有相同的方差,不过,没有99%的可信度。Part3:综上所述,在d2,f3这一计算方式下,样本点取值是[0,1]均匀随机变量或是给定的等距节点对参数值的估计在均值层面没有影响,但在,两者的离散程度不同。,,比较两者在参数估计上的效果。计算方式采用d2与f3的结合。单次试验样本数n=100,试验重复数n_repeat=10000。结果展示:Part1:采用随机样本点得到的a、b的估计值的直方图均值与方差:有关a的估计值:mean=0.999816,var=0关b的估计值:mean=2.000767,var=0用固定样本点得到的a、b的估计值的直方图均值与方差:有关a的估计值:mean=0.9997774,var=0关b的估计值:mean=2.00016,var=0art2:检验两种估计方式的均值和方差是否相同均值是否相同?由于这里两种估计方式的样本数量都高达10000,远大于30,我们可以认为这是大样本的检验,我们计算两次估计得到
文档评论(0)