第六章 最小二乘法.ppt

  1. 1、本文档共101页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章最小二乘法整理ppt

第六章 最小二乘法 很多科学与工程研究都与数据测量及将测量值与理论值比较有关。如果数据测量精确,并且理论理解深刻,那么这是一项相对简单的工作。但是多数时间我们处理的问题不但物理现象不明显,而且测量本身也不完美。因为我们知识的不完备,模型中会包含一些只能用实验测定的参量。然而由于实验设备的限制或者物理量内在属性造成了数据的不确定性,使得要利用测量值确定这些参量变得困难。如果独立数据个数大于自由参数的个数,那么可以借助统计分析的方法,其中最常用最重要的就是最小二乘法。 数据的统计描述 如果我们对同一物理量进行两次独立的测量,那么两次测量结果很有可能会不相同。例如设想我们测量城市南北街区的距离,有很多可能的原因会造成两次测量的结果不一致。比如我们测量的方法是数从街区的一头走到另一头所走的步数,那么我们所得的结果的精确度只能达到一步步长的十分之一,也就是厘米量级。 其他可能造成两次测量的结果不一致的原因与测量设备的精确无关。比如因为街区本身范围定义的不严格,所以即使我们用高精度的测量仪器代替数步数测量,两次测量的结果仍然可能会有毫米量级的差异。在这个例子中测量的不确定度来自于被测物体自身的内在属性。在物理学中,有一些物理量是不能精确测量的,比如受海森堡测不准原理约束的物理量。 我们不难想像另一个造成对同一物理量两次测量的结果不一致的原因。如果两个不同步长的人测量同一条街区的长度,最终所走的步数也会不同,这显然就是由于所选用的测量设备不同而造成的系统误差。如果系统误差来源已知,那么我们可以进行修正。但也有的情况下我们无法进行修正,从而致使测量结果中包括有系统误差。测量结果的统计分布 任何测量都伴随着不确定性,我们如果从中找到物理量的真实值呢?首先让我们假定真实值是存在的,即便如此,两次测量的结果仍然会有差异。那么其中哪一个才是真实值呢?最有可能的情况是两次测量的结果都不是真实值,而且两次测量的结果的平均值也不是真实值。我们可以用以下方法证明这个结论。如果我们进行第三次测量,测量结果等于前两次测量的平均值的概率很低。因此三次测量的平均值不等于前两次测量的平均值。既然平均值改变了,那么也就不可能认为前两次测量的平均值就是真实值。另一方面,如果我们进行多次测量,测量的平均值会接近一个定值,而且这个定值不会随再增加测量次数而有较大幅度的改变,因此很有可能此时的平均值就是真实值。通过大量的测量的平均值给出物理量的真实值是用了统计的概念。如此伴随测量过程的不确定性是随机的,那么测量值很有可能会在真实值附近形成确定的分布。通常不可能通过理论知识推导出精确的分布,但是如果在相同条件下进行了足够多次的测量,那么就可以在需要的精度下描绘出具体的分布。消除了诸如系统误差等的测量偏差,所得的测量结果是纯统计意义上的。这样,分布就反映了伴随着测量本身以及物理量内在属性带来的不确定性的随机属性。进一步说,如果测量结果都随机地分散在真实值附近,只要测量的次数足够多,那么测量的平均值一定就接近真实值。在很多情况下也有可能物理量没有一个确定的值。例如双原子可以看作是由弹簧连接的两个球。在确定的温度下,两个原子以质心为中心做有限振幅的振动。简单起见,我们假定振动沿两原子连线方向。两原子中心的距离是时间的函数。在这种情况下,距离的值没有一个确定的值,我们必须对真实值进行合理的定义。一种好的选择就是用在确定温度下许多相似分子的的两个组成原子的距离的平均值作为真实值。测量值在均值附近的分布是物理量本身的属性,不能通过改进测量仪器而消除。 另一个常见的例子是原子或原子核的激发态能量。因为激发态存在有限的寿命,根据海森堡测不准原理,能量有一个“天然”的宽度。因此当我们用无限精确的测量仪器进行测量时,激发态能量仍然有一个不确定度。概率分布 物理量分布可以用一系列的参量表述,比如分布的位置,分布的宽度,分布的形状等等。如果第次的测量值为,则该分布的期望(mean)由无限多次测量的结果求平均值得到 (6-1) 如果分布是连续的,那么在范围内找到的概率为,平均值也改有积分得到 习惯上我们要将归一化 (6-2) 其中和分别为可能值的下限和上限。 另外两个物理量也常用来表示分布的位置。一个是中值(median),定义为在比这个数小的范围和比这个数大的范围找到的概率是相等的,用表示。即 (6-3) 另一个是最概然值(most probable value),定义为分布概率取得最大值时的的值,用表示。即 (6-4) 通常这三个量,和并不相等数学上,期望在多数应用中用起来最方便,因此我们最常期望来表示分布的位置。反映随机变量的取值相对于它的期望的偏离程度用方差 (variance)表示,它的定义为 ) 对

文档评论(0)

zyzsaa + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档