[理学]第十二讲统计模型数据拟合方法.ppt

[理学]第十二讲统计模型数据拟合方法.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]第十二讲统计模型数据拟合方法

软件开发人员的薪金 一家高技术公司人事部门为研究软件开发人员的薪金与他们的资历、管理责任、教育程度等因素之间的关系,要建立一个数学模型,以便分析公司人事策略的合理性,并作为新聘用人员工资的参考。 他们认为目前公司人员的薪金总体上是合理的,可以作为建模的依据,于是调查了46名开发人员的档案资料,如下表。 其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高程度(研究生等)。 1、分析与假设 建模的目标: 为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每加一年,薪金的增长是常数; 管理责任、教育程度、资历诸因素之间没有交互作用。 基本模型 3、结果分析 从表中, 4、进一步讨论 的置信区间包含零点,说明上述基本模型存在缺点。为了 下图给出 应在基本模型中增加管理 5、更好的模型 由上表可知,这个模型的 做该模型的两个残差分析图,可以看出,已经消除了 不正常现象,这也说明了模型的适用性。 从上图,还可以发现一个异常点: 具有10年资历、大学程度的管理人员(编号33)的实际薪金明显低于模型的估计值,也明显低于与他有类似经历的其他人的薪金。 这可能是由我们未知的原因造成的。 为了使个别数据不致影响整个模型,应该将这个异常数据去掉,对模型重新估计回归系数,得到的结果如表。 残差分析见图。 可以看到,去掉异常数据后结果又有改善。 可以看出: 大学程度的管理人员薪金比研究生程度管理人员薪金高,而大学程度的非管理人员薪金比研究生程度非管理人员薪金略低。 当然,这是根据这家公司实际数据建立的模型得到的结果,并不具普遍性。 7、评注: X 129.0 140.0 103.5 88.0 185.5 195.0 105.5 Y 7.5 141.5 23.0 147.0 22.5 137.5 85.5 Z 4 8 6 8 6 8 8 表1 水道测量数据 X 157.5 107.5 77.0 81.0 162.0 162.0 117.5 Y -6.5 -81.0 3.0 56.5 -66.5 84.0 -33.5 Z 9 9 8 8 9 4 9 *   许多简单的模型会产生很复杂的求解过程,或者很难解的方程组。基于这一原因,我们要使用变换,得出近似的最小二乘模型。 解这个非线性方程组是不容易的。   通过对数据分析研究,发现先变换数据再对变换后的数据拟合直线很方便。   例如,图形拟合  ,可以作变换 而对于   和x的图却是直线。对变换后的数据拟合直线,可用于最小二乘准则,简化拟合过程的计算。   特别地,如果找到一个方便的变换,问题变成在变换后的变量X和Y间采用    的形式。 方程     两边取对数得 假设我们想对这数据点集拟合幂曲线 用 记A的估计, 记N的估计。 在变量  对 的图中,上方程构成一条直线。   是此直线的截距, 是此直线的斜率。用变换后变量和   个数据点,有 x 0.5 1.0 1.5 2.0 2.5 y 0.7 3.4 7.2 12.4 20.1 对于数据 从所给的数据得到              所以方程的最小二乘最佳拟合为  产生  由此模型可计算当 x=2.25 时,预测 y 的值为16.4348 假设仍想对这数据点集拟合二次曲线 仍用 记A的估计,对方程     两边取对数得 x 0.5 1.0 1.5 2.0 2.5 y 0.7 3.4 7.2 12.4 20.1 对于数据 在变量  对 的图中,上方程是一条斜率为2 截距为 的直线。利用最小乘法计算得 所以方程的最小二乘最佳拟合为  由此模型可计算当 x=2.25 时,预测 思考: 没有变量代换 经变量代换 这两个模型哪个更好? 2001年全国大学生数学建模竞赛赛题A 血管的三维重建 曲 线 拟 合 2005年全国大学生数学建模竞赛赛题A 长江水质的评价和预测 2006年全国大学生数学建模竞赛赛题A 艾滋病疗法的评价及疗效的预测 2 1 6 22884 24 2 1 3 21371 12 2 0 6 13839 23 1 1 3 14975 11 3 1 6 21352 22 2 0 3 1

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档