数学建模第四讲:实验建模.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模第四讲:实验建模

数 学 建 模 第四讲 * * * 任煜东 河南财经学院数学系 手机Email:hncjxyryd@126.com qq群实验建模 一、引言:解释性模型和预测模型 解释性模型中,建模者极力猜测某种关系,以便有一个满意地解释所研究问题的模型。建模者愿意接受模型和收集到的数据点之间的误差。 建模者利用一些假定来选择一个特定的模型类型,解释观测值反应的状况。如果手收集的数据证实了假定的合理性,建模者将为选定的曲线选取参数,使其在某些准则下(如最小二乘)达到最佳。这种模型是理论推动型的,建模者接受模型和数据之间的偏差。 预测(经验)可能构造一个满意的解释所研究问题的易于处理的模模型:有些情况下,建模者不型。如果仍然必须做出预测,建模者可以进行实验(收集数据),基于收集的数据构造一个经验模型。这种情况下,建模者受到所细心收集到的数据的强力影响,寻找曲线追踪数据倾向,在数据点间做出预测。这种模型是数据推动的。 4.1 Chesapeake海湾的收成和其他单项模型 考虑这样一种情形:建模者已经收集到一些数据,但不能以此构造一个解释性的模型。 例如:我们使用Chesapeake海湾的商贸行业提供的如下数据:a)收获蓝鱼的观测数据b)蓝蟹的观测数据 3700000 280000 1965 5000000 2750000 1990 3000000 270000 1960 4420000 1500000 1985 2500000 275000 1955 4800000 1200000 1980 1330000 250000 1950 4660000 650000 1975 850000 150000 1945 4400000 290000 1970 100000 15000 1940 蓝蟹 蓝鱼 年 蓝蟹 蓝鱼 年 做出蓝鱼对时间的散点图和蓝蟹对时间的散点图: 蓝鱼对年份散点图 蓝蟹对年份散点图 图形显示:时间增长时,有收获更多蓝鱼和蓝蟹的趋势,但没有一个很明显的更精确的描述。 我们的策略:变换数据,使得所产生的图形近似一直线,得到一个工作模型。 变换的方法:利用变量z的幂次阶梯表,帮助选择一个适当的线性变换。 幂次阶梯 根据5个数据点画图: 用 代替 用 代替 用 代替 对于直线y=x,当x1时, 将每一点的y值改变为 产生新的关系 y值的范围更集中: 全部y值变小了,但大值的变化幅度更大。 改变y值为 有类似 的影响但更显著 阶梯每向下增加一梯步,类似的影响就更强一些。 应该采用哪个变换是反复试验和经验的问题。 例1 收获蓝鱼 数据倾向显示出增的、凹的,使用幂次阶梯挤压右侧尾部向下,改变y值,用logy代替y值(或用 等代替x)。用1940年的基地年数为x=0,每一基底年数代表一个5年时段。经过试验, 和 对x的 图形更接近直线。 选取logy对x的模型,用最小二乘拟合这一形式的模型 拟合出参数,得到模型: 例2 收获蓝蟹 原数据点是递增、下凹。经过几次试验,选取用 代替 挤压右侧尾部向左。 用最小二乘拟合 得: 验证模型:比较观测值和预测值,计算残差和相对误差. 在预测2010年海湾收成时,模型依然使用吗? 预测结果: 蓝鱼 百万磅 蓝蟹 百万磅 蓝鱼的预测结果可能要大,蓝蟹的预测结果可能要小. 一般来说,这些简单的单项模型应该用于插值而不是外推。 总结:构造一个预测模型时,总是从细心分析收集到的数据开始,看数据存在什么样的倾向?是否有明显处于倾向之外的数据点?如果有这样的异常值存在,是否要抛弃他们?是否要做一个数据收集错误的检查?当某一倾向确实存在时,找到一个将数据变换成直线(近似)的函数,可尝试阶梯表中列出的函数,也可以用其他变换。 警惕使用变换带来的欺骗性,特别当数据点集中在一起时。估计模型参数后,必须分析拟合优度。记住是对原始数据而不是变换后的数据画出模型。不满意,可以研究其他的。 若单项模型不能拟合全部数据集,要使用其他技术。 高阶多项式模型: 多项式的拉格朗日形式: 设收集到下列数据: y4 y3 y2 y1 y x4 x3 x2 x1 x 考虑下述三次多项式: 该多项式是三次多项式,容易验证经过给定的四个点。推广这一形式,得到拉格朗日多项式: 定理1:如果x0 , x1, …, xn 是(n+1) 个不同的点,而 y0 , y1, …, yn 是这些点上对应的观测值,那么存在一个唯一的最高阶为n的多项式P(x),具有性质: 对每一个k = 0,1,…,n 这一多项式由下式给定: 其中 上述多项式通过每一个数据点,产生绝对偏差和为0.按照各种最佳拟合准则,可以用高阶多项式拟合较大的数据集。下面考察高阶多项式的优缺点。 注意:若不限制最高阶为n,则多项式不唯一!

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档