- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 16
线性回归专题
一元线性回归
在客观世界中普遍存在着变量之间的关系。变量之间的关系一般来说可分为确定性的与非确定性的两种。确定性关系是指变量之间的关系可以用函数关系来表达。另一种非确定性的关系即所谓相关关系。例如人的身高与体重之间存在着关系,一般来说,人高一些,体重要重一些,但同样高度的人,体重往往不相同。人的血压与年龄之间也存在着关系,但同年龄的人的血压往往不相同。气象中的温度与湿度之间的关系也是这样,这是因为我们涉及的变量(如体重、血压、湿度)是随机变量,上面所说的变量关系是非确定性的。回归分析是研究相关关系的一种数学工具。它能帮助我们从一个变量取得的值去估计另一变量所取的值。
(一)一元线性回归 设随机变量与之间存在着某种相关关系。这里,是可以控制或可以精确观察的变量,如年龄、试验时的温度、施加的压力、电压与时间等。换句话说我们可以随意指定个值。因此我们干脆不把看成随机变量,而把它当作普通的变量。本章中我们只讨论这种情况。
由于是随机变量,对于的每一个确定值,有它的分布。若的数学期望存在,则其取值随的取值而定,即的数学期望是的函数,记为或。称为关于的回归。由于的大小在一定程度上反映在处随机变量的观察值的大小,因此如果能设法通过一组样本来估计,那么,在一定条件下我们就能解决如下的问题:在给定置信度下,估计出当取一定值时,随机变量的取值情况,即所谓预测问题;以及在给定置信度下,控制自变量的取值范围,使在给定的范围内取值,即所谓控制问题。
我们对于的、取定的一组不完全相同的值,作独立试验得到对观察结果
,
其中是处对随机变量观察的结果。这对观察结果就是一个容量为的样本。我们首先要解决的问题是如何利用样本来估计关于的回归。为此,首先需要推测的形式。在一些问题中,我们可以由专业知识知道的形式。否则,我们可将每对观察值在直角坐标系中描述出它的相应的点,这种图称为散点图。散点图可以帮助我们初略地看出的形式。
例1 为研究某一化学反应过程中,温度对产品得率的影响,测得数据如下。
温度
100
110
120
130
140
150
160
170
180
190
得率
45
51
54
61
66
70
74
78
85
89
这里自变量是普通变量, 是随机变量。画出散点图如图9-2所示。由图大致看出具有线性函数的形式。
图9-2
设关于的回归为。利用样本来估计的问题称为求关于的回归问题。特别,若为线性函数:,此时估计的问题称为求一元线性回归问题。本节我们只讨论这个问题。
我们假定对于(在某个区间内)的每一个值有
,
其中及都是不依赖于的未知参数。对作这样的正态假设,相当于假设
, (3.2)
其中未知参数及都不依赖于。(3.2)式称为一元线性回归模型。
如果由样本得到(3.2)式中的估计,则对于给定的,我们取做为
的估计。方程
称为关于的线性回归方程或回归方程,其图形称为回归直线。
思考:
回归模型与回归方程有何异同?
(二)的估计 取的个不全相同的值作独立试验,得到样本
。由(3.2)式,得
,,各相互独立。 (3.3)
于是,。且由的独立性,知的的联合密度为
(3.4)
现用极大似然估计法来估计未知参数,。对于任意一组观察值,(3.4)式就是样本的似然函数。显然,要取最大值,只要(3.4)式右端方括弧中的平方和部分为最小,即只需函数
(3.5)
取最小值。
注意:
如果不是正态变量,则直接用(3.5)式估计未知参数,,使得的观察值与偏差的平方和为最小。这种方法叫最小二乘法。它是求经验公式的一个常用方法。若是正态变量,则最小二乘法与极大似然估计法给出相同的结果。
取分别关于,的偏导数,并令它们等于零:
(3.6)
得方程组
(3.7)
(3.7)式称为正规方程组。为了和多元线性回归结合,设样本为
则正规方程组也可以表示为:
若用矩阵表示,则
那么
正规方程组可表示为
由于不全相同,正规方程组的系数行列式
即
故(3.7)式有唯一的一组解。解得的极大似然估计为
(3.8)
于是,所求的线性回归方程为
(3.9)
若将代入上式,则线性回归方程变为
(3.10)
(3.10)表明,对于样本观测值,回归直线通过散点图的几何中心。
今后我们将视方便而使用(3.9)或(3.10)。
为了计算上的方便,我们引入下述记号:
这样,的估计可写成
(3.12)
(三)的估计 ,称为处的残差,平方和
称为残差平方和。
残差平方和服从分布:
(3.14)
于是 ,即,
即知 (3.15)
您可能关注的文档
- 线性代数第四版赵树嫄答案.doc
- 线性代数第一章答案.doc
- 线性代数复习题(选择填空题).doc
- 线性代数讲解.ppt
- 星海求知天文学的奥秘2019尔雅答案100分.doc
- 线性代数 第二章课件.ppt
- 线性代数课件-3.2 n维向量.ppt
- 线性代数课件第三章.ppt
- 线性代数练习册 答案.doc
- 线性代数习题3.5 向量空间.ppt
- 2024重庆八中招聘教师41人笔试备考题库及答案解析.docx
- 2024中国生化制药工业协会宣传人员招聘笔试备考题库及答案解析.docx
- 2025中国光大银行长沙分行校园招聘笔试备考题库及答案解析.docx
- 2024重庆商务职业学院事业单位考核招聘12人笔试备考题库及答案解析.docx
- 2024中石油中国寰球工程有限公司秋季招聘(广东11人)笔试备考题库及答案解析.docx
- 成都市少年儿童业余体育学校公开(考核)招聘工作人员(1人)笔试备考题库及答案解析.docx
- 2024重庆市南岸区海棠溪街道办事处公益性岗位招聘1人笔试备考题库及答案解析.docx
- 2024中国人民大学人才工作领导小组办公室招聘1人笔试备考题库及答案解析.docx
- 2024中国人民大学重阳金融研究院招聘1人笔试备考题库及答案解析.docx
- 2025中国人寿 广发银行秋季校园招聘笔试备考题库及答案解析.docx
文档评论(0)