[理学]广义线性回归在研究学生成绩相关性的应用.doc

[理学]广义线性回归在研究学生成绩相关性的应用.doc

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]广义线性回归在研究学生成绩相关性的应用

引言 回归分析是一种应用极为广泛的数量分析方法,它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,帮助人们准确把握变量受其他一个或多个变量影响的程度,进而为控制和预测提供科学依据。 作为标准的统计分析工具,多元线性回归分析在诸多行业和领域的数据分析应用中发挥着极为重要的作用。利用多元回归方法分析变量之间的关系或进行预测时的一个基本要求是:被解释变量应是连续数值型变量。然而,实际应用中这种要求未必都能得到较好的满足。例如,在对小轿车消费群体特点的分析和预测中,可以根据历史数据,建立关于小轿车的多元回归模型。可能将诸如职业,年收入,年龄等因素纳入模型,并希望通过模型预测具有某特定特征的客户是否会购买小轿车。这个多元回归模型的被解释变量设为是否购买(l表示购买,0表示不购买),是个纯粹的二值型品质变量,显然不满足变量为数值型数据的要求。在数据分析中,尤其在社会科学、医学的研究中,像这样的情况是很普遍的。当出现这种情况的时候,建立的一般多元回归模型就会出现以下问题:残差不再服从零均值的正态分布;被解释变量的取值区间受限制等。 基于这种情况,提出了广义线性模型。形式上,广义线性模型是常见的正态线性模型的直接推广。它可适用于连续数据和离散数据,特别是后者,如属性数据,计数数据。这在实际中,尤其是生物、医学、经济和社会数据的统计分析上,具有重要的意义。 广义线性模型要求响应变量通过线性形式依赖于自变量,这一特点保持了线性自变量的思想,而且广义线性模型允许许多用于线性模型的方法能用于更一般的实际问题。广义线性模型的响应变量Y都属于指数分布族,而指数分布族不仅包含了许多常见的重要分布,如正态分布,二项分布,Poisson分布等,而且它有良好的分析性质,在数处理上有很多方便。总之,广义线性模型为今后回归模型提供了一个重要的统一研究方法。 广义线性模型的个别特例起源很早Fisher在1919年曾用过它最重要的Logistic[21]模型,在20世纪四五十年代曾由Berkson,Dyke Patterson等人使用过。1972年Nelder和Weddethum在一篇论文中引进广义线性模型一词,提供了一个新的估计理论和计算框架,对传统线性回归模型作了进一步推广,建立了统一论和计算框架,对回归模型在统计学中的应用产生了重要影响。这种新的统计模称作广义线性模型(generalized linear models,简称GLM)。近年来,广义线性模在理论上和应用上得到了快速的发展,在模型的拓展、参数估计方法以及模型的验和诊断等方面不断趋于成熟。张尧庭[11](1995)在与传统线性模型对比的基础上,对广义线性模型本质特征进行了描述。陈希孺[17,19]院士于2002—2004年在《数理统计与管理》杂志上,分十次讲解对多元广义线性模型进行了系统的介绍。另外,我国学者在广义线性模型参数估计的相合性、收敛速度、模型的诊断等方面得到了不少优秀成果。用于GLM的计算软件也相继问世,目前,除了由NAG(Numerical Algorithms Group)研发的专用程序GLIM(Generalized Linear Interaetive Modeling)外,SAS和SPASS[2,3]统计软件中的Genmod模块也被广泛使用,在统计软件R和X-plore中,也有相应的计算模块。得益于应用软件的推广,广义线性模型在医学、农业、交通运输、产品试验以及经济、金融等方面得到了广泛的应用。近年来,广义线性混合模型、半参数广义线性模型[22]、广义非线性模型等扩展模型在理论研究和实际应用上得到了快速的发展。 广义线性模型理论的建立,极大地推动了以统计方法为基石的精算学的发展。传统的线性回归模型,都是建立在对称分布的基础上,以常值方差为假设。但在精算实践中,所采集的数据往往显示出非常值方差的趋势;用于描述索赔额等变量分布通常具有厚重的右尾;反应变量不再局限于对解释变量的线性依赖。在许多情况下,传统线性回归模型不适宜作为精算统计模型。广义线性模型的出现,为精算学的发展提供了有力的工具。广义线性模型在精算中的应用起始于上世纪八十年代,九十年代经历了快速的发展,并被广泛地应用于精算学的各个领域,如生命表的修匀、损失分布、信度理论、风险分类、准备金和费率的估计等方面。 大学学习不同于高中或者初中,学生的学习成绩会出现不同程度的畸形大学生步入大学之后,由于学习目标不明确而导致学习动力不足,放松要求,出现了考试不及格、、退学等学籍异动情况,对学校和个人都造成了损失。那么出现这种事故有无规律?有无征兆?本文仅从学生各门课程考试成绩的变化角度对该问题进行分析与研究安徽工程大学统计学专业07级81个学生前三年的学习成绩为样本来研究学生学年间成绩的相

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档