数学建模多元统计分析引论.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
MULTIVARIATE STATISTICS ANALYSIS 多元统计分析 SPSS 统计软件的重要作用 “计算机软件给统计学带来革命性变化” 发表论文或进行科研课题时,注明统计软件和采用的统计分析方法. 统计分析工具的选择: CHISS SAS, SPSS,STATA <案例讨论> 研究生招生与性别的关系研究 美国加州贝克莱分校1973年研究生的录取情况如上表. 结果显示,男生报考人数据2691人,录取1197人,录取比例44.5%,女生报考人数据1835人,录取556人,录取比例30.3%。 有人认为该校在研究生录取中存在性别歧视。试对此进行讨论与分析。 混杂因素的定义 ? 当某一危险因素和结果的相关性受 第三个变量和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。 排除混杂因素的两种方法 1、分层分析 2、多元统计分析 分层分析的优缺点 优点:直观简洁。 缺点:当考虑因素较多时分组数量倍增, 需要例数较多,有时无法实现。 表1.3 Aerobics 中心追踪研究过程中生存与死亡者基线特征(男性组) *混杂因素与干预因素关系 当危险因素和结果的相关性受第三个因素和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。 一个干预因素是出现结果的原因。 Camango及其同事们在研究中度酒精消费和心脏病危险性关系时校正了年龄、吸烟、运动、糖尿病及心脏病家族史,但是他们没有校正血压、体重指数、高胆固醇血症。为什么不? 这些因素符合混杂因素的定义,它们与危险因素(酒精消费)有关并与结果(心肌梗塞)有因果关系,问题是酒精消费可加重导致高血压、体重指数增加及高胆固醇血症。因此,如图1.3所示。这些变量可能通过其它致病途径导致心肌梗塞,应考虑为干预变量,不应考虑为混杂因素,如果将混杂因素作为干预变量来校正,那么你需要重新考虑你的结果。 血压升高 体重指数增加 高胆固醇血症 统计学不能区别混杂和干预变量 统计学并不能告诉你什么是混杂因素,什么是干预变量。从统计上讲,混杂因素与干预变量是一回事。在你的模型中,是因为有混杂因素而引入该变量,还是因为有干预变量而排除该变量呢?这一决定必须根据以前的研究和生物学上的可解释性作出。 《红楼梦》 众所周知,《红楼梦》一书共120回,自从胡适作《红楼梦考证》以来,都认为曹雪芹作前80回,后40回为高鹗所续,长期以来对这个问题一直有争议。《红楼梦》的作者是谁,当然由红学家来考证。但是我们是否可以用数学方法进行研究,做出论证或者得出一些新的结果来? 1987年复旦大学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。 ? 统计分析是统计活动的一个重要组成部分。是统计工作的最后一个阶段,更是统计过程中最有价值的一个环节,是服务于研究目的,为解决问题进行的一种认识活动。现代统计分析与传统统计分析相比,其最突出的特点是:先定性地提出问题,然后使用功能强大的统计分析软件对数据进行深入的定量分析,并且在定量分析的基础上得出有价值的定性结论。即:定性--定量--定性的综合分析过程。现代统计分析是在传统的统计分析的基础上发展起来的,是传统统计分析方法的改造和深化,并结合现代电子技术,运用统计分析软件对统计资料、数据进行处理。 什么是多元统计分析? 在工业、农业、医学字、气象、环外境以及经济管理等诸多领域中,常常需要同时观测多个指标。例如,要衡量一个地区的经济发展,需观测的指标有:总产值、利润、效益、劳动生产率、万元生产值能耗、固定资产、流动资金周转率、物价、信贷、税收等等;要了解一种岩石,需观测或化验的指标也很多,如:颜色、硬度、含碳量、含硫量等等;要了解一个国家经济发展的类型也需观测很多指标,如:人均国民收入,人均工农业产值、人均消费水平等等。 在医学诊断中,要判断某人是有病还是无病,也需要做多项指标的体检,如:血压、心脏脉搏跳动的次数、白血球、体温等等。总之,在科研、生产和日常生活中,受多种指标共同作用和影响的

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档