数学建模-多元统计分析引论.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模-多元统计分析引论

MULTIVARIATE STATISTICS ANALYSIS 多元统计分析;统计软件的重要作用; ; ; [实例解析4] 喝咖啡与心肌梗塞MI关系的研究。 有人观察发现喝咖啡的人,很多人患MI,这种现象是表象还是内在因果关系的? 数据来自2000年,小儿科邀请一位美国医学及生物统计学教授来院讲学的例子。; 研究者调查MI及非MI病人各150例,得到如下数据。表1.1 MI NoMI % Coffee 90 60 60 No coffee 60 90 40 优势比 : OR=90*90/(60*60)=2.25 Pearson chi2(1) = 12.0,P = 0.001。; 研究者怀虑结论,考虑到其中可能混杂其它因素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响,进一步分层分析得到。 表 控制吸烟因素的干扰后结果 Smoker Nosmoker MI NoMI % MI NoMI % Coffee 80 40 67 10 20 33 Noffee 20 10 67 40 80 33 优势比 OR=1 , OR=1 P = 1.00, P = 1.00; ;;<案例讨论> 研究生招生与性别的关系研究 ;混杂因素的定义;排除混杂因素的两种方法; ;分层分析的优缺点; ; ; ;表1.3 Aerobics 中心追踪研究过程中生存与死亡者基线特征(男性组); ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;*混杂因素与干预因素关系 ; Camango及其同事们在研究中度酒精消费和心脏病危险性关系时校正了年龄、吸烟、运动、糖尿病及心脏病家族史,但是他们没有校正血压、体重指数、高胆固醇血症。为什么不? 这些因素符合混杂因素的定义,它们与危险因素(酒精消费)有关并与结果(心肌梗塞)有因果关系,问题是酒精消费可加重导致高血压、体重指数增加及高胆固醇血症。因此,如图1.3所示。这些变量可能通过其它致病途径导致心肌梗塞,应考虑为干预变量,不应考虑为混杂因素,如果将混杂因素作为干预变量来校正,那么你需要重新考虑你的结果。;;统计学不能区别混杂和干预变量 ;《红楼梦》;1987年复旦??学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。;之后又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔,而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。 ;?;什么是多元统计分析? ;在医学诊断中,要判断某人是有病还是无病,也需要做多项指标的体检,如:血压、心脏脉搏跳动的次数、白血球、体温等等。总之,在科研、生产和日常生活中,受多种指标共同作用和影响的现象是大量存在的,举不胜举。上述指标,在数学上通常称为变量,由于每次观测的指标值是不能预先确定的,因此每个指标可用随机变量来表示。 ; 如何同时对多个随机变量的观测数据进行有效地分析和研究呢?一种做法是把多个随机变量分开分析,一次处理一个去分析研究;另一种做法是同时进行分析研究。显然前者做法有时是有效的,但一

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档