- 1、本文档共81页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例 (数据:shuttleF.txt). 或者 例 (数据:shuttleF.txt). 例 (数据:bwt.txt). 189个新生婴儿的数据。该数据有9个变量:一个因变量low为婴儿是否太轻的示性变量(1代表轻于2.5kg,否则为0);8个自变量为:age为母亲年龄(岁);lwt为母亲的体重(单位:磅);race为种族(white,black,other);smoke为怀孕时母亲是否吸烟(TRUE,FALSE);ptd为是否早产过(TRUE,FALSE);ht为母亲是否有高血压病史(TRUE,FALSE);ui为是否有子宫过敏(TRUE,FALSE);ftv为头三个月医生检查次数(有序变量:0次,1次,两次及以上)。自变量中除了母亲年龄、体重之外都是不是数量变量。令p为重量不足的概率,我们试图对这个数据建立logistic回归模型。 bwt=read.table(“c:/xzwu/Hepbook/data/bwt.txt”,header=T); a=glm(low ~ ., binomial, bwt); summary(a) a=glm(low ~ ., binomial(link=probit), bwt); summary(a) a=glm(low ~ lwt+race+ptd+ht, binomial, bwt); summary(a) 例 (数据:bwt.txt). 检验说明只有lwt,race,ptd,ht变量显著(在0.05的显著性水平下)。再对这三个变量进行拟合,得到 例 (数据:bwt.txt). 例 (数据:bwt.txt). 如果令m=1.90代表截距,x代表变量lwt,其系数的估计为b=-0.018,而令ai代表race (a1=race-black=0, a2=race-other=-0.62, a3=race-white=-1.07), bj代表ptd (b1=ptd-T=1.42, b2=ptd-F=0), gk代表ht (g1=ht-T=1.84, g2=ht-F=0), 这个模型可以更简单地写出: 思考一下: Logistic回归方程的右边和前面的线性回归类似,同样可以看出,定性自变量取的值越多,回归模型包含的参数就越多;回归方程的个数和定性变量的组合数目一样。这里也有交互效应的问题。 Logistic回归方程的左边为因变量取一个值的概率p的logit变换,与线性回归不同。 经典分类:判别分析 本节介绍的线性判别分析(linear discriminant analysis)实际上就是当因变量为分类变量时,找到一种方法,使得能够根据自变量来预测因变量的类型。 例 (数据iris.txt) 鸢尾花(iris)的数据。 该数据给出150个鸢尾花的萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)、花瓣宽(petal width)以及这些花分别属于的种类(Species);共五个变量。萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值Setosa、Versicolour、Virginica)。鸢尾花为法国的国花,其萼片也是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。这里三种鸢尾花各有50个观测值。 IRIS IRIS IRIS IRIS IRIS Library(MASS) set.seed(2) samp - c(sample(1:50,25), sample(51:100,25), sample(101:150,25))#训练集 a=lda(Species~.,data=iris,subset=samp)#subset是训练集的下标号 b=predict(a, iris[-samp, ])$class#对测试集的预测(类) zz=function(x=iris[,5],c=b){z=dimnames(table(x))[[1]];q=NULL; for(i in 1:3){r=NULL;for(j in 0:2) r=cbind(r,sum((c==z[i])[(j*25+1):(25*(j+1))]));q=rbind(q,r)};q=t(q);q}#我写的 zz() IRIS library(mda); z=fda(Species ~ ., data = iris[-samp,])$fit$fitted; plot(z,pch=c(rep(19,25),rep(2,25),rep(8,25)),xlab=,ylab=) 思考一下: 判别分析的目的和回归有什么异同? 试着使用另外一个R软件包(从R网站上下载)mda,然后用语句libr
您可能关注的文档
最近下载
- 2024年铜陵职业技术学院单招职业技能测试题库及一套参考答案.docx VIP
- 规范文件GB∕T 35347-2017 机动车安全技术检测站.pdf
- 景区运营管理方案计划书.pdf
- 一种高效导热UV-LED油墨的制备方法及其应用.pdf VIP
- 坎德拉PV使用手册.PDF
- [中央]2024年国家医疗保障局医药价格和招标采购指导中心招聘应届生笔试典型考题与考点研判含答案详解.docx
- 坎德拉PVsyst使用指南(第四版2020年).pdf
- Unit 7 Art Lesson 1 Masterpieces课件 (共46张PPT)北师大版(2019)高中英语必修第三册1.pptx VIP
- 碳中和技术概论PPT完整全套教学课件.pptx
- 陕西齿轮变速箱使用维修手册2019-07-15.pdf VIP
文档评论(0)