- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第10章判别分析1、判别分析概述2、判别分析方法3、SPSS操作实例1
2产品评估随着近年来各个行业的各类产品竞争加大,产品竞争战略也成为各企业的重要营销策略。产品都具有多方面因素,如样式新颖程度、包装质量、产品耐久性等,在未知分类判别标准的前提下,根据已有产品的先验数据集,综合考虑这些因素找出分类标准(即判别函数),再判断某产品是“受欢迎”产品还是“不受欢迎”产品,这种根据对象各个特征值判断其属于哪一类的问题,就是判别分析。某类型产品有12家不同的生产企业,将这12家的产品的样式、包装和耐久性进行评估后,可以得到各个产品的得分资料,如表10-1所示(满分为10分)。引入案例
3已知根据产品的销量与利润可以界定其中7家的产品受消费者欢迎,属于畅销品,定义为1类;5家的产品不大受消费者欢迎,属于滞销品,定义为2类。现有一新厂家,其产品的销量与利润未知,无法直接界定受欢迎程度。已知该产品的样式、包装、耐久得分分别为6、4、5,如何通过该产品的得分数据判断该厂的产品是否受欢迎呢?引入案例
第1节判别分析概述1、判别分析的基本思想2、判别分析的类型3、适用的数据范围4
10.1.1判别分析的基本思想定义10.1判别分析(discriminantanalysis)∶根据观测到的样品的若干数量特征(称为因子或判别变量)对样品进行归类、识别,判断其属性的预报(预测)的一种多元统计分析方法。判别分析只知道一部分样本的信息,但不知道分类判别的标准。判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法。5
10.1.1判别分析的基本思想定义10.2判别函数(discriminantfunction):是指各个类别的判别区域确定后,可以用一些函数来表示和鉴别某个特征矢量属于哪个类别,这些函数就称为判别函数,又称为判决函数。在判别分析中,已经明确了应该分成几类,需要根据已有数据过论每类的特点,判断新样本属于哪一类,即研究“怎么分”。在实际生活中,判别分析常被广泛应用于预测事物的类别归属。判别分析近年来在机器学习、大数据分析等方面有广泛应用。6
10.1.2判别分析的类型按判别的组数来分,分为两组判别分析、多组判别分析;按区分不同总体所用的数学模型来分,分为线性判别、非线性判别;按判别对所处理的变量方法不同,分为逐步判别、序贯判别等;按判别准则来分,有距离判别准则、费歇尔判别准则、贝叶斯判别准则等。7
10.1.2判别分析的类型线性判别分析(lineardiscriminantanalysis,LDA)是对费歇尔的线性判别方法的归纳,这种方法使用统计学、模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以达到能够特征化或区分它们。所得的组合可用来作为一个线性分类器,或者为后续的分类做降维处理。8
10.1.2判别分析的类型?9
10.1.3适用的数据范围判别分析的目的是将未知属性的数据分类。这部分未知属性的数据可以是定性数据也可以是定量数据。在进行分类的过程中,主要分析未知属性的某些特征值,而这些特征值大都是定量数据,分析出它们的数学特点后再进行分类。10
第2节判别分析方法1、距离判别2、贝叶斯判别3、费歇尔判别4、逐步判别5、支持向量机判别6、随机森林判别7、判别分析效果评价11
10.2.1距离判别定义10.3距离判别(disecriminantbydistance):是以待判样本到各测试样本的距离远近为判据的一种直观判别方法,也称为直观判别法。距离判别法的基本思想∶分别计算出已知数据各类的中心,然后计算出待测样本与各类中心的距离,待测样本与哪一类最近,就判断待测样本属于哪一类。通常我们定义的距离是指欧式距离,但是它在距离判别中是不适用的。12
10.2.1距离判别?13
10.2.1距离判别?14
10.2.2贝叶斯判别?15
10.2.2贝叶斯判别?16似然比判决阈值
10.2.3费歇尔判别定义10.5费歇尔判别(Fisherdiscriminant)∶费歇尔判别是一种先进行高维向低维投影,再根据距离判别的一种方法,也称为线性判别法或费歇尔判别法。费歇尔判别法的基本思想∶通过将多维数据投影到某个方向上,投影的原则是将类与类之间尽可能地分开,然后再选择合适的判别准则,将待判的样本进行分类判别。17按照原来的变量(横坐标和纵坐标),很难将这两种点分开。沿着这个方向朝与这条虚线垂直的一条直线进行投影会使得这两类分得最清楚。
10.2.3费歇尔判别费歇尔判别的几何意义:把p维空间的点投影到一维空间(直线)上去,使各已知类在该直线上的投影尽可能分离。有了投影之后,再用前述的距离判别的方法来得到判别准则。这种首
您可能关注的文档
- 《应用统计分析》课件_第6章 方差分析.pptx
- 《应用统计分析》课件_第11章 主成分分析.pptx
- 《应用统计分析》课件_第13章 结构方程模型.pptx
- 《应用统计分析》课件_第9章 聚类分析.pptx
- 《应用统计分析》课件_第8章 回归分析.pptx
- 《广东-高中备考指南-历史-必修二》课件_第13课 亚非拉民族独立运动 (2).pptx
- 《应用统计分析》课件_第7章 相关分析与列联表分析.pptx
- 《广东-高中备考指南-历史-必修二》课件_1.单元综合测试(一).pptx
- 《应用统计分析》课件_第5章 非参数检验.pptx
- 《应用统计分析》课件_第12章 因子分析.pptx
- 2025年连云港职业技术学院单招职业倾向性考试题库汇编.docx
- 2025年台州学院单招职业技能考试题库必威体育精装版.docx
- 2025年河北旅游职业学院单招综合素质考试题库必威体育精装版.docx
- 2025年汕尾职业技术学院单招职业倾向性考试题库推荐.docx
- 2025年重庆三峡医药高等专科学校单招职业倾向性考试题库带答案.docx
- 2025年湖北省武汉市单招职业倾向性考试题库新版.docx
- 2025年甘肃省平凉地区单招职业适应性考试题库推荐.docx
- 2025年益阳职业技术学院单招职业倾向性考试题库新版.docx
- 2025年临夏现代职业学院单招职业倾向性测试题库完美版.docx
- 2025年滁州城市职业学院单招职业倾向性考试题库必威体育精装版.docx
文档评论(0)