- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IBMSPSSModeler帮助建模节点最近相邻元素模型目录 KNN节点 KNN模型块 IBMSPSSModeler帮助建模节点最近相邻元素模型 上一个下一个 KNN节点 “最近相邻元素分析”是根据观测值与其他观测值的类似程度分类观测值的方法。在机器学习中,将其开发为识别数据模式的一种方法,而不需要与任何存储模式或观测值完全匹配。相似个案相互邻近,非相似个案则相互远离。因此,两个观测值之间的距离是其不相似性的测量。 将靠近彼此的个案视为“相邻元素。”当提出新的观测值(保留观测值)时,计算其到模型中每个观测值的距离。计算最相似观测值–最近相邻元素–的分类并将新观测值放在包含最多最近相邻元素的类别中。 您可以规定需要检验的最近相邻元素的数量;此值叫做k。图片显示如何使用两个不同的k值分类新观测值。当k=5时,新观测值将被置于类别1中,因为大多数最近相邻元素属于类别1。但当k=9时,新观测值将被置于类别0中,因为大多数最近相邻元素属于类别0。 更改k对分类的影响 最近相邻元素分析也可用于计算连续目标的值。在此情况下,最近相邻元素的平均值或中间目标值用于获得新观测值的预测值。 ©CopyrightIntegralSolutionsLimited1994,2010 IBMSPSSModeler帮助建模节点最近相邻元素模型KNN节点 上一个下一个 KNN节点目标选项 显示详细信息 KNN节点目标选项 您可以在“对象”选项卡输入数据中根据最近相邻元素的值选择构建预测目标字段值的模型,或者只是查找特定感兴趣个案的最近相邻元素。 您要执行哪种类型的分析? 预测目标字段。如果您想根据最近相邻元素的值预测目标字段的值,请选择此选项。 只识别最近相邻元素。如果您只想看到特定字段的最近相邻元素,请选择此选项。 如果您选择只识别最近相邻元素,在此选项卡上与准确性和速度相关的剩余选项将被禁用,因为其只与预测目标相关。 您的目标是什么? 此组选项让您决定当预测目标字段时,速度、准确性或二者是否是最重要的因素。或者您可以选择自己自定义设置。 如果您选择平衡、速度或准确性选项,则算法预先选择该选项的最合适设置组合。高级用户可能希望覆盖这些选择;可在“设置”选项卡上的各个窗格上进行此操作。 均衡速度和精确度。选择小范围内相邻元素的最佳数量。 速度。查找固定数量的相邻元素。 准确性。选择较大范围内的相邻元素的最佳数量,并在计算距离时使用预测变量重要性。 自定义分析。选择该选项以微调“设置”选项卡上的算法。 注意:所得KNN模型的大小与多数其他模型不同,随着训练数据量的增加呈线性增加。如果在尝试构建KNN模型时看到报告“内存溢出”错误的出错信息,则尝试增加IBM®SPSS®Modeler所使用的最大系统内存。要进行此操作,请选择 工具选项系统选项 并在最大内存字段中输入新大小。“系统选项”对话框中所作的更改要在重新启动SPSSModeler之后才能生效。 ©CopyrightIntegralSolutionsLimited1994,2010 IBMSPSSModeler帮助建模节点最近相邻元素模型KNN节点 上一个下一个 KNN节点设置 在“设置”选项卡上您可以指定最近相邻元素分析特有的选项。屏幕左侧的侧栏列出了用于指定选项的面板。 相关主题 相邻元素 特征选择 交叉验证 分析 ©CopyrightIntegralSolutionsLimited1994,2010 IBMSPSSModeler帮助建模节点最近相邻元素模型KNN节点KNN节点设置 上一个下一个 模型 显示详细信息 KNN节点模型选项 “模型”窗格提供控制如何构建模型的选项,例如是否使用分区或分割模型、是否变换数值输入字段以使其落入相同范围内和如何管理感兴趣个案。您也可以给模型选择一个自定义名称。 模型名称。用户可根据目标或ID字段自动生成模型名称(未指定此类字段时自动生成模型类型)或指定一个自定义的名称。 使用分区数据。如果定义了分区字段,则此选项可确保仅训练分区的数据用于构建模型。 请参阅主题分区节点详细信息。 创建分割模型。给指定为分割字段的输入字段的每个可能值构建一个单独模型。请参阅主题构建分割模型详细信息。 手动选择字段...默认情况下,节点使用来自“类型”节点的分区与分割字段设置(如果存在),但此处您可以覆盖这些设置。要激活分区与分割字段,请选择字段选项卡,并选择使用定制设置,然后返回此处。 • 分区字段。该字段允许您使用指定字段将数据分割为几个不同的样本,分别用于模型构建过程中的训练、测试和验证阶段。通过用某个样本生成模型并用另一个样本对模型进行测试,您可以预判出此模型对类似
文档评论(0)