- 1、本文档共87页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第19章SPSSClementine数据管理祥解.ppt
数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社 本章主要内容 19.1数据源节点 包括: 数据库 变项文件 固定文件 SPSS 文件 Dimensions SAS文件 Excel 用户输入 19.1.1从开放数据库中导入数据 从数据库中获取数据的步骤: (1)在数据库节点对话框中,使用“表”模型和“SQL查询”模型连接数据库。 (2)从数据库中选择表。 (3)使用数据库节点对话框中的各个页签,用户可以更改使用类型和过滤数据字段。 用户可以使用数据库节点对话框中“数据”页签来进入数据库和从选定的表中读取数据。 19.1.1.1数据库连接的添加 图19-3参数说明: 数据源:列出可用的数据源。点击“连接”按钮进行连接。点击“刷新”按钮会更新菜单。 用户名:如果数据源被密码保护,键入用户的用户名。 密码:如果数据源被密码保护,输入用户的密码。 连接:显示目前连接的数据库。若要删除连接,可从菜单中选定一个连接,点击 “删除”按钮。 19.1.1.2选择表或视图 部分参数说明: 显示:列出用户目前连接的数据源的列。 (1)选择“用户表” 浏览由数据库用户建立的普通数据库表。 (2)选择“系统表”来浏览数据库的系统表(包含数据库信息、索引的描述等)。该选项在浏览用于 Excel 的数据库时是非常必要的。 (3)选择 “视图”来查看视图,通常这是对一个或者多个普通表进行某个查询后,其生成记录组成的一个虚拟表。 (4)选择 “同义名” 查看在数据库中对任意现存的表建立的表名相似的同义名。 19.1.1.3 SQL查询 参数说明: 载入查询:点击“载入查询”按钮后打开文件浏览器,用户可以载入先前保存的查询,如图19-6所示为使用SQL查询载入数据对话框。 保存查询:点击“保存查询”按钮后打开保存查询对话框,用户可以用来保存目前查询,如图19-7所示使用SQL查询保存数据对话框。 导入默认值:点击“导入默认值”按钮后选择一个 SQL SELECT 语句的例子,它是使用对话框中的表格和项目自动建立的。 清除:“清除”按钮清除工作区域的内容。如果用户想重新编辑时,使用这个选项。 19.1.1.4 查询表的实例 其步骤如下: 在数据库节点对话框“数据”页签中,选择“表”模式,从数据源的下拉列表中选择“添加新的数据库连接…”,如图19-8所示。打开数据库连接对话框。 在数据库连接对话框中选择test1数据源,输入用户名和密码(如果没有用户名就可不输),点击“连接”按钮,即可显示目前连接的数据库test1,如图19-3所示。 点击“确定”按钮返回到主对话框中。 点击“选择”按钮从test1选择表/视图对话框中选择表dbo.sysoledbusers。 点击“确定”按钮返回到主对话框,如图19-2所示。 选择“SQL查询”模式,并点击“导入默认值”按钮导入数据库查询。 点击“保存查询”按钮保存该查询。 点击“清除”按钮,清除该查询内容。 点击“载入查询”按钮,载入已保存的查询。 19.1.2 从无格式文本文件中读取数据 数据存储和数据类型: 数据存储:描述字段中数据的存储方式。存储类型有:实数型、字符型、时间型、日期型和时间戳。 数据类型:是用来描述给定字段内容的一种方式,也就是常称的类型。数据类型有:默认型、连续型、离散型、标志型、集合型和有序集合型等。 使用“存储类型”来获取每一个字段存储类型的列表或从列表中选择存储类型来重置现有的存储类型(这时必须要勾选“覆盖”列的复选框),如图19-9所示。 19.1.3 从固定字段的文本文件中读取数据 从固定字段的文本文件中读入数据 可以使用固定文件节点。 其“文件”页签如图19-11所示,可以很容易的指定数据库中数据列的位置和长度。 19.1.4导入SPSS文件 导入SPSS文件相应的步骤如下: (1)输入文件名或者用自定义(…)按钮选择文件。文件选定后,路径会显示在文本框中,如图19-12所示。 (2)选择“变量名称”或“值”。 变量名称:如果在.sav 文件中想使用描述性变量标签而不是简短的字段名,可选择这一选项。这个选项缺省为取消选定,意味着.sav文件中的长名称将不能从SPSS文件读入Clementine中,也不能输出。 值:在.sav 文件中如果想使用变量值标签而不是用表示变量值的抽象符号和数字就选择这一选项。 例如,用1和2来分别表示性别“男”和“女”的数据中,就可以使用这个选项,该字段将会转换为字符型,并导入“男
文档评论(0)