北科数据挖掘课件(张德政).pdf

北科数据挖掘课件(张德政).pdf

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共497页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

(CognitionBasedKnowledgeDiscoveryinDatabase

KDDofComplexDataObject)

——张德政

数据、信息、知识

-我们经常将数据看成一串位,或数字和符号,或我们每

天收集的“对象”。

-信息是减少到表征数据所需的最小数据。

-知识是作为我们的“精神图片”被理解、发现或学习的

一种综合信息,包括事实及其关系。

数据、信息、知识的关系

Value

DSS

MIS:Management

InformationSystem

DSS:DecisionSupport

Systems

MIS

(操作进程)

数据分类

1)按照数据所属行业类别分类

Ø科学数据:科学研究过程中产生的数据

–天、地、生等自然科学

–政治、经济等社会科学

Ø生产数据:加工制造生产过程产生的数据

–生产制造过程

–仓储物流过程

–生产管理过程

数据及数据分类

2)按照数据来源分类

•人类交互过程的数据

–各专业行业业务

–社会政治经济活动

•物联网数据:设备检测、监测、控制数据

–仪器设备状态

–流程过程控制

–环境监测

数据及数据分类

3)按照数据类型分类

•结构化数据

–数据元素之间的语义关系清晰简单

–语义关系可形式化表达

–结构化数据,即行数据,存储在关系型数据库中,

可以用二维表结构来逻辑表达实现的数据,例如

Oracle,DB2,SQLServer等数据库中的数据

数据及数据分类

3)按照数据类型分类

•半结构化数据

–宏观结构清晰

–微观结构语义复杂

–半结构化,字段可根据需要扩充,即字段数目不

定,可称为半结构化数据,例如XML,具有一定格

式的文本

数据及数据分类

3)按照数据类型分类

•非结构化数据

–音频,文本

–图片

–视频

–非结构化:无法用数字或统一的结构表示,例如

Web页面,文本,视频,音频,图像等。

实例—结构化数据

由东京医学和Dent大学的松本(Tsumoto)教授提出的医学数据,有38

个属性:

...

10,M,0,10,10,0,0,0,SUBACUTE,37,2,1,0,15,-,-,6000,2,0,abnormal,

abnormal,-,2852,2148,712,97,49,F,-,multiple,,2137,negative,n,n,ABSCESS,VIRUS

12,M,0,5,5,0,0,0,ACUTE,38.5,2,1,0,15,-,-,10700,4,0,normal,abnormal,+,

1080,680,400,71,59,F,-,ABPC+CZX,,70,negative,n,n,n,BACTERIA,BACTERIA

15,M,0,3,2,3,0,0,ACUTE,39.3,3,1,0,15,-,-,6000,0,0,normal,abnormal,+,

1124,622,502,47,63,F,-,FMOX+AMK,,48,negative,n,n,n,BACTE(E),BAC

文档评论(0)

雄性水豚 + 关注
实名认证
内容提供者

网上冲浪

1亿VIP精品文档

相关文档