- 1、本文档共497页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
(CognitionBasedKnowledgeDiscoveryinDatabase
KDDofComplexDataObject)
——张德政
数据、信息、知识
-我们经常将数据看成一串位,或数字和符号,或我们每
天收集的“对象”。
-信息是减少到表征数据所需的最小数据。
-知识是作为我们的“精神图片”被理解、发现或学习的
一种综合信息,包括事实及其关系。
数据、信息、知识的关系
Value
DSS
MIS:Management
InformationSystem
DSS:DecisionSupport
Systems
MIS
(操作进程)
数据分类
1)按照数据所属行业类别分类
Ø科学数据:科学研究过程中产生的数据
–天、地、生等自然科学
–政治、经济等社会科学
Ø生产数据:加工制造生产过程产生的数据
–生产制造过程
–仓储物流过程
–生产管理过程
数据及数据分类
2)按照数据来源分类
•人类交互过程的数据
–各专业行业业务
–社会政治经济活动
•物联网数据:设备检测、监测、控制数据
–仪器设备状态
–流程过程控制
–环境监测
数据及数据分类
3)按照数据类型分类
•结构化数据
–数据元素之间的语义关系清晰简单
–语义关系可形式化表达
–结构化数据,即行数据,存储在关系型数据库中,
可以用二维表结构来逻辑表达实现的数据,例如
Oracle,DB2,SQLServer等数据库中的数据
数据及数据分类
3)按照数据类型分类
•半结构化数据
–宏观结构清晰
–微观结构语义复杂
–半结构化,字段可根据需要扩充,即字段数目不
定,可称为半结构化数据,例如XML,具有一定格
式的文本
数据及数据分类
3)按照数据类型分类
•非结构化数据
–音频,文本
–图片
–视频
–非结构化:无法用数字或统一的结构表示,例如
Web页面,文本,视频,音频,图像等。
实例—结构化数据
由东京医学和Dent大学的松本(Tsumoto)教授提出的医学数据,有38
个属性:
...
10,M,0,10,10,0,0,0,SUBACUTE,37,2,1,0,15,-,-,6000,2,0,abnormal,
abnormal,-,2852,2148,712,97,49,F,-,multiple,,2137,negative,n,n,ABSCESS,VIRUS
12,M,0,5,5,0,0,0,ACUTE,38.5,2,1,0,15,-,-,10700,4,0,normal,abnormal,+,
1080,680,400,71,59,F,-,ABPC+CZX,,70,negative,n,n,n,BACTERIA,BACTERIA
15,M,0,3,2,3,0,0,ACUTE,39.3,3,1,0,15,-,-,6000,0,0,normal,abnormal,+,
1124,622,502,47,63,F,-,FMOX+AMK,,48,negative,n,n,n,BACTE(E),BAC
文档评论(0)