网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘实验1.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《物联网智能信息处理》 实 验 报 告 学院:计算机科学技术学院 专业班级:物联网工程1101 学号:2011001557 姓名: 孙泽东 日期:2014 年11 月25 日 实验一 数据预处理实验(2个学时) 一、实验目的: 熟悉数据预处理的一般流程,重点掌握异常点检测算法,为进一步挖掘数据 做准备。 二、实验内容: 1.了解数据特点,熟悉2-3种数据集数据格式; 2.掌握1种以上异常点检测原理; 3.验证某种异常点检测算法; 4.分析异常点检测算法检测结果。 三、实验要求: 在熟悉2-3种数据集数据格式的基础上,选择Dev-C++等开发环境打开异常 点检测算法源代码,搞清算法基本原理,接着修改其数据源 (数据文件路径及文 件名等)、常量大小等,调试程序并试运行,在此基础上修改数据输出方式,统 计异常点个数等,完成实验报告。 四、实验环境: 软件环境:Windows/Linux,C++(Dev-C++); 硬件环境:P4 2.4G/80G/1G/64M及较高配置的PC机。 五、实验步骤: 1.安装和配置Dev-C++开发环境; 2.通过查阅课本、网络资料和研读教师提高的材料,了解相关知识; 3.按照实验要求,逐步完成实验内容; 4. 调试程序,输出结果,并进行记录。 结果 六、思考题: 1.为什么要对数据进行预处理? 数据预处理是非常重要的一环,且必不可少,要获得满意的处理效果 (挖掘 出有用的知识),必须提供干净,准确,简洁的数据,而实际系统中有很多“脏 数据”,必须处理掉。 2.什么样的数据点算异常点? 异常点是在数据集中与众不同的数据,使人怀疑这些数据并非书记偏离,而是产 生于完全不同的机制。

文档评论(0)

万千风采 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档