网站大量收购独家精品文档,联系QQ:2885784924

12 实验原理.doc

  1. 1、本文档共4页,其中可免费阅读2页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
项目数据清理实验目的掌握缺失值的六种基本处理手段掌握噪声数据的三种基本平滑处理手段实验原理对于数据挖掘和分析人员来说数据准备包括数据的抽取清洗转换和集成常常占据了左右的工作量而在数据准备的过程中数据质量差又是最常见而且令人头痛的问题在各种实用的数据库中属性值缺失的情况经常发全甚至是不可避免的值得注意的是这里所说的缺失值不仅包括数据库中的值也包括用于表示数值缺失的特殊数值比如在系统中用来表示数值不存在如果仅有数据库的数据模型而缺乏相关说明常常需要花费更多的精力来发现这些数值的特殊含义而如果漠视这些

项目1 数据清理 1.1 实验目的 (1)掌握缺失值的六种基本处理手段; (2)掌握噪声数据的三种基本平滑处理手段。 1.2 实验原理 对于数据挖掘和分析人员来说,数据准备(Data Preparation,包括数据的抽取、清洗、转换和集成)常常占据了70%左右的工作量。而在数据准备的过程中,数据质量差又是最常见而且令人头痛的问题。在各种实用的数据库中,属性值缺失的情况经常发全甚至是不可避免的。值得注意的是,这里所说的缺失值,不仅包括数据库中的NULL值,也包括用于表示数值缺失的特殊数值(比如,在系统中用-999来表示数值不存在)。如果仅有数据库的数据模型,而缺乏相关说明,常常需要花费更多的精

文档评论(0)

yanpizhuang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档