- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大工21春《数据挖掘》大作业题目及要求【答案】--第1页
大工21春《数据挖掘》大作业题目及要
求【答案】
XXX
数据挖掘》课程大作业
题目:Knn算法原理以及python实现
姓名:
研究中心:
第一大题:讲述自己在完成大作业过程中遇到的困
难,解决问题的思路,以及相关感想,或者对这个项
目的认识,或者对Python与数据挖掘的认识等等,
300-500字。
答:数据分析和数据挖掘并不是相互独立的,数据分析通
常是直接从数据库取出已有信息,进行一些统计、可视化、文
字结论等,最后可能生成一份研究报告性质的东西,以此来辅
助决策。但是如果要分析已有信息背后的隐藏信息,而这些信
息通过观察往往是看不到的,这是就需要用到数据挖掘,作为
分析之前要走的一个门槛。数据挖掘不是简单的认为推测就可
以,它往往需要针对大量数据,进行大规模运算,才能得到一
些统计学规律。
大工21春《数据挖掘》大作业题目及要求【答案】--第1页
大工21春《数据挖掘》大作业题目及要求【答案】--第2页
科技的快速发展和数据的存储技术的快速进步,使得各种
行业或组织的数据得以海量积累。但是,从海量的数据当中,
提取有用的信息成为了一个难题。在海量数据面前,传统的数
据分析工具和方法很无力。由此,数据挖掘技术就登上了历史
的舞台。
数据挖掘是一种技术,将传统的数据分析办法与处理大量
数据的复杂算法相联合,从大量的、不完全的、有噪声的、模
糊的、随机的数据中,提取隐含在其中的、人们事前不知道的、
但又是潜在有效信息和常识的过程。
第二大题:完成下面一项大作业题目。
题目一:Knn算法道理以及python完成
答:
一、knn算法介绍
邻近算法,或者说K最近邻(kNN。k-NearestNeighbor)
分类算法是数据挖掘分类技术中最简单的方法之一。所谓K
最近邻,就是k个最近的邻居的意思,说的是每个样本都可以
用它最接近的k个邻居来代表。kNN算法的核心思想是如果
一个样本在特征空间中的k个最相邻的样本中的大多数属于某
一个类别,则该样本也属于这个类别,并具有这个类别上样本
大工21春《数据挖掘》大作业题目及要求【答案】--第2页
大工21春《数据挖掘》大作业题目及要求【答案】--第3页
的特性。该方法在确定分类决策上只依据最邻近的一个或者几
个样本的类别来决定待分样本所属的类别。
在种别决议时,只与少少量的相邻样本有关。因为kNN
办法主要靠周围有限的邻近的样本,而不是靠判别类域的办法
来肯定所属种此外,因而关于类域的交叉或堆叠较多的待分样
本集来说,kNN办法较其他办法更为适合。
2、核心概括
主要的思想是计算待分类样本与训练样本之间的差异性,
并将差异按照由小到大排序,选出前面K个差异最小的类别,
并统计在K个中类别出现次数最多的类别为最相似的类,最
终将待分类样本分到最相似的训练样本的类中。与投票(Vote)
的机制类似。
三、knn算法流程
1.准备数据,对数据举行预处理
2.选用合适的数据结构储备训练数据和测试元组
3.设定参数
您可能关注的文档
- 天津资产管理有限公司章程.pdf
- 天津市南开翔宇学校新初一分班语文试卷含答案.pdf
- 天文望远镜基本知识.pdf
- 大象的耳朵第一课时教案.pdf
- 大米品牌运营理念分享.pdf
- 大班美术叶子画教案.pdf
- 大班数学领域教案《顺数和倒数》(精选13篇).pdf
- 大班幼儿户外活动教案7篇.pdf
- 大班3月份育儿知识10篇.pdf
- 大数据复习题(答案).pdf
- 2021-2022学年湖南省常德市安乡县四年级上学期期中语文真题及答案.pdf
- 2023-2024学年河南省南阳市社旗县四年级上学期期中数学真题及答案.pdf
- 2022-2023学年云南省曲靖市四年级下学期期末数学真题及答案.pdf
- 2021-2022学年河南省周口市鹿邑县二年级下册月考语文真题及答案.pdf
- 2018年河南焦作解放区教师招聘考试真题及答案.pdf
- 2019年江西公务员行测考试真题及答案-乡镇.pdf
- 2019中国石油报社应届高校毕业生招聘试题及答案解析.pdf
- 光大银行招聘应届毕业生能力素质测试笔试真题及答案.pdf
- 2024年广西百色教师招聘考试模拟题及答案.pdf
- 2021-2022学年浙江绍兴诸暨市五年级上册语文期末试卷及答案.pdf
文档评论(0)