教案运用大数据分析Kmeans算法实战.pdf

教案运用大数据分析Kmeans算法实战.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课名: 《大数据平台应用》 教师: 班级: 编写时间: 课题:项目 6 分析大数据 第 2 部分 运用大数据分析 Kmeans 算法实战 课次:第 19 次 教学目标及要求: (1)任务 1 安装 Scikit Learn 库(掌握) (2 )任务 2 解析 KMeans 算法(掌握) (3 )任务 3 运用 KMeans 算法实战(熟练掌握) 教学重点: (1)任务 2 解析 KMeans 算法(掌握) (2 )任务 3 运用 KMeans 算法实战(熟练掌握) 教学难点: (1)任务 2 解析 KMeans 算法(掌握) (2 )任务 3 运用 KMeans 算法实战(熟练掌握) 思政主题: 教学步骤及内容 : 旁批栏: 1.课程引入 2.本次课学习内容、重难点及学习要求介绍 (1)任务 1 安装 Scikit Learn 库(掌握) (2)任务 2 解析 KMeans 算法(掌握) (3)任务 3 运用 KMeans 算法实战(熟练掌握) 3.本次课的教学内容 (1)任务 1 安装 Scikit Learn 库(掌握) Scikit-learn 是 Python 的一个开源机器学习模块, 它建立在 NumPy,SciPy 和 matplotlib 模块之上能够为用户提供各种机器学习算法接口,可以让用户 简单、高效地进行数据挖掘和数据分析。 分类是指识别给定对象的所属类别, 属于监督学习的范畴, 最常见的应 用场景包括垃圾邮件检测和图像识别等。目前 Scikit-learn 已经实现的算法 - 1 - 包括支持向量机( SVM )、K-近邻、逻辑回归、随机森林、决策树及多层 感知器( MLP )神经网络等。 回归是指预测与给定对象相关联的连续值属性, 最常见的应用场景包括 预测药物反应和预测股票价格等。 目前 Scikit-learn 已经实现的算法包括支 持向量回归( SVR )、脊回归、 Lasso 回归、弹性网络( Elastic Net)、最小 角回归( LARS )、贝叶斯回归及各种不同的鲁棒回归算法等。 聚类是指自动识别具有相似属性的给定对象, 并将其分组为集合, 属于 无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。 目 前 Scikit-learn 已经实现的算法包括 K-均值聚类、谱聚类、均值偏移、分层 聚类、 DBSCAN 聚类等。 数据降维是指使用主成分分析( PCA)、非负矩阵分解( NMF )或特征 选择等降维技术来减少要考虑的随机变量的个数, 其主要应用场景包括可视 化处理和效率提升。 模型选择是指对于给定参数和模型的比较、 验证和选择, 其主要目的是 通过参数调整来提升精度。目前 Scikit-learn 实现的模块包括格点有哪些信誉好的足球投注网站、交 叉验证和各种针对预测误差评估的度量函数。 数据预处理是指数据的特征提取和归一化, 是机器学习过程中的第一个 也是最重要的环节。 这里归一化是指将输入数据转换为具有零均值和单位权 方差的新变量, 但因为大多数时候都做不到精确到零, 因此会设置一个可接 受的范围,一般都要求范围为 0~1。而特征提取是指将文本或图像数据转换 为可用于机器学习的数字变量。

文档评论(0)

虾虾教育 + 关注
官方认证
内容提供者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档