spark mllib 研究、使用目录.pdf

  1. 1、本文档共14页,其中可免费阅读5页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究使用目录一概要二数据类型本地向量标记点本地矩阵分布式矩阵三基本统计分析概要统计量相关性分层抽样假设测定随机数生成四分类和回归二元分类线性回归决策树朴素贝叶斯保序回归五协同过滤六聚类算法七降维八特征提取和转换九频繁模式挖掘一概要是一个可扩展的机器学习库由通用的学习算法和工具组成包括二元分类线性回归聚类协同过滤降维特征提取和转换以及底层优化原语借助分布式计算框架和弹性分布式数据集能够高效完成机器学习工作提供三种新增了本文基于对的一些概念及部分算法使用方法做一些说明同时对其中一些例子做了调整详细代

Spark MLlib 研究、使用 目录 一、概要 2 二、数据类型 2 2.1 本地向量(Local vector) 2 2.2 标记点 (Labeled point) 2 2.3 本地矩阵 (Local matrix) 3 2.4 分布式矩阵(Distributed matrix) 3 三、基本统计分析 5 3.1 概要统计量 (Summary statistics) 5 3.2 相关性 (C

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档