人工智能技术实验手册 第2章 机器学习概览实验指导手册.docx

人工智能技术实验手册 第2章 机器学习概览实验指导手册.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DOCPROPERTY ProductProject Name DOCPROPERTY DocumentName PAGE i DOCPROPERTY ProprietaryDeclaration 华为专有和必威体育官网网址信息 版权所有 ? 华为技术有限公司 文档版本 DOCPROPERTY DocumentVersion 01 ( DOCPROPERTY ReleaseDate 2015-12) 华为ICT认证系列教程 DOCPROPERTY ProductProject Name 人工智能技术 第2章 机器学习概览 实验指导手册 DOCPROPERTY Confidential 第 PAGE 1页 前 言 内容描述 本实验指导书书共包含1个实验,是基于如何利用sklearn-learn, python包利用不同的回归算法来对波士顿地区的房价来进行预测,希望学员或者读者能够入门机器学习,具备机器学习构建的基础编程能力。 读者知识背景 本课程为华为认证基础课程,为了更好地掌握本书内容,阅读本书的读者应首先具备以下基本条件: 具有基本的Python语言编程能力,有一定的数据结构基础,同时对深度学习算法知识有一定的认识。 实验环境说明 Python开发工具 本实验环境是基于Python3.6环境开发编译的。 目录 TOC \o 1-3 \h \z \u 前 言 1 内容描述 1 读者知识背景 1 实验环境说明 1 1 波士顿房价预测 3 1.1 实验介绍 3 1.1.1 关于本实验 3 1.1.2 实验目的 3 1.1.3 本实验数据集与框架 3 1.2 实验代码 4 1.2.1 引入相关依赖的包 4 1.2.2 载入数据集, 查看数据属性,可视化 5 1.2.3 分割数据集,并对数据集进行预处理 6 1.2.4 利用各类回归模型,对数据集进行建模 7 1.2.5 利用网格有哪些信誉好的足球投注网站对超参数进行调节 8 1.3 本章总结 10 波士顿房价预测 实验介绍 关于本实验 本实验所使用的开发环境的具体搭建可以参照《人工智能技术实验环境搭建实验手册》;由于本案例使用的数据集样本量较小,且数据来自于scikit-learn自带的开源波士顿房价数据。波士顿房价预测项目是一个简单的回归模型,通过该项目的学习可以学会一些关于机器学习库sklearn的基本用法和一些基本的数据处理方法。 实验目的 利用网络公开的波士顿房价数据集,作为模型输入数据。 构建机器学习模型,并进行训练与评估。 了解机器学习模型搭建的总体流程。 掌握机器学习模型训练,网格有哪些信誉好的足球投注网站,评估指标的运用。 掌握相关API的使用。 本实验数据集与框架 该案例主要内容是进行波士顿数据集,共有13个特征,总共506条数据,每条数据包含房屋以及房屋周围的详细信息。其中包含城镇犯罪率,一氧化氮浓度,住宅平均房间数,到中心区域的加权距离以及自住房平均房价等等。具体如下: CRIM:城镇人均犯罪率。 ZN:住宅用地超过 25000 sq.ft. 的比例。 INDUS:城镇非零售商用土地的比例。 CHAS:查理斯河空变量(如果边界是河流,则为1;否则为0)。 NOX:一氧化氮浓度。 RM:住宅平均房间数。 AGE:1940 年之前建成的自用房屋比例。 DIS:到波士顿五个中心区域的加权距离。 RAD:辐射性公路的接近指数。 TAX:每 10000 美元的全值财产税率。 PTRATIO:城镇师生比例。 B:1000(Bk-0.63)^ 2,其中 Bk 指代城镇中黑人的比例。 LSTAT:人口中地位低下者的比例。 target:自住房的平均房价,以千美元计。 框架:Sklearn,框架一方面提供波士顿房价数据,并且提供用于分割数据集,标准化,评价函数,另一方面集成了各类常规机器学习算法;另外我们使用了XGboost,是集成算法中GBDT的优化版本。 实验代码 引入相关依赖的包 # 防止不必要的警告 import warnings warnings.filterwarnings(ignore) ? # 引入数据科学基础包 import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt import pandas as pd import scipy.stats as st import seaborn as sns ## 设置属性防止画图中文乱码 mpl.rcParams[font.sans-serif] = [uSimHei] mpl.rcParams[axes.unicode_m

您可能关注的文档

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档