网站大量收购闲置独家精品文档,联系QQ:2885784924

《Python机器学习》 课件 第3章 Python常用机器学习库(2) Pandas.pptx

《Python机器学习》 课件 第3章 Python常用机器学习库(2) Pandas.pptx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python机器学习第3章 Python常用机器学习库 3.2 Pandas Pandas(Python Data Analysis Library)是Python的一个数据分析包,是基于NumPy的一种工具,为了解决数据分析任务而创建的。Pandas使用强大的数据结构,提供高性能的数据操作和分析工具,能够高效分析数据。Pandas主要处理以下三种数据结构: (1)Series:一维数组,与NumPy的一维ndarray类似。数据结构接近List列表,数据元素可以是不同的数据类型。 (2)DataFrame:二维数据结构。DataFrame可以理解成Series的容器,其内部的每项元素都可以看作一个Series。 (3)Panel:三维数组,可以理解为DataFrame的容器,其内部的每项元素都可以看作一个DataFrame。这些数据结都是构建在NumPy数组的基础之上,运算速度很快。3.2.1 Series数据结构 由一组数据以及一组与之相关的数据标签(即索引)组成。1. 创建Series对象使用函数:pd.Series(data, index)data表示数据值index是索引,缺省情况下是0到N-1(N为数据的长度)的整数型索引。访问Series对象成员可以用索引编号,也可以按索引名。【例3.29】创建一个Series对象。import pandas as pds = pd.Series([1,3,5,9,6,8])print(s)【例3.30】为一个地理位置数据创建Series对象。import pandas as pd#使用列表创建,索引值为默认值。print(--------列表创建series ----------)s1=pd.Series([1,1,1,1,1])print(s1)print(--------字典创建series ----------)#使用字典创建,索引值为字典的key值s2=pd.Series({Longitude:39,Latitude:116,Temperature:23})print(First value in s2:,s2[Longitude])print(-------- 用序列作series索引 ----------)#使用range函数生成的迭代序列设置索引值s3=pd.Series([3.4,0.8,2.1,0.3,1.5],range(5,10))print(First value in s3:,s3[5])2. 访问Series数据对象1)修改数据可以通过赋值操作直接修改Series对象成员的值,还可以为多个对象成员批量修改数据。2)按条件表达式筛选数据3)增加对象成员两个Series对象可以通过append函数进行拼接,从而产生一个新Series对象。【例3.33】为s2添加一项湿度数据。stiny=pd.Series({humidity:84})s4=s2.append(stiny)4)删除对象成员可以通过drop函数删除对象成员。3.2.2 DataFrame对象 DataFrame是一个表格型的数据结构。列索引(columns)对应字段名,行索引(index)对应行号,值(values)是一个二维数组。每一列表示一个独立的属性,各个列的数据类型(数值、字符串、布尔值等)可以不同。DataFrame既有行索引也有列索引,所以DataFrame也可以看成是Series的容器。1. 创建DataFrame对象构建DataFrame的办法有很多,基本方法是使用DataFrame()函数构造,格式如下:DataFrame([data, index, columns, dtype, copy])【例】:1) 从字典构建DataFrame2)从数组创建Dataframe3)从csv文件中读取数据到DataFrame2. 访问DataFrame对象可以通过索引对DataFrame进行访问,可以获取其中的一个或多个行和/或列。3. 修改DataFrame数据1)修改数据通过赋值语句修改数据,可以修改指定行、列的数据,还可以把要修改的数据查询筛选出来,或重新赋值。2)增加列DataFrame对象可以添加新的列,通过赋值语句赋值时,只要列索引名不存在,就添加新列,否则就修改列值,这与字典的特性相似。3)合并添加数据DataFrame对象可以增加新列,如果需要增加几行数据,需要将数据存入一个新DataFrame对象,然后将两个DataFrame对象进行合并。【例】见示例。4)删除DataFrame对象的数据Drop函数可以按行列删除数据,drop函数基本格式:DataFrame对象.drop(索引值或索引列表,axis=0, inplace=False……)主要参数:axis

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档