- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python机器学习第3章 Python常用机器学习库 3.2 Pandas Pandas(Python Data Analysis Library)是Python的一个数据分析包,是基于NumPy的一种工具,为了解决数据分析任务而创建的。Pandas使用强大的数据结构,提供高性能的数据操作和分析工具,能够高效分析数据。Pandas主要处理以下三种数据结构: (1)Series:一维数组,与NumPy的一维ndarray类似。数据结构接近List列表,数据元素可以是不同的数据类型。 (2)DataFrame:二维数据结构。DataFrame可以理解成Series的容器,其内部的每项元素都可以看作一个Series。 (3)Panel:三维数组,可以理解为DataFrame的容器,其内部的每项元素都可以看作一个DataFrame。这些数据结都是构建在NumPy数组的基础之上,运算速度很快。3.2.1 Series数据结构 由一组数据以及一组与之相关的数据标签(即索引)组成。1. 创建Series对象使用函数:pd.Series(data, index)data表示数据值index是索引,缺省情况下是0到N-1(N为数据的长度)的整数型索引。访问Series对象成员可以用索引编号,也可以按索引名。【例3.29】创建一个Series对象。import pandas as pds = pd.Series([1,3,5,9,6,8])print(s)【例3.30】为一个地理位置数据创建Series对象。import pandas as pd#使用列表创建,索引值为默认值。print(--------列表创建series ----------)s1=pd.Series([1,1,1,1,1])print(s1)print(--------字典创建series ----------)#使用字典创建,索引值为字典的key值s2=pd.Series({Longitude:39,Latitude:116,Temperature:23})print(First value in s2:,s2[Longitude])print(-------- 用序列作series索引 ----------)#使用range函数生成的迭代序列设置索引值s3=pd.Series([3.4,0.8,2.1,0.3,1.5],range(5,10))print(First value in s3:,s3[5])2. 访问Series数据对象1)修改数据可以通过赋值操作直接修改Series对象成员的值,还可以为多个对象成员批量修改数据。2)按条件表达式筛选数据3)增加对象成员两个Series对象可以通过append函数进行拼接,从而产生一个新Series对象。【例3.33】为s2添加一项湿度数据。stiny=pd.Series({humidity:84})s4=s2.append(stiny)4)删除对象成员可以通过drop函数删除对象成员。3.2.2 DataFrame对象 DataFrame是一个表格型的数据结构。列索引(columns)对应字段名,行索引(index)对应行号,值(values)是一个二维数组。每一列表示一个独立的属性,各个列的数据类型(数值、字符串、布尔值等)可以不同。DataFrame既有行索引也有列索引,所以DataFrame也可以看成是Series的容器。1. 创建DataFrame对象构建DataFrame的办法有很多,基本方法是使用DataFrame()函数构造,格式如下:DataFrame([data, index, columns, dtype, copy])【例】:1) 从字典构建DataFrame2)从数组创建Dataframe3)从csv文件中读取数据到DataFrame2. 访问DataFrame对象可以通过索引对DataFrame进行访问,可以获取其中的一个或多个行和/或列。3. 修改DataFrame数据1)修改数据通过赋值语句修改数据,可以修改指定行、列的数据,还可以把要修改的数据查询筛选出来,或重新赋值。2)增加列DataFrame对象可以添加新的列,通过赋值语句赋值时,只要列索引名不存在,就添加新列,否则就修改列值,这与字典的特性相似。3)合并添加数据DataFrame对象可以增加新列,如果需要增加几行数据,需要将数据存入一个新DataFrame对象,然后将两个DataFrame对象进行合并。【例】见示例。4)删除DataFrame对象的数据Drop函数可以按行列删除数据,drop函数基本格式:DataFrame对象.drop(索引值或索引列表,axis=0, inplace=False……)主要参数:axis
您可能关注的文档
- 《Python机器学习》 课件 第1章 机器学习概述.pptx
- 《Python机器学习》 课件 0 课程导学.pptx
- 《Python机器学习》 课件 第2章 Python数据处理基础.pptx
- 《Python机器学习》 课件 第3章 Python常用机器学习库(1) Numpy.pptx
- 《Python机器学习》 课件 第3章 Python常用机器学习库(3) Matplotlib.pptx
- 《Python机器学习》 课件 第3章 Python常用机器学习库(4) 其他库.pptx
- 《Python机器学习》 课件 第4章 机器学习基础.pptx
- 《Python机器学习》 课件 第5章 KNN分类算法.pptx
- 《Python机器学习》 课件 第6章 K-Means聚类算法.pptx
- 《Python机器学习》 课件 第7章 推荐算法.pptx
- 2022人教版二年级上册数学期中测试卷附答案【满分必刷】.docx
- 2022人教版二年级上册数学期中测试卷附完整答案【名师系列】.docx
- 2022人教版二年级上册数学期中测试卷附参考答案(预热题).docx
- 2022人教版二年级上册数学期中测试卷附完整答案【全优】.docx
- 2025年上半年工作总结及下半年工作计划常用版(三篇) .pdf
- 2022人教版二年级上册数学期中测试卷附参考答案(达标题).docx
- 2022人教版二年级上册数学期中测试卷附参考答案(综合卷).docx
- 2022人教版二年级上册数学期中测试卷附答案【培优a卷】.docx
- 2022人教版二年级上册数学期中测试卷附参考答案(精练).docx
- 2022人教版二年级上册数学期中测试卷附答案【名师推荐】.docx
最近下载
- QC成果-提高电气接线盒预埋一次合格率QC.ppt
- 某米三角形单跨封闭式钢屋架结构设计.docx VIP
- 新版加油站全员安全生产责任制.docx VIP
- GB 50372 - 2006炼铁机械设备工程安装验收规范.docx
- 第三方支付外文文献翻译2018.docx
- 消防设施操作员(中级监控)理论试题六有答案.docx
- 专训09 名篇名句默写《过秦论》(教师版)-2025年新高考语文一轮复习各考点满分宝鉴.docx
- 《湖北省城市地下综合管廊工程维护消耗量定额及全费用基价表》.pdf VIP
- (高清版)B/T 43981-2024 基层减灾能力评估技术规范.pdf VIP
- 冬季三防专题培训(防火防冻防中毒).pptx
文档评论(0)