- 1、本文档共159页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第8章使用pandas进行数据清洗
目录8.1NumPy的基本使用方法8.2pandas数据结构8.3基本功能8.4汇总和描述统计8.5处理缺失数据8.6综合实例
8.1NumPy的基本使用方法
8.1NumPy的基本使用方法NumPy是Python语言的一个扩充程序库,支持高级的数组与矩阵运算,此外也针对数组运算提供了大量的数学函数库,包括线性代数运算、傅立叶变换和随机数生成等。如果没有安装NumPy,可以在Windows系统的cmd窗口中执行如下命令安装:pipinstallnumpy8.1.1数组创建8.1.2数组索引和切片8.1.3数组运算
8.1.1数组创建下面是数组创建的一些具体实例:importnumpyasnpa=[1,2,3,4,5]#创建简单的列表b=np.array(a)#将列表转换为数组barray([1,2,3,4,5])b.size#数组的元素个数5b.shape#数组的形状(5,)b.ndim#数组的维度1
8.1.1数组创建b.dtype#数据的元素类型dtype(int32)print(b[0],b[1],b[2])#访问数组元素123b[4]=6#修改数组元素barray([1,2,3,4,6])c=np.array([[1,2,3],[4,5,6]])#创建二维数组c.shape#数组的形状(2,3)print(c[0,0],c[0,1],c[0,2],c[1,0],c[1,1],c[1,2])123456
8.1.1数组创建Python做数据处理的时候经常要初始化高维矩阵,常用的函数包括zeros()、ones()、empty()、eye()、full()、random.random()、random.randint()、random.rand()、random.randn()等,具体如下:(1)zeros():创建一个矩阵,内部元素均为0,第一个参数提供维度,第二个参数提供类型。a=np.zeros([2,3],int)aarray([[0,0,0],[0,0,0]])(2)ones():创建一个矩阵,内部元素均为1,第一个参数提供维度,第二个参数提供类型。a=np.ones([2,3],int)aarray([[1,1,1],[1,1,1]])(3)empty():创建一个矩阵,内部是无意义的数值,第一个参数提供维度,第二个参数提供类型。a=np.empty([2,3],int)aarray([[0,0,0],[0,0,0]])
8.1.1数组创建(4)eye():创建一个对角矩阵,第一个参数提供矩阵规模,对于第二个参数而言,如果为0则对角线全为“1”,大于0则右上方第K条对角线全为“1”,小于0则左下方第K条对角线全为“1”,第三个参数提供类型。a=np.eye(3,k=1,dtype=int)aarray([[0,1,0],[0,0,1],[0,0,0]])a=np.eye(4,k=-2,dtype=int)aarray([[0,0,0,0],[0,0,0,0],[1,0,0,0],[0,1,0,0]])
8.1.1数组创建(5)full():full((m,n),c)可以生成一个m×n的元素全为c的矩阵。a=np.full((2,3),4)aarray([[4,4,4],[4,4,4]])(6)random.random():random.random((m,n))生成一个m×n的元素为0~1之间随机数的矩阵。a=np.random.random((2,3))aarray([[00.2398773,0,[000.5708038]])
8.1.1数组创建(7)random.randint():numpy.random.randint(low,high=None,size=None,dtype=l)函数的作用是,返回一个随机整型数,范围从低(包括)到高(不包括),即[low,high)。如果没有写参数high的值,则返回[0,low)的值。a=np.random.randint(2,size=10)aarray([
您可能关注的文档
- 《食品智能加工技术》课件——【企业案例】吴茂玉:在热爱与执着中笃行,用科技助力果蔬产业.pptx
- 《食品智能加工技术》课件——【行业案例】千年古早味——泉州蜜饯.pptx
- 《市场开拓与营销》课件——1-1产品发布模版-2.pptx
- 《室内设计》课件——任务3图层设置.pptx
- 《室内设计》课件——项目二 中外建筑与室内装饰基础知识——任务1中外建筑简史—2.1.1中国古代建筑简史.pptx
- 《室内设计》课件——项目二 中外建筑与室内装饰基础知识——任务1中外建筑简史—2.1.2西方古代建筑简史.pptx
- 《室内设计》课件——项目三 项目设计方案流程——任务1设计准备3.1.2项目设计草案.pptx
- 《室内设计》课件——项目三 项目设计方案流程——任务3设计实施3.3.1施工技术工作.pptx
- 《室内设计》课件——项目三 项目设计方案流程——任务3设计实施3.3.2竣工技术工作.pptx
- 《室内设计》课件——职业道德基本知识.pptx
- DB12 046.89-2011 产品单位产量综合电耗计算方法及限额 第89部分:手机 .docx
- DB12 046.88-2011 产品单位产量综合电耗计算方法及限额 第88部分:晶振 .docx
- DB12T 419-2010 无公害农产品 核桃栽培管理技术规范 .docx
- DB12T 417-2010 沙化和荒漠化监测技术规程.docx
- DB12T 449-2011 民用建筑四防门通用技术条件.docx
- DB12 046.100-2011 产品单位产量综合能耗计算方法及限额 第100部分: 果汁饮料 .docx
- DB12T 427-2010 葱姜蒜中205种农药多残留测定方法-GCMS法.docx
- DB12T 421-2010 有机农产品 甘薯有机栽培技术规范.docx
- DB12T 426-2010 蔬菜水果中205种农药多残留测定方法-GCMS法 .docx
- 《老年人身体康复》精品课件——项目6 中国传统康复技术.pptx
最近下载
- 人民大2024 刘翔平《积极心理学(第3版)》ppt第11章 宽容.pptx
- 6.Work,Energy&Power功,能和功率.ppt VIP
- 人民大2024 刘翔平《积极心理学(第3版)》ppt第4章 乐观.pptx
- (八省联考)2025年高考综合改革适应性演练 数学试卷(含答案详解).pdf
- 2024年中国消防救援学院面向社会公开招聘工作人员(14名)笔试模拟试题及答案解析.docx
- 食品工程职业生涯规划与管理.pptx VIP
- 食品工程职业生涯规划与管理.pptx VIP
- GCr15滚珠丝杆热处理工艺设计.docx
- 2024晋能控股集团有限公司所属晋能快成物流科技有限公司社会招聘22人笔试模拟试题及答案解析.docx
- 2023年西安外国语大学公共课《马克思主义哲学》期末试卷A(有答案).docx VIP
文档评论(0)