- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第六章使用pandas进行数据清洗和整理
任务6.2数据合并和连接concat合并append合并merge连接join连接combine_first和combine填充合并
concat合并使用某种合并方式(inner/outer)沿着某个轴向(axis=0/1)将多个对象进行堆叠把多个Pandas对象(DataFrame/Series)合并成一个
concat合并pandas.concat(objs,axis=0,join=outer,‘join_axes=None’,ignore_index=False,‘keys=None’)objs:一个列表,要进行拼接的pandas对象,可以是DataFrame或者Series,可以混合axis:指定对象按照那个轴进行拼接,默认为0(纵向拼接),1为横向拼接join:拼接的方式,inner为交集,outer为并集join_axes:index的列表,仅在横向合并时使用,指明要将数据合并入哪个原表的indexignore_index:如果设置为true,则无视表原来的轴标签,合并后生成新的轴标签keys:表标识的列表,用来区分合并的表来自哪里
concat合并-按行pd.concat(frames):默认参数的concat,按行合并,参数为axis=0、join=outer、ignore_index=False
concat合并-按行pd.concat(frames,keys=[x,y,z])使用keys标识表
concat合并-按列pd.concat([df1,df4],axis=1)按列合并,axis=1pd.concat([df1,df4],axis=1,join=inner)#按行索引相同合并列
append合并append语法:DataFrame.append(other,ignore_index=False)append只有按行合并,没有按列合并,相当于concat按行的简写形式other:单个dataframe、series、dict,或者列表ignore_index:是否忽略掉原来的数据索引
merge连接Pandas的Merge,相当于Sql的Join,将不同的表按key关联到一个表。merge的语法:pd.merge(left,right,how=inner,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(x,y),copy=True,indicator=False,validate=None)left,right:要连接的dataframe或者Serieshow:join类型,left,right,outer,inneron:join的key,left和right都需要有这个keyleft_on:left的df或者series的keyright_on:right的df或者seires的keyleft_index,right_index:使用index而不是普通的column做joinsuffixes:两个元素的后缀,如果列有重名,自动添加后缀,默认是(x,y)
?merge连接pd.merge(left,right,on=key)默认等值连接,左边和右边的key都有,才会出现在结果里
merge连接pd.merge(left,right,on=[key1,key2])#多个关键字等值连接,默认how=‘inner’
merge连接pd.merge(left,right,how=left,on=[key1,key2])#左边的都会出现在结果里,右边的如果无法匹配则为Null
merge连接pd.merge(left,right,how=right,on=[key1,key2])右边的都会出现在结果里,左边的如果无法匹配则为Null
merge连接pd.merge(left,right,how=outer,on=[key1,key2])#左边、右边的都会出现在结果里,如果无法匹配则为Null
join连接默认行索引匹配连接,merge()默认是列索引匹配连接。用法:join()方法能够通过索引或指定列来连接多个DataFrame对象,它默认以index作为对齐的列。join()和merge()一样,是横向拼接,只能进行数据匹配,即添加列,不能添加行,并且支持how的四种模式:inner,left,right,outer。其实join()就是merge()的一种封装,后台调用的正是merge(
您可能关注的文档
- 数据分析应用项目化教程(Python) 课件 任务1.1 认识Python与数据分析.pptx
- 数据分析应用项目化教程(Python) 课件 任务1.2 认识数据分析类别与流程.pptx
- 数据分析应用项目化教程(Python) 课件 任务2.1 数据分析环境搭建-Anaconda3.pptx
- 数据分析应用项目化教程(Python) 课件 任务2.1 数据分析环境搭建-jupyter notebook.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.0 numpy概述.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.1 认识多维数组.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.2 创建多维数组.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.3 多维数组运算1.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.3 多维数组运算2.pptx
- 数据分析应用项目化教程(Python) 课件 任务3.4 多维数组的索引和切片.pptx
文档评论(0)