数据分析应用项目化教程(Python) 课件 任务6.2 数据合并和连接.pptx

数据分析应用项目化教程(Python) 课件 任务6.2 数据合并和连接.pptx

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第六章使用pandas进行数据清洗和整理

任务6.2数据合并和连接concat合并append合并merge连接join连接combine_first和combine填充合并

concat合并使用某种合并方式(inner/outer)沿着某个轴向(axis=0/1)将多个对象进行堆叠把多个Pandas对象(DataFrame/Series)合并成一个

concat合并pandas.concat(objs,axis=0,join=outer,‘join_axes=None’,ignore_index=False,‘keys=None’)objs:一个列表,要进行拼接的pandas对象,可以是DataFrame或者Series,可以混合axis:指定对象按照那个轴进行拼接,默认为0(纵向拼接),1为横向拼接join:拼接的方式,inner为交集,outer为并集join_axes:index的列表,仅在横向合并时使用,指明要将数据合并入哪个原表的indexignore_index:如果设置为true,则无视表原来的轴标签,合并后生成新的轴标签keys:表标识的列表,用来区分合并的表来自哪里

concat合并-按行pd.concat(frames):默认参数的concat,按行合并,参数为axis=0、join=outer、ignore_index=False

concat合并-按行pd.concat(frames,keys=[x,y,z])使用keys标识表

concat合并-按列pd.concat([df1,df4],axis=1)按列合并,axis=1pd.concat([df1,df4],axis=1,join=inner)#按行索引相同合并列

append合并append语法:DataFrame.append(other,ignore_index=False)append只有按行合并,没有按列合并,相当于concat按行的简写形式other:单个dataframe、series、dict,或者列表ignore_index:是否忽略掉原来的数据索引

merge连接Pandas的Merge,相当于Sql的Join,将不同的表按key关联到一个表。merge的语法:pd.merge(left,right,how=inner,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(x,y),copy=True,indicator=False,validate=None)left,right:要连接的dataframe或者Serieshow:join类型,left,right,outer,inneron:join的key,left和right都需要有这个keyleft_on:left的df或者series的keyright_on:right的df或者seires的keyleft_index,right_index:使用index而不是普通的column做joinsuffixes:两个元素的后缀,如果列有重名,自动添加后缀,默认是(x,y)

?merge连接pd.merge(left,right,on=key)默认等值连接,左边和右边的key都有,才会出现在结果里

merge连接pd.merge(left,right,on=[key1,key2])#多个关键字等值连接,默认how=‘inner’

merge连接pd.merge(left,right,how=left,on=[key1,key2])#左边的都会出现在结果里,右边的如果无法匹配则为Null

merge连接pd.merge(left,right,how=right,on=[key1,key2])右边的都会出现在结果里,左边的如果无法匹配则为Null

merge连接pd.merge(left,right,how=outer,on=[key1,key2])#左边、右边的都会出现在结果里,如果无法匹配则为Null

join连接默认行索引匹配连接,merge()默认是列索引匹配连接。用法:join()方法能够通过索引或指定列来连接多个DataFrame对象,它默认以index作为对齐的列。join()和merge()一样,是横向拼接,只能进行数据匹配,即添加列,不能添加行,并且支持how的四种模式:inner,left,right,outer。其实join()就是merge()的一种封装,后台调用的正是merge(

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档