数据分析应用项目化教程（Python）课件任务6.2 数据合并和连接.pptx

下载文档

0
0
约3.86千字
约 23页
2024-07-14 发布于山东
举报
版权申诉
保障服务

数据分析应用项目化教程（Python）课件任务6.2 数据合并和连接.pptx

1、本文档共23页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第六章使用pandas进行数据清洗和整理

任务6.2数据合并和连接concat合并append合并merge连接join连接combine_first和combine填充合并

concat合并使用某种合并方式(inner/outer)沿着某个轴向(axis=0/1)将多个对象进行堆叠把多个Pandas对象(DataFrame/Series)合并成一个

concat合并pandas.concat(objs,axis=0,join=outer,‘join_axes=None’，ignore_index=False，‘keys=None’)objs：一个列表，要进行拼接的pandas对象，可以是DataFrame或者Series，可以混合axis：指定对象按照那个轴进行拼接，默认为0（纵向拼接），1为横向拼接join：拼接的方式，inner为交集，outer为并集join_axes：index的列表，仅在横向合并时使用，指明要将数据合并入哪个原表的indexignore_index：如果设置为true，则无视表原来的轴标签，合并后生成新的轴标签keys：表标识的列表，用来区分合并的表来自哪里

concat合并-按行pd.concat(frames)：默认参数的concat，按行合并，参数为axis=0、join=outer、ignore_index=False

concat合并-按行pd.concat(frames,keys=[x,y,z])使用keys标识表

concat合并-按列pd.concat([df1,df4],axis=1)按列合并，axis=1pd.concat([df1,df4],axis=1,join=inner)#按行索引相同合并列

append合并append语法：DataFrame.append(other,ignore_index=False)append只有按行合并，没有按列合并，相当于concat按行的简写形式other：单个dataframe、series、dict，或者列表ignore_index：是否忽略掉原来的数据索引

merge连接Pandas的Merge，相当于Sql的Join，将不同的表按key关联到一个表。merge的语法：pd.merge(left,right,how=inner,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(x,y),copy=True,indicator=False,validate=None)left，right：要连接的dataframe或者Serieshow：join类型，left,right,outer,inneron：join的key，left和right都需要有这个keyleft_on：left的df或者series的keyright_on：right的df或者seires的keyleft_index，right_index：使用index而不是普通的column做joinsuffixes：两个元素的后缀，如果列有重名，自动添加后缀，默认是(x,y)

?merge连接pd.merge(left,right,on=key)默认等值连接，左边和右边的key都有，才会出现在结果里

merge连接pd.merge(left,right,on=[key1,key2])#多个关键字等值连接,默认how=‘inner’

merge连接pd.merge(left,right,how=left,on=[key1,key2])#左边的都会出现在结果里，右边的如果无法匹配则为Null

merge连接pd.merge(left,right,how=right,on=[key1,key2])右边的都会出现在结果里，左边的如果无法匹配则为Null

merge连接pd.merge(left,right,how=outer,on=[key1,key2])#左边、右边的都会出现在结果里，如果无法匹配则为Null

join连接默认行索引匹配连接，merge()默认是列索引匹配连接。用法：join()方法能够通过索引或指定列来连接多个DataFrame对象，它默认以index作为对齐的列。join()和merge()一样，是横向拼接，只能进行数据匹配，即添加列，不能添加行，并且支持how的四种模式：inner,left,right,outer。其实join()就是merge()的一种封装，后台调用的正是merge(

您可能关注的文档

文档评论（0）

xiaobao + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

数据分析应用项目化教程（Python）课件任务6.2 数据合并和连接.pptx