- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据财务分析
主讲:李盼盼
爱岗敬业诚实守信坚持准则提高技能
廉洁自律客观公正参与管理强化服务
项目三数据清洗与处理
任务四Python数据集成
Python数据集成
一、数据连接
1.merge()函数
merge()函数:具有表连接功能,类似于Excel中的vlookup()函数,可以根据一个
多多个兼键(列值)将不同DataFrame连接起来。
Merge()函数应用场景:两个DataFrame存在相同的键,根据键整合到一张表中,
函数语法如下:
pandas.merge(left,right,how=‘inner’,on=None,legt_on=None,right_on=
Noneleft_index=False,right_index=False,sort=False,suffixes=(‘_x’,’_y’),conp
y=True,indicator=False,validate=None)
爱岗敬业诚实守信
Python数据集成
一、数据连接
1.merge()函数
其参数:
left、right:两个不同的DataFrame
How:连接方式,有inner,outer,left,right,默认为inner连接
On:用于连接的列索引名称,左右两个DataFrame中必须同时存在,如果没有指
定且left_index和right_index为False,则以两个DataFrame列名交集作为连接键。
Left_on:左侧DataFrame中用于连接键的列名,该参数在左右列名不同但代表的
含义相同时非常有用
廉洁自律客观公正
Python数据集成
一、数据连接
1.merge()函数
Right_on:右侧DataFrame中用于连接键的列名。
Left_index:默认False,设置为True代表使用左侧DataFrame中的行索引作
为连接键
Right_index:默认False,设置为True代表使用右侧DataFrame中的行索引作
为连接键
Sort:默认为False,是否将合并的数据进行排序,设置为False可以提高性能
Suffixes:字符串组成的元组,两个表存在除主键之外的相同列名时,在列名
后面附加的后缀名称用以区分数据源于哪个表,默认为(‘_x’,’_y’)。
坚持准则提高技能
Python数据集成
一、数据连接
1.merge()函数
Copy:默认为True,设置为False,可以在某些特赦情况下避免将数据复制到结果
数据结构中
Indicator:默认为False,是否西安市每行数据的来源
Validate:自动检查其合并键中是否有意外的重复项
参与管理强化服务
Python数据集成
一、数据连接
2.concat()函数
concat()函数:
沿特定轴连接两个或两个以上的DataFrame,既可实现纵向合并,也可实现横向合并,
行列索引均可重复。
concat()函数适用场景:两个或多个DataFrame进行横向(列拼接)或纵向合并(行
拼接)。函数语法如下:
pandas.concat(objs,axis=0,join=‘outer’,ignore_index=False,keys=None,
levels=None,names=None,verify_integrity=False,sort=None,copy=True)
爱岗敬业诚实守信
Python数据集成
一、数据连接
文档评论(0)