Python程序设计 13. numpy和pandas数据分析.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * 数据分析库pandas 读写excel和csv文档 信息科学技术学院 北京房山红井路 用pandas读excel文档 需要openpyxl(对.xlsx文件)或xlrd或xlwt支持(老的.xls文件) 读取的每张工作表都是一个DataFrame 用pandas读excel文档 import pandas as pd pd.set_option(display.unicode.east_asian_width,True) dt = pd.read_excel(excel_sample.xlsx,sheet_name=[销售情况,1], index_col=0)#读取第0和第1张工作表 df = dt[销售情况] #dt是字典,df是DataFrame print(df.iloc[0,0],df.loc[睡袋,数量]) #4080 4080 print(df) print(pd.isnull(df.loc[彩盒,销售额])) #True df.fillna(0,inplace=True) #将所有NaNa用0替换 print(df.loc[彩盒,销售额],df.iloc[2,2]) #0.0 0.0 用pandas写excel文档 df.to_excel(filename,sheet_name=Sheet1,na_rep=,) 将DataFrame对象df中的数据写入excel文档filename中的Sheet1工作表,NaN用代替。 会覆盖原有的filename文件 如果要在一个excel文档中写入多个工作表,需要用 ExcelWrite 用pandas写excel文档 #(接上面程序) writer = pd.ExcelWriter(new.xlsx) #创建ExcelWriter对象 df.to_excel(writer,sheet_name=S1) df.T.to_excel(writer,sheet_name=S2) #转置矩阵写入 df.sort_values(销售额,ascending= False).to_excel(writer, sheet_name=S3) #按销售额排序的新DataFrame写入工作表S3 df[销售额].to_excel(writer,sheet_name=S4) #只写入一列 writer.save() 用pandas读写csv文件 df.to_csv(result.csv,sep=,,na_rep=NA, float_format=%.2f, encoding=gbk) df = pd.read_csv(result.csv) * * * * * * * * * * * * * * * * * * * * * * * * * * 北京大学信息学院 郭炜 北京大学信息学院 郭炜 郭 炜 信息科学技术学院 微博:/guoweiofpku 学会程序和算法,走遍天下都不怕! (讲义照片均为郭炜拍摄) 微信公众号 文科计算机基础 中国大学MOOC课程: /course/PKU-1460924165 教材 Python程序设计基础及实践(慕课版) 郭炜 编著 人民邮电出版社 慕课: 中国大学MOOC 实用Python程序设计 /course/PKU-1460924165?from=searchPage 数据分析相关库 numpy和pandas 信息科学技术学院 * 多维数组库numpy 信息科学技术学院 内蒙古浑善达克沙地 numpy简介 多维数组库,创建多维数组很方便,可以替代多维列表 速度比多维列表快 支持向量和矩阵的各种数学运算 所有元素类型必须相同 pip install numpy 安装 numpy创建数组的函数 函数 功能 array(x) 根据列表或元组x创建数组 arange(x,y,i) 创建一维数组,元素等价于range(x,y,i) linespace(x,y,n) 创建一个由区间[x,y]的n-1等分点构成的一维数组,包含x和y random.randint(...) 创建一个元素为随机整数的数组 zeros(n) 创建一个元素全为0.0的长度为n数组 ones(n) 创建一个元素全为1.0的长度为n数组 numpy创建数组示例 import numpy as np #以后numpy简写为np print(np.array([1,2,3])) #[1 2 3] print(np.arange(1,9,2)) #[1 3 5 7] p

文档评论(0)

弹弹 + 关注
实名认证
内容提供者

人力资源管理师、教师资格证持证人

该用户很懒,什么也没介绍

版权声明书
用户编号:6152114224000010
领域认证该用户于2024年03月13日上传了人力资源管理师、教师资格证

1亿VIP精品文档

相关文档