4.2大数据处理:文本数据处理(教学设计)-2024-2025学年《信息技术》高中·必修 1 数据与计算(浙教版).docxVIP

4.2大数据处理:文本数据处理(教学设计)-2024-2025学年《信息技术》高中·必修 1 数据与计算(浙教版).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

教学设计

课程基本信息

学科

信息技术

年级

高二

学期

春季

课题

编程处理数据

教科书

信息技术必修一数据与计算

教学目标

1.能够利用软件工具或平台对数据进行整理、组织、计算。

2.能编写简单程序用以解决问题。

教学内容

教学重点:

掌握pandas模块的调用方法、数据结构等基本知识。

利用DataFrame的数据结构处理数据,挖掘数据背后的信息。

2.能使用pandas模块对数据进行编辑、计算和统计分析,并能从中提取有用信息形成结论。

教学难点:

1.从抽象到具体地理解利用Python分析处理数据的特点,提炼数据分析的步骤与方法。

2.自己编写程序解决实际的问题,并将新的知识模块纳入原有知识体系。

教学过程

导入

同学们好,我是浙江省嵊州市崇仁中学的信息技术孙老师。前面我们学到,大数据的处理包括数据采集、处理和可视化三部分,今天我们一起来学习如何用编程进行数据处理和可视化。编程处理数据由pandas模块处理数据、matplotlib模块绘图和Python分析数据三部分组成。

利用pandas模块处理数据

同学们看到的这组数据就是大数据处理的结果,接下来让我们一起走进今天的学习任务。我们先一起来认识Pandas,pandas模块是基于numpy实现的,主要用于数据的处理与分析。

Pandas提供的一维Series和二维DataFrame两种数据结构,能方便的帮助我们实现数据的处理和分析。模块在使用前需要用import导入,如importpandas,导入后用pandas.Series或pandas.DataFrame来创建对象,也可以给pandas设置一个别名pd,然后用pd.Series或pd.DataFrame来创建对象。

(1)Series

1.Series的创建

Series包含一个数据列(Values)和一个关联的索引列(index),索引值默认从0开始递增。创建Series对象可以用列表和字典,用列表创建的格式为:pd.series括号里填列表数据,同学们请观察这段代码,import导入pandas模块后,pd.Series括号里填写列表数据,创建了s1对象。执行结果如图所示。

s1对象由索引列和数据列组成。左边一列是关联的索引列(Index),值从0开始递增,右边是列表数据values,也可以通过在pd.series的括号中填写列表数据values和index=,设置指定索引,索引列的值为设置的索引内容。

除了列表,也可以通过字典创建Series对象,在这段代码中,pd.Series的括号中用了字典data,创建Series对象后,字典键值对中的键作为了Series中的索引Index,键值对中的值作为了Series中的数据values。

实践与思考:要帮助龙龙创建series对象,输出如图1所示的结果,代码中应该输入什么。我们先一起来分析图1,该series对象的索引是指定的早餐,水果,买菜,数据为12,68.5,105,我们再分析这段代码,在代码中,Series对象数据列的值已经存储在列表xf中,索引是指定的而非默认的从0开始的数值,所以我们要在pd点series的括号中填入列表数据xf和index=早餐,水果,买菜来设置索引为指定的索引。

2.Series的访问与修改

Series对象中的值的访问格式是:对象名[索引],索引可以是默认的如s1[0],也可以是指定的索引,如s1[s01]来选取,修改Series中的值可以通过访问后重新赋值来实现,如s1[s01]等于168实现了把索引号为s01的值修改为168,请同学们思考一下,这里索引号写默认的0是否可行呢?对,也是可以的,现在请同学们写出将s1对象中的数据180改为206的语句。将s1对象中的数据180改为206的语句,可以是s1[2]=206或s1[s03]=206

3.Series属性的查看

查看Series对象的属性值,可以用对象名点属性的方法,如s1.values可以输出s1对象中的数据,s1.index可以输出s1对象中的索引。

4.DataFrame对象的创建

DataFrame对象可以通过字典或列表来创建。我们先来学习用字典构建DataFrame对象,创建的格式是pd.DataFrame[字典,columns=标题],在这段代码中,先定义字典data,创建DataFrame对象df1时用pd.DataFrame[字典,columns=列标题]。这里字典中键值对的键:姓名、性别和借阅次数将作为df1的列标题,键值对中的值将作为df1的数据值values,并自动生成0开始的默认索引。

DataFrame对象也可以通过读取二维数据文件来创建,如用read_excel函数读取Excel文件,直接创建

您可能关注的文档

文档评论(0)

中小学教学资料 + 关注
实名认证
服务提供商

提供小学、初中、高中信息科技教案、试卷、课件等优质教学资源

1亿VIP精品文档

相关文档