- 1、本文档共88页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模块应用
理解模块、包的概念01了解模块的分类02理解模块的作用03知识目标熟悉自定义模块的方法04了解常见的第三方模块05
能够掌握模块的调用01能够完成模块的制作02能够使用Python包来组织模块03能力目标能够熟练掌握模块的发布和安装04能够导入并调用第三方模块05
任务提出01任务分析02知识准备03任务1简单网络爬虫任务实现04任务总结05任务1打印树形图案
任务提出Part.01
任务提出Part.01
任务提出运用PyCharm开发工具编写Python程序,对网页内容进行爬取,并分析出其中的关键词。以新闻《国务院办公厅关于进一步做好高校毕业生等青年就业创业工作的通知》为例。
任务提出爬取该文的内容,分析出关键词出现的频率,如图所示。
任务分析Part.02
任务分析1.下载并安装第三方包requests、jieba、lxml、bs4。2.创建Python程序webcrawler.py。3.导入requests、jieba、bs4。4.获取目标URL的HTML文档。5.提取出全部页面内容存入TXT文件中。6.用精确模式对页面内容进行分词处理。7.统计每个分词出现的个数。8.按分词个数进行降序排序,输出前10个分词作为关键字。9.运行测试程序,查看输出的关键字及其个数。本任务主要实现的是网页内容的爬取及关键词分析,可以借助第三方模块requestsjieba等来获取页面内容、提取关键字。具体的任务实施分析如下:
知识准备Part.03
模块简介01模块导入02自定义模块03知识准备包04常用库05
模块简介Part.01
Python模块(Module),是一个Python文件,以.py结尾,包含了Python对象定义和Python语句。模块的概念每一个以扩展名py结尾的python源代码文件都是一个模块。模块名同样也是一个标识符,需要符合标识符的命名规范。在模块中定义的全局变量、函数、类都可以提供给其他代码调用。通过使用模块,可以将代码分离成逻辑单元,促进模块化编程。
Python中的模块供分为三类,即内置模块、第三方模块、以及自定义模块。内置模块:内置模块是Python官方开发者帮我们设计好的,安装好Python环境我们就可以直接使用这些内置模块。模块的分类常用的内置模块有:os:包含普遍的操作系统功能sys:提供了一系列有关Python运行环境的变量和函数random:用于生成随机数time::主要包含各种提供日期、时间功能的类和函数
第三方模块:第三方模块是Python开发者提前开发好的模块,需要安装对应的库才能使用该模块中的函数等。模块的分类常用的第三方模块有:requests:常用的http模块,常用于发送http请求scrapy:在网络爬虫领域必不可少pygame:常用于2D游戏的开发numpy:为Python提供了很多高级的数学方法Flask:轻量级开源Web开发框架,灵活、开发周期短Django:一站式开源Web开发框架,遵循MVC设计
自定义模块:自定义模块是开发者根据实际需求开发的模块,通常是对某段逻辑或某些函数进行封装,供其他函数调用,使用时我们需要将其引入到我们的项目中。模块的分类需要注意的是,自定义模块的命名一定不能与内置模块重名,否则会将内置模块覆盖。
模块的导入Part.02
导入整个模块模块的导入通过import关键字可以将整个模块导入进来,导入后可以通过模块名来访问其中的函数、类和变量
导入整个模块使用import语句导入语法格式是:模块名.函数名()/类名使用import语句导入的语法格式是:import模块1[,模块2[,...模块3]]import语句支持一次导入多个模块,每个模块中间用逗号分割,导入之后可以通过“.”来使用模块中的函数或类。
导入整个模块例:使用import语句导入语法格式是:模块名.函数名()/类名importtime#导入模块timeimportrandom,math#导入模块random、mathtime.sleep(1)#调用time模块中的sleep()函数random.randint(1,100)#调用random模块中的randint()函数math.sqrt(2)#调用math模块中的sqrt()函数
从模块中导入特定成员模块的导入可以使用from...import语句从模块中导入特定成员,即可以导入模块中特定的函数、类或变量,而不是整个模块
从模块中导入特定成员使用from...impo
您可能关注的文档
最近下载
- GBT50165—2020古建筑木结构维护与加固技术标准.docx
- 2025年保安员(初级)考试模拟100题及在线模拟考试(100题,含答案)完整版.pdf VIP
- 精品解析:湖南省2022年普通高中高二学业水平合格性考试政治试题(解析版).pdf VIP
- 企业级数据中心如何构建物性安全的防御体系.docx VIP
- 16《创造改变生活》(课件)-苏教版心理健康四年级上册.pptx VIP
- GB 50213-2010 煤矿井巷工程质量验收规范(2022年版).docx
- 统编版高中语文选择性必修教材解读.pptx VIP
- 《本和我》试题及答案.docx
- JB_T 6374-2020 机械密封用碳化硅密封环 技术条件.docx VIP
- 水利工程监理细则.pdf VIP
文档评论(0)