- 1、本文档共267页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;;;引入案例;知识解析;广义数据分析除了狭义数据分析外,还包含数据挖掘。数据挖掘是指从大量的、不完全的、有噪声的、模糊的数据中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程,并为管理决策提供支持。;二、数据分析的流程;3.数据预处理
由于收集的数据的多样与复杂,大数据的一个重要特质表现为数据的噪声、不完整和不一致,采集的数据通常不能直接用于数据分析数。因此,对数据进行预处理是必不可少的步骤,数据预处理过程包括数据集成、数据清洗、数据变换以及数据规约等。数据预处理是一个烦琐过程,花在数据预处理上的时间往往超过数据分析其他阶段花费的时间。;任务1.1数据分析基本内容认知;三、大数据分析的应用场景;4.大数据在交通物流领域的应用
物流是物品从供应地向接收地的实体流动,是将运输、储存、装卸搬运、包装、流通加工、配送和信息处理等功能有机结合起来而实现用户要求的过程。用户可以通过业务系统和GPS定位系统获得数据,使用数据构建交通状况预测分析模型,有效预测实时路况、物流状况、车流量、客流量和货物吞吐量,进而提前补货,制定库存管理策略。;大数据分析方法,从其技术实现层面可以分为统计分析类、高级分析类和数据挖掘类三种类型。;案例分析;任务实训;;引入案例;知识解析;;;;;选择“JustMe”(如果电脑有多个用户选择“AllUsers”),然后点击“Next”;;;1.2.3JupyterNotebook的使用;首先会自动弹出如下黑色命令框(在后续使用中不能关闭),然后会打开JupyterNotebook默认的浏览器,最后跳转网址localhost:8888/tree网页表示启动成功。;;三、JupyterNotebook的使用;2.菜单栏组成;选项;View菜单功能;Cell菜单功能;Kernel菜单功能;Help菜单功能;3.工具栏组成;5.代码单元(CodeCell)的使用;6.单元操作;8.JypyterNotebook快捷键;1.2.4Python数据分析常用库简介;任务实训;任务评价;;;;引入案例;print()函数是打印输出函数,用于输出一个或多个需要展示的结果,多个展示结果放在print()的括号中并用英文逗号隔开。;如果要想输出多个文本,print()函数可以接受多个文本输出,文本之间用逗号“,”隔开,print()函数会依次打印每个???本,遇到逗号“,”会输出一个空格。;在一个程序文件中必然存在着大量的程序代码,为了保证代码的可读性与可维护性,往往需要加入一系列的说明信息,而这些说明就可以通过注释来进行定义。注释可以出现在代码的任何地方,程序在运行时候将不会对注释内容处理。在Python语言中提供有两类注释语法,其方法如下:
(1)单行注释:#注释内容
(2)多行注释:注释内容……(此处为三对单引号,也可以用三对双引号代替)。;变量是程序中的一个重要组成单元,表示(或指向)特定值的名称。利用变量定义的方式,可以将内存中的某个内存块保留下来,以备下次继续使用,同时变量可以指定不同的数据类型,比如整数、浮点数或字符串等。;在Python中,每个变量在使用之前都必须赋值,变量只有在赋值之后才会被创建,变量创建(定义)之后就可以直接使用了。使用等于号(=)可以给变量赋值,其格式如下:
变量名=值
变量名由编程人员自行命名,但必须符合Python语言的标识符规范。;标识符就是在程序中定义的变量名、函数名或类名等。标识符可以由字母、下划线和数字组成,标识符不能以数字开头,标识符不能与关键字重名,并且区分大小写。关键字(保留字)就是在Python内部已经使用的标识符。;规定命名规则的目的是为了增加代码的识别性和可读性,并非绝对与强制。定义变量时,建议在等号(=)的左右两边各保留一个空格。变量名由两个或多个单词组成时,每个单词都应使用小写字母,并且单词与单词之间用下划线连接。如:first_name。;前面已经学习用print()输出想要的结果,但是,如果想要更加灵活的程序输出我想要的东西怎么办?比如上文【做中学2.1.6】中,如果本年净利润profit的金额不想要写在程序里,而是执行程序时再告诉计算机。这时候就可以使用input()函数来实现。;任务2.1Python基础语法;Python最具特色的就是采用缩进方式来标识代码块。缩进相同的一组语句构成一个代码块,也称为代码组。如if、while、def和class这样的复合语句,首行以关键词开始,以冒号(“:”)结束,该行之后的一行或者多行代码构成代码组。在同一个代码块的语句,必须保证相同的缩进空格,否则,程序会报错。至于缩进的空格,Python没有要求,但最好使用4个空格进行悬挂式缩进。;任务2.1P
您可能关注的文档
- 大数据技术在财务中的应用(Python版) 课件汇总 张卫平 任务4.4 利用Pandas进行财务数据合并---任务7.2 利用Pandas对财务报表进行盈利能力与发展能力分析.pptx
- 计算机网络技术(基于Debian)(微课版)-课程教学大纲、授课计划.doc
- 计算机网络技术(基于Debian)(微课版)-题库 .doc
- 计算机网络技术(基于Debian)(微课版)-教案全套 吴燕 项目1--6 认识计算机网络---维护网络安全.doc
- 计算机网络技术(基于Debian)(微课版)-教学计划书 .doc
- 计算机网络技术(基于Debian)(微课版)-课程教学大纲 .doc
- 计算机网络技术(基于Debian)(微课版)-实验(实训)教学大纲 .doc
- 广东省韶关市2025届高三综合测试 (一)(韶关一模)地理试卷+答案.doc
- 广东省汕头市JS中学2024-2025学年高三上学期期中考试地理试卷.doc
- 广东省汕头市JS中学2024-2025学年高三上学期期中考试历史试卷.doc
- XX T 1149.11-2010 内燃机 活塞环 第11部分:楔形铸铁环正式版.doc
- XX T 1149.13-2008 内燃机 活塞环 第13部分:油环正式版.doc
- XX T 1149.12-2013 活塞环楔形钢环正式版.doc
- 人教版高中生物必修2全册教学课件.pptx
- 2025年春新北师大版8年级物理下册全册课件.pptx
- 2024年新人教版8年级上册物理全册课件.pptx
- (新统编版)语文三年级下册 第一单元 大单元教学 课件(共9课时).pptx
- 八年级语文下册第六单元24醉翁亭记课件省公开课一等奖新课获奖课件.pptx
- 八年级物理上册第六章质量与密度章末整理与复习习题省公开课一等奖新课获奖课件.pptx
- 外研版三年级英语下册期末复习单词专项.pptx
文档评论(0)