数据科学家必知的7款Python工具.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据科学家必知的7款Python工具

2015-08-2613:11BenjaminSkrainkaGalvanize字号:T|T

如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题。在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在生产环境中使用的工具而为成为一个真正的数据专家做好充分准备。

我咨询了我们真正的数据专家,收集整理了他们认为所有数据专家都应该会的七款Python工具。TheGalvanizeDataScience和GalvanizeU课程注重让学生们花大量的时间沉浸在这些技术里。当你找第一份工作的时候,你曾经投入的时间而获得的对工具的深入理解将会使你有更大的优势。下面就了解它们一下吧:

IPython

IPython是一个在多种编程语言之间进行交互计算的命令行shel,l最开始是用python开发的,提供增强的内省,富媒体,扩展的shell语法,tab补全,丰富的历史等功能。IPython提供了如下特性:

更强的交互shel(l基于Qt的终端)

一个基于浏览器的记事本,支持代码,纯文本,数学公式,内置图表和其他富媒体支持交互数据可视化和图形界面工具

灵活,可嵌入解释器加载到任意一个自有工程里简单易用,用于并行计算的高性能工具

由数据分析总监,Galvanize专家NirKaldero提供。

GraphLabGreate

GraphLabGreate是一个Python库,由C++引擎支持,可以快速构建大型高性能数据产品。这有一些关于GraphLabGreate的特点:

可以在您的计算机上以交互的速度分析以T为计量单位的数据量。在单一平台上可以分析表格数据、曲线、文字、图像。

必威体育精装版的机器学习算法包括深度学习,进化树和factorizationmachin理es论。

可以用HadoopYarn或者EC2聚类在你的笔记本或者分布系统上运行同样的代码。借助于灵活的API函数专注于任务或者机器学习。

在云上用预测服务便捷地配置数据产品。为探索和产品监测创建可视化的数据。Pandas

pandas是一个开源的软件,它具有BSD的开源许可,为Python编程语言提供高性能,易用数据结构和数据分析工具。在数据改动和数据预处理方面,Python早已名声显赫,但是在数据分析与建模方面,Python是个短板。Pands软件就填补了这个空白,能让你用Python方便地进行你所有数据的处理,而不用转而选择更主流的专业语言,例如R语言。

整合了劲爆的IPyton工具包和其他的库,它在Python中进行数据分析的开发环境在处理性能,速度,和兼容方面都性能卓越。Pands不会执行重要的建模函数超出线性回归和面板回归;对于这些,参考statsmodel统计建模工具和scikit-lea库rn。为了把Python打造成顶级的统计建模分析环境,我们需要进一步努力,但是我们已经奋斗在这条路上了。PuLP

线性编程是一种优化,其中一个对象函数被最大程度地限制了。PuLP是一个用Python编写的线性编程模型。它能产生线性文件,能调用高度优化的求解器,GLPK,COINCLP/CBC,CPLEX,和GUROBI,来求解这些线性问题。

由Galvanize数据科学家IsaacLaughli提n供

Matplotlib

matplotlib是基于Python的2D(数据)绘图库,它产生(输出)出版级质量的图表,用于各种打印纸质的原件格式和跨平台的交互式环境。matplotlib既可以用在python脚本,python和ipython的shell界面(alaMATLAB或Mathematica),web应用服务器,和6类GUI工具箱。

matplotlib尝试使容易事情变得更容易,使困难事情变为可能。你只需要少量几行代码,就可以生成图表,直方图,能量光谱(powerspectr)a,柱状图,errorchart,s散点图(scatterplo)ts等,。

为简化数据绘图,pyplot提供一个类MATLAB 的接口界面,尤其是它与IPython共同使用时。对于高级用户,你可以完全定制包括线型,字体属性,坐标属性等,借助面向对象接口界面,或项MATLAB 用户提供类似(MATLAB)的界面。

Scikit-Learn

Scikit-Lear是n一个简单有效地数据挖掘和数据分析工具(库)。关于最值得一提的是,它人人可用,重复用于多种语境。它基于NumPy,SciPy和mathplotlib等构建。

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档