- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
与MapReduce相比,Spark内置的针对多种语言的API使它对开发人员更实用、更易上手,因为MapReduce以难以编程而著称。与MapReduce不同,Spark可以使用YARN(Hadoop的资源管理和作业调度框架)在Hadoop群集上运行流处理应用程序。如上所述,Spark添加了MLlib、GraphX和SparkSQL的功能。而且Spark可以处理Hadoop应用程序之外的其他数据源(包括ApacheKafka)中的数据。此外,Spark与Hadoop兼容并互补。它可以处理Hadoop数据,包括来自HDFS(Hadoop分布式文件系统)、HBase(在HDFS上运行的非关系数据库)、ApacheCassandra(HDFS的NoSQL替代品)和Hive(基于Hadoop的数据仓库)中的数据。参考译文参考译文10.CART算法CART代表分类树和回归树。它是一种决策树学习算法,可将回归树或分类树作为输出。在CART中,决策树节点将恰好具有2个分支。就像C4.5一样,CART也是一个分类器。回归或分类树模型通过使用用户提供的标记训练数据集来构建。因此,它被视为监督学习技术。更多内容,请访问
机械工业出版社网站:
ThankYou!FiveProgrammingLanguagesforBigDataUnit7TextAContentsNewWordsAbbreviationsPhrases参考译文NewWordsNewWordsPhrasesAbbreviationsListeningtoTextA用于大数据的五种编程语言大数据专业人员必须做出的最重要的决定之一,尤其是对于那些刚进圈子或刚刚起步的人来说,就是为大数据操作和分析选择最佳的编程语言。如今,仅了解大数据问题并构筑架构以解决该问题还远远不够,也要完美执行,而且选择正确的语言任重而道远。以下是大数据最常用的五种编程语言。1.Python根据最近举行的StackOverflow开发人员调查,Python已被宣布为2018年增长最快的编程语言之一。它的通用性意味着它可以广泛使用于各种用例中,大数据编程是应用程序的一个主要领域。大数据框架中越来越多地使用许多用于数据分析和处理的库来清洗和处理大块数据,例如pandas、NumPy、SciPy都是基于Python的。不仅如此,大多数流行的机器学习和深度学习框架(例如scikit-learn、Tensorflow等)也都使用Python编写,并且正在大数据生态系统中得到越来越多的应用。使用Python的一个缺点是它运行缓慢,这也是为什么它在大数据编程方面还不是一流选手的原因。尽管非常易于使用,但大数据专业人员发现使用Java或Scala等语言构建的系统比使用Python构建的系统更快速、更强大。参考译文但是,Python用其他质量弥补了这一限制。由于Python主要是一种脚本语言,因此交互式编码和大数据分析解决方案的开发变得非常容易。Python可以轻松地与现有的大数据框架(例如ApacheHadoop和ApacheSpark)集成,从而使你能够大规模执行预测分析。为什么我们将Python用于大数据??它是通用的。?拥有丰富的数据分析和机器学习库。?它容易使用。?它支持迭代开发。?它集成了丰富的大数据工具。?通过Jupyter笔记本进行交互式计算。参考译文参考译文2.R喜欢统计的人就喜欢R,很多人对此并不会感到惊讶。R被普遍称为“统计语言”,用于建立有效而准确的数据分析的数据模型。在大型R包存储库(CRAN,也称为综合R存档网络)的支持下,使用R,你几乎拥有完成大数据处理中的任何任务的所有类型的工具——从分析到数据可视化。R可以与ApacheHadoop和ApacheSpark以及其他流行框架无缝集成,用于大数据处理和分析。使用R作为大数据编程语言的一个问题是它不是很通用。这意味着用R编写的代码不可用于产品部署,并且通常必须转换为某些其他编程语言,例如Python或Java。也就是说,如果你的目标只是为大数据分析构建统计模型,那么你绝对应该考虑使用R。为什么我们将R用于大数据??它是为数据科学而构建的。?它支持Hadoop和Spark。?它具有强大的统计建模和可视化功能。?它支持Jupyter笔记本。3.Java老伙计Java总是很棒。一些传统的大数据框架(例如ApacheHadoop)及其生态系统中的所有工具都是基于Java的,如今它们仍在许多企业中使用。更不用说Java是迄今为止我们讨论过的所有语言中最稳定和最现成的语言!使用Java开发大数据应用程序使你
您可能关注的文档
- 大数据专业英语教程 课件汇总 Unit 1 A Big Data Basics ---Unit 5 B Big Data Analytics Tools and Their Key Features.ppt
- 大数据专业英语教程 课件汇总 Unit 6 A Data Mining --- Unit 10 B Big Data Privacy.ppt
- 2025年医学微生物学 各论 第二十二章 肝炎病毒.pptx
- 医院主动服务培训.pptx
- 幼儿园安全教育培训 .pptx
- 2025年高考 备考语文复习之实用类文本阅读 附答案.doc
- 以人为本管理经验.pptx
- 创业企业的股权激励案例.pptx
- 2025年医学分析-黄栀花口服液.pptx
- 2025年医学分析-高血压急症的处理讲课.pptx
文档评论(0)