- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
作者2 Erik Paulson, University of Wisconsin 1 MapReduce and parallel DBMSs: friends or foes? 2 A comparison of approaches to large-scale data analysis 3 Clustera: an integrated computation and data management system 和第一作者一样,主要做Hadoop(Mapreduce)和并行数据库管理系统比较,用于大规模数据集分析。 作者3 Alexander Rasin ,Brown University 1 CORADD: correlation aware database designer for materialized views and indexes 2 MapReduce and parallel DBMSs: friends or foes? 3 HadoopDB: an architectural hybrid of MapReduce and DBMS technologies for analytical workloads 4 Correlation maps: a compressed access method for exploiting soft functional dependencies 5 A comparison of approaches to large-scale data analysis 6 H-store: a high-performance, distributed main memory transaction processing system 作者在本文的基础上,设计了HadoopDB系统,一个Mapreduce和并行数据库管理系统结合的系统。 摘要 目前有相当大的兴趣在基于MapReduce(MR)模式的大规模数据分析。虽然这个框架的基本控制流已经存在于并行SQL数据库管理系统超过20年,也有人称MR为必威体育精装版的计算模型。在本文中,我们描述和比较这两个模式。此外,我们评估两个系统的性能和开发复杂度。最后,我们定义一个包含任务集的基准运行于MR开源平台和两个并行数据库管理系统上。对于每个任务,我们在100台机子的集群上衡量每个系统的各个方面的并行性能。我们的研究结果揭示了一些有趣的取舍。虽然加载数据和调整并行数据库管理系统执行的过程比MR花费更多的时间,但是观察到的这些数据库管理系统性能显著地改善。我们推测巨大的性能差异的原因,并考虑将来的系统应该从这两种架构中吸取优势。 ABSTRACT:There is currently considerable enthusiasm around the MapReduce (MR) paradigm for large-scale data analysis. Although the basic control ?ow of this framework has existed in parallel SQL database management systems (DBMS) for over 20 years, some have called MR a dramatically new computing model. In this paper, we describe and compare both paradigms. Furthermore, we evaluate both kinds of systems in terms of performance and development complexity. To this end, we de?ne a benchmark consisting of a collection of tasks that we have run on an open source version of MR as well as on two parallel DBMSs. For each task, we measure each system’s performance for various degrees of parallelism on a cluster of 100 nodes. Our results reveal some interesting trade-offs. Although the process to load data into and tune the execution of parallel DBMSs took m
您可能关注的文档
- Linux第6章补充材料.ppt
- linux第7章内核编程.pptx
- linux管理-脚本编辑.ppt
- LINUX简单入门从菜鸟变高手.ppt
- linux管理磁盘和文件系统.ppt
- linux系统-RPM包管理-rpm命令管理-安装升级与卸载.ppt
- linux系统-文件系统管理-文件系统常用命令-挂载光盘与U盘.ppt
- linux系统-源码包管理-源码包与RPM包的区别.ppt
- Linux系统启动过程.ppt
- Linux系统引导及进程管理.ppt
- XX T 3871.13-2006 农业拖拉机 试验规程 第13部分:排气烟度测量正式版.doc
- XX T 5563-2013 橡胶和塑料软管及软管组合件 静液压试验方法正式版.doc
- 中国RPA应用趋势报告:RPAAI,助力企业智能自动化.pdf
- 蓝色艺术风教育教学通用ppt模板.pptx
- 大型集团企业一体化智能运维平台技术解决方案【503页】.docx
- 2024年人工智能赋能行业发展高质量建设指南.docx
- 智慧教育白皮书(2024年).pdf
- 高质量数字化转型技术解决方案集(2024上半年度).pdf
- 2025风电智能监控及数据分析系统.docx
- 2024水电工程压力钢管智能化组焊施工技术规程.docx
最近下载
- (外研2024版)英语一年级上册 Unit 1 I Hello 课件(新交际英语).pptx
- 第19课 认识数字身份 教案 义务教育人教版信息科技三年级全一册.docx
- 企业统战工作制度建设指南.docx VIP
- 期末考试的质量分析报告(精选5篇).pdf VIP
- 上海市建筑和装饰工程预算定额(2016).pdf
- 一种精氨酸/赖氨酸多肽的制备方法及其应用.pdf VIP
- 《食品贮藏保鲜》第四章鲜活和生鲜食品贮藏保鲜.ppt
- GB50210-2018建筑装饰装修工程质量验收标准.docx VIP
- 基于标准的“学历案”听课心得.docx VIP
- 器械相关性压力性损伤预防实践指南解读PPT课件(完整版).pptx
文档评论(0)