网站大量收购独家精品文档,联系QQ:2885784924

PBPP列存储系统中基于传递块缓冲区的流水线并行处理.docx

PBPP列存储系统中基于传递块缓冲区的流水线并行处理.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PBPP列存储系统中基于传递块缓冲区的流水线并行处理

第41卷第6期计算机科学V01.41No.62014年6月ComputerScienceJune2014PBPP:列存储系统中基于传递块缓冲区的流水线并行处理丁祥武张光辉(东华大学计算机与科学技术学院上海201620)摘要片上多核处理器(C御)凭借其低功耗和低成本等优势迅速成为处理器市场的主角,它为多线程的实现提供了硬件支持。列存储技术在分析型应用中具有显著的优势。在列存储系统中,查询优化依然是最重要的问题之一。在列存储系统中,利用多核资源提高查询处理性能具有较大潜力。文中通过对查询执行器生成的物理查询树进行流水多线程设计,结合列存储的特点,建立传递块缓冲区,使主线程和辅助线程分别对传递块缓冲区读写,以提高查询性能。同时还提出使用操作系统中经典的“生产者和消费者”模式来解决线程之间的同步问题。提出的这些方法应用在实验室研发的列存储系统DWMS中,使用数据仓库基准测试集SSB验证了这些方法的有效性。实验结果表明,传递块缓冲区的设计使SQL的查询效率有了近50%的提升。关键词多线程,多核,列存储,传递块缓冲区,并行处理中图法分类号TP311文献标识码APBPP:PipelinedParallelProcessingBasedonPassingBufferinColumn-storeSystemDINGXiang-wuZHANGGuang-hui(SchoolofComputerScienceandTechnology,DonghuaUniversity,Shanghai201620,China)AbstractChipmultiprocessor(CMP)withlow-powerdissipation,lowcostadvantagesbecomesrapidlytheleadingroleofthemarket,anditprovideshardwaresupportformuhithread.Column-storehassignificantadvantagesinanalyticalapplications.Queryoptimizationisoneofthekeyissuesincolumn-store.Incolumn-store,multi-coreresourcescanira-proveperformanceofqueryprocessing.InordertoimprovequerypeHormanceofcolumn-stores,thispaperestablishedpassingblockbuffertomakemainthreadandworkerthreadtoreadandwriterespectivelydifferentpassingblocks,SOparentnodeandchildnodeofphysicalexecutiontreeexecuteparallel.Weusedclassicproducer-consumerpatterntOsolvetheproblemofsynchronizationbetweenthethreads.Incolumn-storesDWMSdevelopedbyourlaboratory,experi—mentalresultsonbenchmarkdatasetSSBshowtheeffectivenessofthisdesign,anditcanimprove50%executionper-formanceforsometypicalcomplexqueries.KeywordsMultithread,Multicore,Column-store,Passingblockbuffer,Parallelprocessing本文提出了一个基于传递块缓冲区的流水并行化设计,1引言通过改变执行树中上下级操作节点传递数据的方式,提高列数据分析型应用日渐普遍和重要。大量的研究表明[2:存储的查询效率。这种设计将上下级操作节点之间直接通过列存储在分析型应用中具有显著的优势。列存储系统中的查传递块传递数据的方式改变为通过传递块缓冲区传递数据,询处理速度一直是用户关注的重点,是列存储研究的热点问对传递块缓冲区的读写分别采用不同的线程进行,这样可以题。充分利用多核CPU多线程的优势,提高查询效率。另外对传由于功耗和设计的限制,单纯地提高处理器主频已经非递块大小、缓冲区大小及其缓冲区的数量进行优化设置,进一常有限。现在处理器的发展趋势已经从单核高频处理器转向步提高查询优化的性能。了片上多核处理器(CMP),由指令级并行向多线程并行发本文第2节主要介绍了多线程查询优化方面的相关工展[5|。设计高效的多线程,充分发挥多核处理器的优势,能显作;第3节主要介绍了本文所涉及

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档