- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Maiter框架介绍Maiter框架的改进Simrank算法的实现-东北大学
谢谢! 2013.06.16 东北大学毕业设计 LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO LOGO Maiter框架介绍及SimRank算法在Maiter上的实现 王春磊 2013.07.05 Page ? * 主要内容 Maiter框架介绍 1 Maiter框架的改进 2 Simrank算法的实现 3 性能检测及实验结果 4 Page ? * 相关技术简介-Hadoop Hadoop是应用较广,且比较通用的分布式框架,但是不能高效的解决迭代算法 Page ? * Maiter框架简介 Hadoop Maiter Maiter框架可高效的支持异步迭代 Page ? * Maiter的异步条件 Page ? * Maiter的异步迭代 Page ? * 相关技术简介-Maiter Maiter框架可高效的解决迭代算法,但是刚刚被提出,系统功能不是很完备,支持算法有限 Page ? * Maiter框架的改进 改进前Maiter的执行过程: Page ? * Maiter框架的改进 改进后Maiter的执行过程: Page ? * Maiter框架的改进 改进前Maiter提供的API: void read_data(string line, K* k, D* data) ; void init_c(const K k, V* delta) const V default_v() const void accumulate(V* a, const V b) void priority(V* pri, const V value, const V delta) ; void g_func(const V delta, const D data, vectorpairK, V*output) 改进后Maiter提供的API: void read_data(string line, K k, D data) void init_c(const K k, V delta, D data) const V default_v() const void init_v(const K k,V v,D data) void accumulate(V a, const V b) void process_delta_v(const K k, V dalta,V value, D data) void priority(V pri, const V value, const V delta) void g_func(const K k,const V delta,const V value, const D data, vectorpairK, V * output) Page ? * 异步迭代算法的实现 Page ? * Page ? * Page ? * Page ? * 性能检测及实验结果 集群硬件软件配置: CPU:INTEL CORE i3-2100 LGA-1155 接口 3MB 高速缓存 2核 虚拟4核 内存:apacer 4G-DDR3 *2 硬盘:hitachi 500G/7200RPM 主板:ASUS P8H61-I JDK:JDK1.6.0_30 系统:redhat 6.1 64bit 实验集群: Hadoop集群,0.20.2版本,1个master节点,八个worker节点 Maiter集群,2.0版本,1个master节点,八个worker节点 Page ? * 性能检测及实验结果 实验结果-运行时间: 其中pagerank算法在Maiter框架下的运行速度是在Hadoop框架下的60多倍,与作者的实验数据吻合,说明对MaiterAPI的修改没有影响Maiter的效率 Simrank 算法在100个顶点的时候,在Maiter框架下执行的速度是Hadoop框架下的35倍。500个顶点的时候是11倍。1000个顶点时是3.6倍。 Page ? * 性能检测及实验结果 实验结果-运行时间: 图中显示的是simrank算法分别在Maiter框架和Hadoop框架下随着数据集的增长运行时间的增长情况,可以看出Maiter框架下simrank算法随数据集规模增大,运行时间增的速度比Hadoop框架下慢 Page ? * 性能检测及实验结果 实验结果-通行量: 由左图可以看到,Maiter框架下simrank的通信量显著的减少了,一方面是由于MP
您可能关注的文档
- IMA控制系统.PPT
- JF2160——JF2200型-青岛冲床维修.DOC
- JH—X1型自动倒角机.PDF
- ispLEVER优化参数快速指引.DOC
- JK-2HB402M驱动器说明书-捷科运控北京科技有限公司.DOC
- JL-DCD-B型智能型带传动试验台.DOC
- JMP-BE-924使用说明V10-中鸣机器人.PDF
- JSW10型蜗轮蜗杆双面啮合测量仪-哈尔滨智达测控技术有限公司.PDF
- JD长沙技德机电科技有限公司丝杆驱动扭力计算例如:滚珠丝杆导.DOC
- JavaEE6权威指引.DOC
- 2024至2030年中国羚羊角类饮片行业深度调查与前景预测分析报告.docx
- 重庆市面向中国农业大学定向选调2024届大学毕业生2024年国家公务员考试考试大纲历年真题14笔试历.docx
- 重庆市面向西北工业大学定向选调2024届大学毕业生00笔试历年典型考题及解题思路附答案详解.docx
- 中国不动杆菌感染治疗药行业市场现状分析及竞争格局与投资发展研究报告2024-2029版.docx
- 2024至2030年全球与中国ETL软件市场现状及未来发展趋势.docx
- 初中八年级(初二)生物下册期末考试1含答案解析.docx
- 干簧式继电器项目申请报告.docx
- 2024至2030年中国左氧氟沙星片行业深度调查与前景预测分析报告.docx
- 菜籽项目申请报告.docx
- 2024至2030年中国八角钢行业深度调查与前景预测分析报告.docx
最近下载
- 2023首席质量官真题2.pdf VIP
- 山西美盛物资贸易有限公司邓家庄煤矿机械化升级改造可行性研究报告.doc
- 思科网络实验室路由和交换实验指南.pdf
- 保洁服务投标文件示范文本.docx
- 《物联网技术导论与应用》黄玉兰习题答案.docx
- 《混凝土结构与砌体结构》 习题答案 习题答案 课后习题.doc VIP
- 中职学校《极限配合与技术测量基础》电子教案(含教学进度计划)(配套教材:劳社版中职统编)云天课件.doc
- 人教二上第4课 彩泥世界快乐多教案(表格式).doc
- 2024年国家电投集团陕西新能源有限公司渭南分公司人员招聘笔试备考题库及答案解析.docx
- 基于“互联网+”,开展立德树人——浅谈初中历史教学与思政教育的融合.docx
文档评论(0)