- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高维索引的并行化方案设计与实现高维索引小组组长:林梓佳 组员:文海龙目标回顾对外提供可移植性较强、扩展方便的高维索引系统;针对海量数据索引需求,实现分布式高维索引机制;提供高维索引机制的调用接口,方便上层调用,并最终集成到LaSQL引擎中;提供索引接口的使用文档【javadoc】完成情况设计并完成基于Map Reduce框架的高维索引并行创建模块设计并完成基于MPI通信机制的高维索引并行查询模块,并与创建模块整合成一个相对稳定、高效、完整、独立、通用的高维索引系统协助提供了其他小组所需的全部接口目前数据支撑量为:1000000张图像设计方案高维索引创建模块稳定性要求极高,实时性要求不是很高方案:代码重构,Map Reduce框架实验情况:5台普通PC:2G内存,奔腾E5300双核CPU1M 图像,120维特征耗时:~3小时(底层伪接口:MySQL)实现情况:成熟框架,稳定性高高维索引查询模块实时性要求极高,稳定性要求也很高方案:Map Reduce框架无法满足实时要求,采取MPI通信机制,需自行设计方案与消息体系,工作量大实验情况:5台普通PC:2G内存,奔腾E5300双核CPU1M 图像,120维特征未进行Hybrid Spill Tree参数优化批量查询相比单次查询耗时增幅小查询模块方案特点高度并行化,查询高效,精确度较高两层次并行化:节点间的并行化,子进程间的并行化高效的MPI通信机制Hybrid Spill Tree的冗余查询与结果聚合提升了精确度系统可靠、稳定对等结构:动态中心节点,减少瓶颈智能调度:根据节点可用内存大小、负载能力分配索引块,减少OutOfMemory等异常引入监控节点用于协调索引块的更新、去重、补全等工作,主进程与子进程间的相互监控,减少内存泄露经测试,能对抗常规出现的异常情况,诸如各类节点宕机、进程异常退出、索引检测出现异常等;查询模块方案特点良好的可伸缩性和可扩展性支持动态增删各类节点机器,系统内部自动维护各类节点的信息和集群信息【包括使用提供的外部命令进行节点变动,和异常因素导致的机器宕机等】Hybrid Spill Tree的快速查询特点,以及方案的并行化特点导致原则上对机器数量和数据量没有过多限制自组织性、智能管理能力较强监控节点的引入,实时监测索引更新情况,当前索引的分配情况与使用情况等,并提供报告站点间的注册、注销和信息同步机制智能调度,索引块的分配、去重与补全平衡节点的引入,分配查询主站点,负载软均衡查询模块方案特点接口通用,配置方便,独立性强独立系统,不依赖于底层存储和上层应用接口通用,可随时封装成特定应用所需配置方便,外部xml配置文件,提供多种可调参数总结基本完成本学期的全部任务,按时完成计划成果独立设计和实现了一套相对稳定、高效、可靠、独立、通用的高维索引系统,拥有完整的索引创建和查询功能高维索引系统在实时性方面仍有较大改进空间,也可能存在尚未发现的问题本学期主要注重于稳定性方面的增强,实时性方面的优化工作相对偏少Hybrid Spill Tree有很大的参数调优空间,现有代码、通信机制的优化也可进一步提高响应速度百万级应用距离“亿”级别的应用尚有较大距离,需要更大的数据集和更多的机器进行测试,以发现新的问题系统测试仅在小组内部和小组间进行,需进一步的系统化测试感谢各位老师的指导!感谢衣国垒学长在环境配置方面提供的强大支持!感谢其他小组的配合与支持!谢谢大家!预祝大家新年快乐~哪怕只剩下一台node机器,依旧可以满足查询的要求
您可能关注的文档
- 2010年浙江高考----文综历史试题评析.ppt
- 2012年初中历史.ppt
- 2014甘肃事业单位(省直)备考讲座 —张增.ppt
- 2014年8月13日 主编:石淼.ppt
- 2014年浙江省高考作文答题分析温州市第二外国语学校 陈智峰.ppt
- as, which引导非限制定语从句时的区别.ppt
- Chap 9 结构.ppt
- GPS网形平差.ppt
- HiD299S.P HiD2990P方框图.ppt
- mó gu qi 来来往往 蘑菇亲戚.ppt
- Unit 4 Plants around us Lesson 1(教学设计)-2024-2025学年人教PEP版(2024)英语三年级上册.docx
- 门面担保合同协议.docx
- 第三单元 第三课 大战全面爆发 人教版历史与社会九年级上册教学设计.docx
- 门面承包合同协议.docx
- 二零二五年第一季度牙和颌面畸形就医指南(罗恩主编)PPT模板.pptx
- 高中化学人教版2019必修二 6.1.1 化学反应与能量变化第1课时【课后作业】(解析版).docx
- 江苏省常州市第二十四中学2024-2025学年八年级下学期期中考试英语试卷(原卷版+解析版).docx
- 第二单元第6课《海报设计》教学设计 2023—2024学年青岛版(2019)初中信息技术第二册.docx
- 1我们的好朋友(教学设计)-统编版道德与法治四年级下册.docx
- 2024秋四年级英语上册 Module 9 Unit 2 I'm going to do the high jump教学实录 外研版(三起).docx
文档评论(0)