- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE2
Elasticsearch索引的架构设计
目录
TOC\o1-3\h\z\u1、Elasticsearch索引的设计 3
注意1:不要在一个索引中定义多个type。 6
注意2:将Set_source设置为false。 6
注意3:将_all设置为false。 7
注意4:设置dynamic=strict。 7
注意5:使用keyword类型 8
注意6:使用别名 9
2、Elasticsearch分片分配原则 10
步骤1:定义索引 11
步骤2:评估数据量 11
步骤3:评估索引大小和磁盘空间 12
步骤4:计算分片数 12
步骤5:评估索引数和类型 12
3、数据去重的思考 12
1、Elasticsearch索引的设计
1.1单一索引还是基于时间的索引?
单一索引的问题:
1)不能更新Mapping。
比如:主分片数不可以修改(除非reindex)。
2)无法灵活、快速地扩展。
3)更适合固定、小型数据集。
基于时间的索引面临的问题:
1)如何确定间隔?
数据量
变更频率
默认尝试每周为单位分割——建议
2)如何实施?
索引模板
1.2定义索引注意事项
举例:
{
????facet_internet_access_minute:{
????????template:ce-index-access-v1-*,
????????order:0,
????????settings:{
????????????number_of_shards:5
????????},
????????aliases:{
????????????{index}-query:{
????????????}
????????},
????????mappings:{
????????????es_doc:{
????????????????dynamic:strict,
????????????????_all:{
????????????????????enabled:false
????????????????},
????????????????_source:{
????????????????????enabled:false
????????????????},
????????????????properties:{
????????????????????CLF_Timestamp:{
????????????????????????type:long
????????????????????},
????????????????????CLF_CustomerID:{
????????????????????????type:keyword
????????????????????},
????????????????????CLF_ClientIP:{
????????????????????????type:ip,
????????????????????????ignore_malformed:true
????????????????????}
????????????????}
????????????}
????????}
????}
}
注意1:不要在一个索引中定义多个type。
6.X版本已经不支持,7.X版本彻底不支持。
扩展问题:5.X版本的父子文档实际实现中是一个索引中定义了多个type,到了6.X中实现方式改变为:join方式。
注意2:将Set_source设置为false。
假设你只关心度量结果,不是原始文件内容。
将节省磁盘空间并减少IO。
这个点,需要结合实际的业务场景具体问题具体分析。
举例:
_source:{
enabled:false
},
注意3:将_all设置为false。
假设你确切地知道你对哪个field做查询操作?
能实现性能提升,缩减存储。
举例:
_all:{
enabled:false},
注意4:设置dynamic=strict。
假设你的数据是结构化数据。
字段设置严格,避免脏数据注入。
举例:
dynamic:strict,
注意5:使用keyword类型
假设你只关心完全匹配
提高性能和缩小磁盘存储空间
举例:
CLF_CustomerID:{
type:keyword
},
注意6:使用别名
如何在不停机的前提从一个索引切换到另一个索引?
举例:
aliases:{
{index}-query:{
}
或者你通过head插件创建。
2、Elasticsearch分片分配原则
社区和QQ群中经常被问到的问题:
1
您可能关注的文档
- 地质找矿与地质勘查技术探究.docx
- 地铁车辆检修制度.docx
- 基于互联网+时代的员工招聘管理路径研究.docx
- 建构主义视角下俄印对一带一路的态度分析.docx
- 基于ARM的远程视频监控系统.docx
- 基于大数据视角的农产品质量安全监管研究.docx
- 基于CCD的计算机控制开放式实验教学模式的研究.docx
- 《YY 0792-2024眼科仪器 眼内照明器》.pdf
- YY 0792-2024眼科仪器 眼内照明器.pdf
- 中国行业标准 YY 0792-2024眼科仪器 眼内照明器.pdf
- 中国国家标准 GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- 《GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法》.pdf
- GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/T 32455-2024航天术语 运输系统.pdf
- GB/T 32455-2024航天术语 运输系统.pdf
- 《GB/T 32455-2024航天术语 运输系统》.pdf
- GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
- 中国国家标准 GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
最近下载
- 新生300天图解教程.docx
- 专题05:评价诗歌思想内容和观点态度(解析版)-2025年高考语文一轮复习知识清单.docx
- S7-200 SMART PLC应用技术 模块一 S7-200 SMART PLC基本指令的应用.pptx VIP
- 2024“降低非计划重返手术室再手术率”实施方案.pdf
- 《小蝌蚪找妈妈》识字微课教学课件—【精品课件】.pptx
- 高电压工程基础-第二版-课后答案-(施围-邱毓昌-张乔根).pdf
- 中医内病外治的研究进展及思路_全身性疾病药物外治的文献回顾_发展趋势及技术要点.pdf
- 部编版(五四制)语文六年级上册第二单元综合素质评价卷(含答案).doc VIP
- 2023年武汉科技大学法学专业《民法学》期末试卷A(有答案).docx VIP
- 浅谈中医内病外治法课件.ppt
文档评论(0)