某银行日志平台 Elasticsearch 运维（动态配置篇）：集群、索引GC等方面

科技科技 2024-10-30 07:36 海南

【摘要】Elasticsearch除了静态配置以外，还存在可灵活调整的动态配置，在日常运维，排障，优化等场景下使用较为频繁。本篇从集群、索引GC等方面对部分Elasticsearch的动态配置参数进行讲解，帮助大家灵活运用。

【作者】搁浅沉默 某金融行业技术研发专员

一、引言

笔者在今年4月份写过一篇文章，对Elasticsearch的静态配置文件进行一个简单的介绍，包括常用的参数，及其为什么如此设置（点击可阅读：某银行日志平台Elasticsearch运维静态配置篇）。对于Elasticsearch而言，除了静态配置以外，还存在可灵活调整的动态配置，此类配置在日常运维，排障，优化等场景下使用较为频繁。

本篇将会从集群，索引GC等方面对部分Elasticsearch的动态配置参数进行一个简单介绍，告诉大家，如何调整配置，可以使得Elasticsearch集群更为健壮；遇到分片不均衡的场景，如何通过配置进行rebalance；如何调整索引的配置，可优化数据读写能力等，希望对阅读本篇文章的人有所帮助与启发。

二、集群级别分片相关配置

persistent设置：集群永久生效，重启后依然有效。
transient设置：集群临时生效，重启后失效。

1.cluster.routing.allocation.enable

Elasticsearch 中用于控制分片分配行为的一个集群级别的设置。它决定了集群在不同条件下是否允许分片的分配和重新分配。这一设置主要用于维护操作期间（例如节点下线、扩展、故障恢复）控制分片分配策略。

all（默认值）：允许所有分片（包括主分片和副本分片）的分配。这是默认配置，表示分片可以正常分配到可用的节点上。
primaries：只允许主分片的分配，不允许副本分片分配。当集群处于部分恢复状态时，此配置可以确保主分片优先恢复。
new_primaries：只允许尚未分配的主分片进行分配，用于在发生灾难性故障时控制分片的分配行为。
none：不允许分片的分配或重新分配。常用于维护操作期间，如升级或维护特定节点时，防止分片的自动重新分配。

设置示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.enable": "none"  }}

2.cluster.routing.allocation.cluster_concurrent_rebalance

用于控制集群中允许并发进行的分片重平衡（rebalance）操作的最大数量。默认值为2，使用场景如下：

集群扩展：当添加新节点时，Elasticsearch可能会触发分片重平衡操作。通过控制 cluster.routing.allocation.cluster_concurrent_rebalance，可以限制同时进行的分片重平衡任务的数量，从而避免集群在短时间内进行大量的分片迁移，影响查询和索引性能。
恢复节点后：在节点恢复后，Elasticsearch可能会启动分片的重新分配和同步。过多的重平衡任务会占用大量I/O和CPU资源，从而影响正常的操作。此时，可以调低该参数以限制重平衡操作的数量。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.cluster_concurrent_rebalance": 3  }}

3. cluster.routing.allocation.node_initial_primaries_recoveries

用于控制每个节点在启动时同时恢复的主分片（primary shard）的最大数量。当一个节点加入集群或重启时，Elasticsearch会自动将存储在该节点上的主分片恢复到活动状态。然而，过多的分片恢复操作可能会给系统带来较大的 I/O负载，特别是在节点启动或故障恢复期间。因此，该参数用于限制每个节点同时恢复的主分片数量，防止系统性能下降。默认值为4，使用场景如下：

节点重启：当节点在集群维护、升级或重启后重新加入时，它可能需要恢复该节点上的多个主分片。为了避免系统资源（如 I/O 和网络带宽）被分片恢复操作占满，影响其他查询和写操作，可以通过该参数来限制恢复的并发度。
灾难恢复：如果一个节点意外下线，并且你在故障恢复后重启节点，可能有大量的主分片需要恢复。这种情况下，可以根据集群的资源和负载，调整这个参数的值。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.node_initial_primaries_recoveries": 3  }}

4. cluster.routing.allocation.node_concurrent_recoveries

控制每个节点同时进行的分片恢复操作的最大数量。这包括从其他节点恢复主分片和副本分片。此参数可以防止分片恢复时对节点的I/O和网络资源造成过多负载，从而影响集群的整体性能。默认值为2，使用场景如下：

节点重启或加入：当一个节点重新加入集群后，可能需要从其他节点恢复多个分片。通过限制同时恢复的分片数量，可以避免过高的I/O负载，防止影响正常的搜索和索引请求。
灾难恢复：如果某个节点下线或不可用，Elasticsearch会自动将其分片分配到其他节点。为了防止恢复任务过多，耗尽系统资源，可以通过调整该参数控制并发恢复的数量。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.node_concurrent_recoveries": 3  }}

5.cluster.routing.allocation.node_concurrent_outgoing_recoveries

用于控制每个节点同时进行的出站分片恢复操作的最大数量。这一参数具体影响的是当节点将分片数据复制到其他节点时，每个节点上允许并发的出站恢复（outgoing recovery）的数量。默认值为2，使用场景如下：

副本分片分配：当 Elasticsearch 集群需要将分片副本分配到新节点时，源节点会通过出站恢复将分片数据发送到目标节点。
节点重新加入集群：如果节点重启或加入集群，源节点需要将分片数据传输给其他需要恢复数据的节点。
如果硬件资源（如网络带宽和磁盘 I/O）充足，且需要更快地将分片恢复到其他节点，可以增加该值至 4-6。尤其是在集群扩展或需要快速恢复大量分片时，此调整有助于加快恢复速度。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.node_concurrent_outgoing_recoveries": 3  }}

6. cluster.routing.allocation.allow_rebalance

用于控制集群何时允许进行分片重平衡（shard rebalancing）。分片重平衡是指在集群节点间重新分配现有分片，以确保数据均衡分布和集群性能的稳定性。然而，频繁的分片重平衡会导致不必要的开销，影响查询和写入的性能。

默认值：always，使用场景如下：

重平衡频繁引发性能问题：如果分片重平衡过于频繁，会影响索引和查询的性能，尤其是在集群节点频繁加入或退出时。因此，可以通过调整该参数来控制重平衡的时机，避免在集群负载较高时进行不必要的重平衡操作。
集群恢复期间：在节点恢复期间，可以将该参数设置为indices_primaries_active 或indices_all_active，优先恢复主分片或所有分片，确保集群的稳定性，然后再进行重平衡操作。

可选值如下：

always：集群始终允许分片重平衡。适用于不太敏感的集群环境，确保集群始终保持分片分布均衡。
indices_primaries_active：只有在所有主分片都处于活动状态时才允许分片重平衡。
indices_all_active：只有当所有主分片和副本分片都处于活动状态时才允许重平衡。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.routing.allocation.allow_rebalance": "indices_primaries_active"  }}

三、GC (垃圾回收) ，内存配置

1. indices.memory.index_buffer_size

决定了在索引过程中，每个节点可以为索引操作分配的内存缓冲区大小。该缓冲区用于暂时存放待写入磁盘的数据，特别是倒排索引、文档值等结构，缓冲区满时会触发刷盘（flush）操作，将数据从内存写入磁盘中的段文件，默认值为10%的JVM堆内存。使用场景如下：

高并发索引操作：在大规模数据索引或高并发写入场景下，增大索引缓冲区可以减少刷盘频率，从而提高写入性能。但过大的缓冲区也可能导致内存占用过多，影响搜索性能和其他操作的响应。

资源有限的场景：如果内存资源有限，可能需要减小缓冲区大小，以确保有足够的内存分配给其他操作，防止JVM内存不足或垃圾回收频繁触发。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.memory.index_buffer_size": "15%"  }}

2. indices.memory.min/max_shard_index_buffer_size

min_shard_index_buffer_size：

用于为每个分片在写入操作时设置一个最小/最大的索引缓冲区大小。min_shard_index_buffer_size这个参数控制每个分片在进行索引操作时，可以使用的最小内存量。当Elasticsearch为节点分配内存缓冲时，如果index_buffer_size参数计算出的每个分片的内存分配低于这个最小值，Elasticsearch会强制分配这个最小内存。默认值为4mb，使用场景如下：

确保索引性能：在节点上有很多小分片的场景中，如果每个分片分配的内存缓冲区过小，可能会导致频繁的刷盘（flush），降低索引性能。因此，设置一个合理的最小缓冲区大小可以避免这种情况，确保分片有足够的内存来进行批量写入操作。

小型集群或低内存环境：在内存较为有限的环境中，可能需要调整这个参数以确保分片有足够的内存分配，而不会因为缓冲区过小导致过多的刷盘操作。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.memory.min_shard_index_buffer_size": "8mb"  }}

max_shard_index_buffer_size：

决定了每个分片可以分配的最大内存索引缓冲区大小。这个参数用来控制在索引操作过程中，单个分片能使用的最大缓冲区量，防止某个分片占用过多内存资源，影响其他分片或操作。默认值为512mb，使用场景如下：

防止单个分片占用过多资源：在一些高写入负载的场景中，如果不设置该上限，某些分片可能会使用非常大的缓冲区，从而影响其他分片的写入和查询性能。因此，这个参数可以确保资源合理分配，防止单个分片占用过多内存。

大规模索引写入：对于一些大索引（例如TB级数据量），适当调整max_shard_index_buffer_size，以平衡分片的内存使用和刷盘频率。增大缓冲区可能有助于减少刷盘次数，提高写入效率。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.memory.max_shard_index_buffer_size": "1gb"  }}

3. indices.breaker.total.limit

用于设置内存断路器（memory circuit breaker）的总内存限制，帮助防止节点在超出可用内存时发生内存溢出或崩溃。该参数控制Elasticsearch为各类操作（如索引、聚合、排序等）分配的总内存上限。默认值为95%的 JVM 堆内存。

工作机制：

Elasticsearch中的内存断路器系统用于防止节点由于内存超负荷而崩溃。当内存使用超过某个限制时，内存断路器会中断当前操作并抛出异常。是一个总开关，控制Elasticsearch所有内存断路器的总体内存限制。

内存断路器通常应用于以下几种场景：

查询内存断路器：限制查询相关操作（如聚合、排序等）使用的内存。
字段数据内存断路器：限制字段数据加载到内存时的占用。
请求内存断路器：限制单次请求所使用的内存。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.breaker.total.limit": "70%"  }}

4. indices.breaker.fielddata.limit

用于为字段数据（fielddata）的内存使用设置限制。它决定了Elasticsearch加载字段数据到内存时可以使用的最大内存量。字段数据主要用于内存密集型操作，比如排序、聚合和脚本过滤等。此参数通过内存断路器（circuit breaker）防止字段数据过多地占用堆内存，进而保护集群稳定性。默认值为JVM堆内存的40%。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.breaker.fielddata.limit": "30%"  }}

5. indices.breaker.request.limit

用于限制单个查询请求能够使用的最大内存。它决定了每个查询操作（例如聚合、排序等）能分配的内存上限，以防止单个查询耗尽过多内存资源，从而保护集群稳定性。默认值为JVM堆内存的60%。

示例：

PUT /_cluster/settings{  "persistent": {    "indices.breaker.request.limit": "50%"  }}

四、协调相关配置

1.cluster.publish.timeout

用于设置集群状态变更（如节点加入、离开、分片重新分配等）在发布给集群中的所有节点时的超时时间。这个参数直接影响到集群在执行状态变更操作时的容错能力和响应时间。默认值为30s，使用场景如下：

增大超时时间：如果你有较大的集群，或者网络状况不稳定，主节点可能需要更多的时间等待所有节点确认集群状态变更。在这种情况下，可以将该值增大到60s或更长的时间，以确保变更能够成功传播到所有节点。
减少超时时间：在某些环境中，为了减少主节点在网络异常时的等待时间，可以将该超时时间缩短。如果网络较差且超时时间过长，主节点可能会花费较长时间去尝试发布变更，影响集群的响应速度。缩短超时时间可以使主节点更快地处理这些失败情况。

示例：

PUT /_cluster/settings{  "persistent": {    "cluster.publish.timeout": "60s"  }}

五、结语

本篇主要介绍了Elasticsearch集群的部分动态配置参数情况，一家之言，仅供参考。

欢迎点击阅读原文到社区原文下交流探讨
觉得本文有用，请转发或点击“在看”，让更多同行看到

资料/文章推荐：

欢迎关注社区 "数据库"技术主题 ，将会不断更新优质资料、文章。地址：

https://www.talkwithtrend.com/Channel/597/

下载 twt 社区客户端 APP

长按识别二维码即可下载

或到应用商店搜索“twt”

长按二维码关注公众号

*本公众号所发布内容仅代表作者观点，不代表社区立场

http://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650701053&idx=1&sn=97d3b960ad0f078cbb0b05917f113ac3

twt企业IT社区

talkwithtrend.com社区（即twt社区）官方公众号，持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群，让您时刻和国内企业IT同行保持信息同步。

最新文章

金融行业国产数据库容灾建设五大难点及解决方案（多位专家观点可供参考）

Kubernetes / OpenShift 日常巡检（非常详细）

一文读懂虚拟 GPU（vGPU）技术

中小城商行如何选择合适的“小云”来适应一云多芯？

金融行业关键系统信创数据库备份选型需要关注的难点问题（同行交流共识）

信创（麒麟）操作系统选型适配、运维实施难点及应对方案

详解Kubernetes控制器

金融行业云原生应用趋势及建设优化合集（2024年度）【联盟专属资料放送】

星期五招聘日 | 北京上海福州顺德等6市20余岗，中国银联、中信建投证券、顺德农商银行、福建海峡银行、兴业银行信用卡中心等招聘

某银行开发测试准生产机房基于虚拟卷技术实现“信创数据库+信创虚拟化+信创SAN存储”实践分享

金融企业数据湖建设难点和解决思路（同行交流共识）

从办公管理系统信创应用改造看运维体系的变化

信创异构环境下审视云原生二层和三层容器网络

某银行权益类系统基于“业务容器化+数据库多租户”架构实现Oracle信创替换并建设同城双活实践分享

金融行业系统可观测性建设思路和难点

开源生态是一把双刃剑，风险挑战怎样应对？

金融行业私有云上业务系统混合部署的五个关键难题（同行交流共识）

DBA 定制自动化巡检工具（附参考脚本）

存储 IO 性能优化方案与瓶颈分析（15图干货）

金融行业VMware虚拟化替换策略及实践经验合集【联盟专属资料放送】

星期五招聘日 | 北京上海海口苏州等6市20岗，交通银行招聘高层次人才，苏州银行、海南农商银行、成方金信等企业急聘

金融行业信创运维体系建设

金融企业如何进行大数据平台信创整体规划实现平稳迁移与架构优化？| 11月9日·杭州站，报名中

大模型技术在金融领域数据挖掘场景中的运用【大模型行业应用实践系列】

信创数据库环境下如何确保备份解决方案的合规性？（同行交流共识）

某银行日志平台 Elasticsearch 运维（动态配置篇）：集群、索引GC等方面

金融企业为什么有建设数据湖的必要性？价值如何体现？（同行共识总结）

（麒麟、统信）信创操作系统与非信创操作系统稳定性、性能、故障率以及运维难度对比差异（同行交流共识）

结合大语言模型与 Zabbix API 实现 Zabbix 模板自动化翻译

“PostgreSQL技术路线+集中式存储”平滑替换Oracle后，如何开展IT架构高效运维？

某银行基于全闪NAS双活统一高性能文件共享存储实践分享

某金融企业生产环境下信创数据库运维管理规范

存储架构技术发展演变30年：从原始时期到 SAN & NAS 共存阶段；从SDS兴起、百花齐放，到沉淀并分类聚焦的时代

制造行业VMware虚拟化替换策略探讨合集【联盟专属资料放送】

星期五招聘日 | 深圳上海郑州沈阳等城市岗位，中信银行信用卡中心、兴业银行上海分行、河南农商联合银行等企业招聘

向量数据库的性能、数据安全和隐私保护机制（同行交流共识）

如何评估可观测性建设的成效？有哪些关键指标？

信创虚拟化资源池支撑银行重要交易类系统多类信创数据库稳定运行实践分享

十年历程：某三甲医院网络系统的三次改造

企业Centos操作系统迁至（麒麟、统信）信创操作系统迁移成本对比及如何控制（同行交流共识）

《中小银行行业重要及关键系统信创数据库备份软件选型参考共识》（来自中小银行行业群体投票及建议，可下载）

数据库平替的不同场景下，如何选择计算与存储平台的组合？

算力未来，GPU or CPU ？

基于三层模型构建自研存储自动化（实践干货分享）

详解“三保一评”：分保、等保、关保、密评之间的联系与区别

企业信创操作系统落地实践经验合集（下）【联盟专属资料放送】

星期五招聘日 | 上海沈阳柳州江阴东莞精选十余岗，中国工商银行辽宁分行、江阴农商银行、柳州银行、东莞农商银行、华富基金招聘

PB级数据量下的MPP数仓+Hadoop的传统大数据平台向信创环境迁移，有哪些难点？

如何设计智能投研系统，从海量、多源、非结构化的数据中自动提取价值线索，生成投资分析报告？（同行交流共识）

以系统工程思想构建 DevOps 体系

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉