本文介绍: 某现网ElasticSearch 故障,很长时间unassgined_shards的数量都不减少。
问题描述
某现网ElasticSearch 故障,很长时间unassgined_shards的数量都不减少。
原因分析与解决方案:
先了解整体状态,使用Postman请求,如下几个请求命令:
GET /_cat/indices
GET /_cat/shards
GET /_cluster/health
GET /_cat/nodes?v
GET /_cat/health?v
GET /_cluster/allocation/explain
POST /_cluster/reroute?retry_failed=true
恢复了部分,但是还是有shards没恢复,取回/_cluster/allocation/expain的response,才发现日志显示:
"disk_threshold","the node is above the low watermark cluster setting [cluster.routing.allocation.disk.watermark.low=85%], using more disk space than the maximum allowed [85.0%], actual free: [12.239612269812415%]"
确认了分片无法指向的原因是节点磁盘使用率超过85%,即安排磁盘扩容,然后再重启ES集群解决。具体操作重启步骤:
第一步:PUT /_cluster/settings
Body里的内容:
{
"transient": {
"cluster.routing.allocation.enable": "none"
}
}
第二步:
systemctl stop elasticsearch
或kill {es的pid}
,注意不是kill -9
这时候要等,通过ps -ef | grep elasticsearch
看进程结束没。
进程结束后,再进入第三步。
第三步:
systemctl start elasticsearch
或su - esuser进入elasticsearch的bin目录,执行./elasticsearch -d命令
观察es的日志,直到它加入集群,再重启下一台。
重复2、3两步,全部节点重启完成后执行
第四步:
PUT /_cluster/settings
{
"transient" : {
"cluster.routing.allocation.enable" : "all"
}
}
原文地址:https://blog.csdn.net/sencloud/article/details/135726486
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_60386.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。