本文介绍: 当CN实例启动失败时,集群将提示启动失败,数据库系统将无法使用DDL语句,DML可以正常使用命令查询到故障CN节点状态为Deleted。此时可以正常使用DDL语句,和DML语句。此时不要直接重启MPPDB服务。请按照“处理步骤”中描述操作。一段时间后(约5分钟),系统自动将故障CN剔除,此时用。
告警解释

当出现如下情况时,产生该告警

告警属性

告警ID

告警级别

自动清除

37006

严重

告警参数

参数名称

参数含义

ServiceName

产生告警服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

系统的影响

当CN实例启动失败时,集群将提示启动失败,数据库系统将无法使用DDL语句,DML可以正常使用。

一段时间后(约5分钟),系统自动将故障CN剔除,此时用gs_om -t status —detail命令查询到故障CN节点状态为Deleted。此时可以正常使用DDL语句,和DML语句。

注意:

此时不要直接重启MPPDB服务。请按照“处理步骤”中描述操作

可能原因
处理步骤
  1. 告警产生后等待5分钟,查看告警是否仍然存在。
    • 是,执行2
    • 否,处理完毕。
  1. omm用户身份登录LibrA服务器执行source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile命令启动环境变量。执行以下命令查询并确认故障节点CN状态是否为Deleted

    gs_om -t status —detail

    • 是,执行3
    • 否,执行9
  2. 登录FusionInsight Manager,选择“服务管理 > MPPDB”。单击“实例”,在实例列表中选择故障节点对应的MPPDBServer。
  3. 单击“实例配置”,“参数类别类型设置为“全部配置”,在搜索框中输入参数名称“mppdb.coo.number”进行搜索
  4. 将“mppdb.coo.number”的值设置为0,单击“保存配置”。
  5. 在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
  1. (可选)恢复故障节点的CN,重复步骤3~4,将“mppdb.coo.number”的值设置为1,单击“保存配置”。
  2. (可选)在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
    • 是,CN增加完毕。
    • 否,执行9
  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

原文地址:https://blog.csdn.net/weixin_42874480/article/details/134626914

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若转载,请注明出处:http://www.7code.cn/show_2509.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注