本文介绍: 当CN实例启动失败时,集群将提示启动失败,数据库系统将无法使用DDL语句,DML可以正常使用。命令查询到故障CN节点状态为Deleted。此时可以正常使用DDL语句,和DML语句。此时不要直接重启MPPDB服务。请按照“处理步骤”中描述操作。一段时间后(约5分钟),系统会自动将故障CN剔除,此时用。
告警解释
当出现如下情况时,产生该告警:
- CN所在机器发生硬件故障(断电、硬盘损坏等)。
- CN实例数据目录中的postgresql.conf配置文件不存在或者其中某个配置参数不正确。
- CN实例线程无法监听IP,或者无法绑定监听端口。
- CN实例进程没有其数据目录读写权限、或数据目录丢失。
- 绑定CN实例的虚拟IP异常。
告警属性
告警ID |
告警级别 |
可自动清除 |
---|---|---|
37006 |
严重 |
否 |
告警参数
参数名称 |
参数含义 |
---|---|
产生告警的角色名称 |
|
产生告警的主机名 |
|
产生告警的实例 |
对系统的影响
当CN实例启动失败时,集群将提示启动失败,数据库系统将无法使用DDL语句,DML可以正常使用。
一段时间后(约5分钟),系统会自动将故障CN剔除,此时用gs_om -t status —detail命令查询到故障CN节点状态为Deleted。此时可以正常使用DDL语句,和DML语句。
注意:
此时不要直接重启MPPDB服务。请按照“处理步骤”中描述操作。
可能原因
- CN所在机器发生硬件故障(断电、硬盘损坏等)。
- CN实例数据目录中的postgresql.conf配置文件不存在或者其中某个配置参数不对。
- CN实例线程无法监听IP,或者无法绑定监听端口。
- CN实例进程没有其数据目录读写权限、或数据目录丢失。
- 绑定CN实例的虚拟IP异常。
处理步骤
- 以omm用户身份登录LibrA服务器,执行source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile命令启动环境变量。执行以下命令查询并确认故障节点CN状态是否为Deleted。
- 登录FusionInsight Manager,选择“服务管理 > MPPDB”。单击“实例”,在实例列表中选择故障节点对应的MPPDBServer。
- 单击“实例配置”,“参数类别”类型设置为“全部配置”,在搜索框中输入参数名称“mppdb.coo.number”进行搜索。
- 将“mppdb.coo.number”的值设置为0,单击“保存配置”。
- 在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
- (可选)恢复故障节点的CN,重复步骤3~4,将“mppdb.coo.number”的值设置为1,单击“保存配置”。
- (可选)在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
- 是,CN增加完毕。
- 否,执行9。
- 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
- 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
- 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
原文地址:https://blog.csdn.net/weixin_42874480/article/details/134626914
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_2509.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。