本文介绍: 当操作系统的其它进程占用双机监听端口号时,产生该告警。如果有进程占用端口,则查看是否是关键进程占用。如果双机端口被占用超过120s,系统恢复可用。操作系统上其它进程占用了双机监听端口。”即为DN 1实例的数据目录
告警解释

当操作系统的其它进程占用双机监听端口号时,产生该告警

告警属性

告警ID

告警级别

可自动清除

37012

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

系统的影响

如果双机端口被占用超过120s,系统恢复可用。

系统自处理过程
  • 如果双机端口被占用,则gaussdb进程无法启动,集群首先会尝试重新启动gaussdb,该段时间系统不可用。
  • 如果在120s内若该节点依然无法启动,集群会让相应的DN备实例升为DN主实例,系统恢复可用。
可能原因

操作系统上其它进程占用了双机监听端口。

处理步骤

查看告警原因。

  1. 查找产生告警的DN实例的数据目录
    1. 使用omm用户登录告警上报的节点
    2. 初始化环境变量。

      source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

    3. 执行gs_om -t status –detail系统反馈类似如下信息
      
      

    /srv/BigData/mppdb/data1/master1”即为DN 1实例的数据目录

  2. 假设该实例的数据目录是“/srv/BigData/mppdb/data1/master1”,使用以下命令打开postgresql.conf文件
    vi /srv/BigData/mppdb/data1/master1/postgresql.conf

    找到replconninfo1参数,其定义localport为双机监听端口。使用以下命令确认该端口是否被其它进程占用,假设该端口号是10000。

    netstat -anp | grep 10000

    如果有进程占用该端口,则查看是否是关键进程占用。

    • 是,执行5
    • 否,执行3
  3. 执行以下命令kill该进程。
    kill -9 pid
  4. 查看告警是否仍然存在。
    • 是,执行5
    • 否,处理完毕。

收集故障信息

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

原文地址:https://blog.csdn.net/weixin_42874480/article/details/134648301

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若转载,请注明出处:http://www.7code.cn/show_432.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注