中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。

創(chuàng)新互聯(lián)公司自2013年起,先為寧武等服務(wù)建站,寧武等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為寧武企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。

 

1、背景

一個(gè) RocketMQ 集群由4主4從組成,突然其中3臺(tái)服務(wù)器“竟然”在同一時(shí)間下線,其監(jiān)控顯示如下:

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
依次查看三臺(tái)機(jī)器的監(jiān)控圖形,時(shí)間戳幾乎完美“吻合”,不可思議吧。  
 

2、故障分析

出現(xiàn)問(wèn)題,先二話不說(shuō),馬上重啟各服務(wù)器,盡快恢復(fù)集群,降低對(duì)業(yè)務(wù)的影響,接下來(lái)開(kāi)始對(duì)日志進(jìn)行分析。

Java 進(jìn)程自動(dòng)退出(rocketmq 本身就是一個(gè)java進(jìn)程),一種最常見(jiàn)的問(wèn)題是由于內(nèi)存溢出或由于內(nèi)存泄漏導(dǎo)致進(jìn)程發(fā)送Crash等。由于我們的啟動(dòng)參數(shù)中未配置

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:HeapDumpPath=/opt/jvmdump

這兩個(gè)參數(shù),不能直接根據(jù) 是否生成 dump 文件,那退而求其次去查看其GC日志,將GC日志下載到本地,然后可以使用一個(gè)在線gc日志分析工具:https://gceasy.io/ ,將 gc 日志上傳后會(huì)給出圖形化的展示,其圖如下:

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
發(fā)現(xiàn)垃圾回收很正常。

既然 Java 進(jìn)程不是由于內(nèi)存溢出等問(wèn)題導(dǎo)致的退出,那又會(huì)是什么原因呢?那我們來(lái)看一下那個(gè)點(diǎn)的broker的日志,其關(guān)鍵日志截圖如下:

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
發(fā)現(xiàn) broker 日志中有打印出 shutdownHook,表示在進(jìn)程退出之前執(zhí)行了啟動(dòng)時(shí)注冊(cè)時(shí)的退出鉤子函數(shù),說(shuō)明 broker 是正常停止的,并且也不可能是 kill -9 命令,肯定是顯示的執(zhí)行了 shutodown 或 kill 命令,于是立馬使用 history 命令 查看歷史命令,都未在指定時(shí)間執(zhí)行過(guò)該命令,并且切換到 root 命令后,同樣使用 history 命令,并未發(fā)現(xiàn)端倪。

但我始終相信,肯定是執(zhí)行了手動(dòng)執(zhí)行了 kill 命令導(dǎo)致進(jìn)程退出的,經(jīng)過(guò)網(wǎng)上查找查,得知可以通過(guò)查閱系統(tǒng)日志/var/log/messages 來(lái)查看系統(tǒng)命令的調(diào)用,于是乎把日志文件下載到本地,開(kāi)始搜索 kill 關(guān)鍵字,發(fā)現(xiàn)如下日志:

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
發(fā)現(xiàn)最近一次 kill 命令是在25號(hào)的凌晨1點(diǎn)多,停止 rocketmq 集群,并使用 bin/mqbroker -c conf/broker-b.conf & 進(jìn)行了重新啟動(dòng)。

這個(gè)命令是有問(wèn)題的,沒(méi)有使用 nohup ,如果會(huì)話失效,該進(jìn)程就會(huì)被退出,為了驗(yàn)證,我們?cè)俨橐幌逻M(jìn)程退出時(shí)的日志:

RocketMQ進(jìn)程自動(dòng)退出排查的示例分析  

 
發(fā)現(xiàn)在故障發(fā)生點(diǎn)確實(shí)有 Removed 相關(guān)的日志。

故障原因基本分析到位了,運(yùn)維在啟動(dòng)的時(shí)候沒(méi)有使用 nohup 來(lái)啟動(dòng),故馬上排查剛啟動(dòng)的集群的方式,重新重啟剛啟動(dòng)的 Broker。

RocketMQ優(yōu)雅重啟小建議:

  1. 首先將 broker 的寫權(quán)限關(guān)閉,命令如下:

    bin/mqadmin updateBrokerConfig -b 192.168.x.x:10911 -n 192.168.x.x:9876 -k brokerPermission -v 4
  2. 通過(guò) rocketmq-console 查看該broker的寫入TPS,當(dāng)寫入TPS降為0后,再使用 kill pid 關(guān)閉 rocketmq 進(jìn)程。溫馨提示:將broker的寫權(quán)限關(guān)閉后,非順序消息不會(huì)立馬拒絕,而是需要等客戶端路由信息更新后,不會(huì)在往該broker上發(fā)送消息,故這個(gè)過(guò)程需要等待。

  3. 啟動(dòng) rocketmq

    nohup bin/mqbroker -c conf/broker-a.conf  /dev/null  2>&1 &
  4. 恢復(fù)該節(jié)點(diǎn)的寫權(quán)限

    bin/mqadmin updateBrokerConfig -b 192.168.x.x:10911 -n 192.168.x.x:9876 -k brokerPermission -v 6

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。

分享標(biāo)題:RocketMQ進(jìn)程自動(dòng)退出排查的示例分析
URL標(biāo)題:http://www.rwnh.cn/article44/pgsehe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供ChatGPT、網(wǎng)站內(nèi)鏈、網(wǎng)站排名、網(wǎng)站營(yíng)銷、品牌網(wǎng)站設(shè)計(jì)、做網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)
公安县| 哈巴河县| 铅山县| 桐庐县| 积石山| 安多县| 泉州市| 广昌县| 上高县| 渝北区| 镇雄县| 华坪县| 天门市| 潜山县| 崇仁县| 武平县| 大方县| 简阳市| 沁水县| 宾川县| 乌海市| 阿尔山市| 黄山市| 滦南县| 天全县| 霍林郭勒市| 禹州市| 苏州市| 酉阳| 尖扎县| 湛江市| 安康市| 方正县| 宜阳县| 汉中市| 台北市| 军事| 灵璧县| 漾濞| 玛曲县| 英德市|