公司基礎(chǔ)架構(gòu)這邊想提取慢作業(yè)和獲悉資源浪費(fèi)的情況,所以裝個(gè)dr elephant看看。LinkIn開源的系統(tǒng),可以對(duì)基于yarn的mr和spark作業(yè)進(jìn)行性能分析和調(diào)優(yōu)建議。
DRE大部分基于java開發(fā),spark監(jiān)控部分使用scala開發(fā),使用play堆棧式框架。這是一個(gè)類似Python里面Django的框架,基于java?scala?沒太細(xì)了解,直接下來就能用,需要java1.8以上。
prerequest list:
Java 1.8
PlayFramework+activator
Nodejs+npm
scala+sbt
編譯服務(wù)器是設(shè)立在美國(guó)硅谷的某云主機(jī),之前為了bigtop已經(jīng)裝好了java,maven,ant,scala,sbt等編譯工具,所以下載activator解壓放到/usr/local并加入PATH即可。
然后從 github clone一份dr-elephant下來,打開compile.conf,修改hadoop和spark版本為當(dāng)前使用版本,:wq保存退出,運(yùn)行compile.sh進(jìn)行編譯,經(jīng)過短暫的等待之后,因?yàn)槊绹?guó)服務(wù)器,下依賴快。會(huì)有個(gè)dist文件夾,里面會(huì)打包一個(gè)dr-elephant-2.0.x.zip,拷出來解壓縮就可以用了。
DRE本身需要mysql 5.5以上支持,或者mariadb最新的10.1穩(wěn)定版本亦可。這里會(huì)有一個(gè)問題,就是在DRE/conf/evolutions/default/1.sql里面的這三行:
create index yarn_app_result_i4 on yarn_app_result (flow_exec_id); create index yarn_app_result_i5 on yarn_app_result (job_def_id); create index yarn_app_result_i6 on yarn_app_result (flow_def_id);由于在某些數(shù)據(jù)庫(kù)情況下,索引長(zhǎng)度會(huì)超過數(shù)據(jù)庫(kù)本身的限制,所以,需要修改索引長(zhǎng)度來避免無法啟動(dòng)的情況發(fā)生。
create index yarn_app_result_i4 on yarn_app_result (flow_exec_id(150)); create index yarn_app_result_i5 on yarn_app_result (job_def_id(150)); create index yarn_app_result_i6 on yarn_app_result (flow_def_id(150));然后就應(yīng)該沒啥問題了。
到數(shù)據(jù)庫(kù)里創(chuàng)建一個(gè)叫drelephant的數(shù)據(jù)庫(kù),并給出相關(guān)訪問權(quán)限用戶
接下來是需要配置DRE:
打開app-conf/elephant.conf
# Play application server port # 啟動(dòng)dre后play框架監(jiān)聽的web端口 port=8080 # Database configuration # 數(shù)據(jù)庫(kù)主機(jī),用戶名密碼庫(kù)名 db_url=localhost db_name=drelephant db_user="root" db_password=其他默認(rèn)即可,不需更改
然后是GeneralConf.xml
<configuration> <property> <name>drelephant.analysis.thread.count</name> <value>3</value> <description>Number of threads to analyze the completed jobs</description> </property> <property> <name>drelephant.analysis.fetch.interval</name> <value>60000</value> <description>Interval between fetches in milliseconds</description> </property> <property> <name>drelephant.analysis.retry.interval</name> <value>60000</value> <description>Interval between retries in milliseconds</description> </property> <property> <name>drelephant.application.search.match.partial</name> <value>true</value> <description>If this property is "false", search will only make exact matches</description> </property> </configuration>修改drelephant.analysis.thread.count,默認(rèn)是3,建議修改到10,3的話從jobhistoryserver讀取的速度太慢,高于10的話又讀取的太快,會(huì)對(duì)jobhistoryserver造成很大壓力。下面兩個(gè)一個(gè)是讀取的時(shí)間周期,一個(gè)是重試讀取的間隔時(shí)間周期。
然后到bin下執(zhí)行start.sh啟動(dòng)。And then, show smile to the yellow elephant。
裝完看了一下這個(gè)東西,其實(shí)本身原理并不復(fù)雜,就是讀取各種jmx,metrics,日志信息,自己寫一個(gè)也不是沒有可能。功能主要是把作業(yè)信息里的內(nèi)容匯總放到一屏里面顯示,省的在JHS的頁(yè)面里一個(gè)一個(gè)點(diǎn)了。
That's it, so easy
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
網(wǎng)站名稱:Hadoop監(jiān)控分析工具Dr.Elephant-創(chuàng)新互聯(lián)
文章鏈接:http://www.rwnh.cn/article20/dgchco.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站策劃、用戶體驗(yàn)、搜索引擎優(yōu)化、手機(jī)網(wǎng)站建設(shè)、ChatGPT、電子商務(wù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容