這篇文章主要介紹“hadoop參數(shù)調(diào)優(yōu)的方法是什么”,在日常操作中,相信很多人在hadoop參數(shù)調(diào)優(yōu)的方法是什么問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”hadoop參數(shù)調(diào)優(yōu)的方法是什么”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!
成都創(chuàng)新互聯(lián)公司成立十余年來,這條路我們正越走越好,積累了技術(shù)與客戶資源,形成了良好的口碑。為客戶提供網(wǎng)站制作、做網(wǎng)站、網(wǎng)站策劃、網(wǎng)頁(yè)設(shè)計(jì)、域名申請(qǐng)、網(wǎng)絡(luò)營(yíng)銷、VI設(shè)計(jì)、網(wǎng)站改版、漏洞修補(bǔ)等服務(wù)。網(wǎng)站是否美觀、功能強(qiáng)大、用戶體驗(yàn)好、性價(jià)比高、打開快等等,這些對(duì)于網(wǎng)站建設(shè)都非常重要,成都創(chuàng)新互聯(lián)公司通過對(duì)建站技術(shù)性的掌握、對(duì)創(chuàng)意設(shè)計(jì)的研究為客戶提供一站式互聯(lián)網(wǎng)解決方案,攜手廣大客戶,共同發(fā)展進(jìn)步。
一、 hdfs-site.xml 配置文件
1、 dfs.blocksize
參數(shù):hadoop文件塊大小
描述:新文件的默認(rèn)塊大小,以字節(jié)為單位,默認(rèn) 134217728 字節(jié)。
可以使用以下后綴(大小寫不敏感):k(kilo)、m(mega)、g(giga)、t(tera)、p(peta)、e(exa)來指定大小(如128k、512m、1g等),
或者以字節(jié)為單位提供完整的大小。
2、 dfs.namenode.handler.count
參數(shù):namenode的服務(wù)器線程數(shù)
描述:NameNode有一個(gè)工作線程池用來處理客戶端的遠(yuǎn)程過程調(diào)用及集群守護(hù)進(jìn)程的調(diào)用。處理程序數(shù)量越多意味著要更大的池來處理來自不同DataNode的并發(fā)心跳以及客戶端并發(fā)的元數(shù)據(jù)操作。對(duì)于大集群或者有大量客戶端的集群來說,通常需要增大參數(shù)dfs.namenode.handler.count的默認(rèn)值10。設(shè)置該值的一般原則是將其設(shè)置為集群大小的自然對(duì)數(shù)乘以20,即20logN,N為集群大小。
3、 dfs.datanode.balance.bandwidthPerSec
參數(shù): datanode 平衡帶寬
描述:指定每個(gè)datanode可以利用每秒字節(jié)數(shù)來平衡目標(biāo)的最大帶寬。
4、 dfs.replication
參數(shù):塊副本數(shù)
描述:默認(rèn)的塊復(fù)制??梢栽趧?chuàng)建文件時(shí)指定復(fù)制的實(shí)際數(shù)量。如果在create time中沒有指定復(fù)制,則使用默認(rèn)值3。
5、dfs.datanode.max.transfer.threads
參數(shù):datanode 最大傳輸線程數(shù)
描述:指定用于傳輸數(shù)據(jù)進(jìn)出DN的最大線程數(shù)。集群中如果不一致,會(huì)造成數(shù)據(jù)分布不均。
二、 core-site.xml 配置文件
1、 io.file.buffer.size
參數(shù):文件的緩沖區(qū)大小
描述:用于順序文件的緩沖區(qū)大小。這個(gè)緩沖區(qū)的大小應(yīng)該是硬件頁(yè)面大小的倍數(shù)(在Intel x86上是4096),它決定了在讀寫操作中緩沖了多少數(shù)據(jù)。SequenceFiles 讀取和寫入操作的緩存區(qū)大小,還有map的輸出都用到了這個(gè)緩沖區(qū)容量, 可減少 I/O 次數(shù)。建議設(shè)定為 64KB 到 128KB
三、 yarn-site.xml 配置文件
1、 yarn.nodemanager.resource.memory-mb
參數(shù):該節(jié)點(diǎn) nodemanager 資源池內(nèi)存
描述:NodeManager節(jié)點(diǎn)上可使用的物理內(nèi)存總量,默認(rèn)是8192(MB),根據(jù)節(jié)點(diǎn)所能分配的最大的內(nèi)存進(jìn)行分配即可,注意為操作系統(tǒng)與其他服務(wù)預(yù)留資源。
2、yarn.nodemanager.resource.cpu-vcores
參數(shù):該節(jié)點(diǎn) 有多少cpu加入資源池 , 默認(rèn)值為8
描述:表示該節(jié)點(diǎn)上YARN可使用的虛擬CPU個(gè)數(shù),默認(rèn)是8,注意,目前推薦將該值設(shè)值為與物理CPU核數(shù)數(shù)目相同。如果你的節(jié)點(diǎn)CPU核數(shù)不夠8個(gè),則需要調(diào)減小這個(gè)值,而YARN不會(huì)智能的探測(cè)節(jié)點(diǎn)的物理CPU總數(shù)。
到此,關(guān)于“hadoop參數(shù)調(diào)優(yōu)的方法是什么”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!
文章題目:hadoop參數(shù)調(diào)優(yōu)的方法是什么
本文鏈接:http://www.rwnh.cn/article4/jjsjie.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應(yīng)網(wǎng)站、網(wǎng)站維護(hù)、網(wǎng)頁(yè)設(shè)計(jì)公司、靜態(tài)網(wǎng)站、虛擬主機(jī)、商城網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)