2021-01-31 分類: 網(wǎng)站建設(shè)
一、什么是高可用
高可用HA(High Availability)是分布式系統(tǒng)架構(gòu)設(shè)計(jì)中必須考慮的因素之一,它通常是指,通過設(shè)計(jì)減少系統(tǒng)不能提供服務(wù)的時(shí)間。
假設(shè)系統(tǒng)一直能夠提供服務(wù),我們說(shuō)系統(tǒng)的可用性是100%。如果系統(tǒng)每運(yùn)行100個(gè)時(shí)間單位,會(huì)有1個(gè)時(shí)間單位無(wú)法提供服務(wù),我們說(shuō)系統(tǒng)的可用性是99%。很多公司的高可用目標(biāo)是4個(gè)9,也就是99.99%,這就意味著,系統(tǒng)的年停機(jī)時(shí)間為8.76個(gè)小時(shí)。
百度的搜索首頁(yè),是業(yè)內(nèi)公認(rèn)高可用保障非常出色的系統(tǒng),甚至人們會(huì)通過www.baidu.com能不能訪問來(lái)判斷“網(wǎng)絡(luò)的連通性”,百度高可用的服務(wù)讓人留下啦“網(wǎng)絡(luò)通暢,百度就能訪問”,“百度打不開,應(yīng)該是網(wǎng)絡(luò)連不上”的印象,這其實(shí)是對(duì)百度HA高的褒獎(jiǎng)。
二、如何保障系統(tǒng)的高可用
我們都知道,單點(diǎn)是系統(tǒng)高可用的大敵,單點(diǎn)往往是系統(tǒng)高可用大的風(fēng)險(xiǎn)和敵人,應(yīng)該盡量在系統(tǒng)設(shè)計(jì)的過程中避免單點(diǎn)。方法論上,高可用保證的原則是“集群化”,或者叫“冗余”:只有一個(gè)單點(diǎn),掛了服務(wù)會(huì)受影響;如果有冗余備份,掛了還有其他backup能夠頂上。
保證系統(tǒng)高可用,架構(gòu)設(shè)計(jì)的核心準(zhǔn)則是:冗余。有了冗余之后,還不夠,每次出現(xiàn)故障需要人工介入恢復(fù)勢(shì)必會(huì)增加系統(tǒng)的不可服務(wù)實(shí)踐。所以,又往往是通過“自動(dòng)故障轉(zhuǎn)移”來(lái)實(shí)現(xiàn)系統(tǒng)的高可用。接下來(lái)我們看下典型互聯(lián)網(wǎng)架構(gòu)中,如何通過冗余+自動(dòng)故障轉(zhuǎn)移來(lái)保證系統(tǒng)的高可用特性。
三、常見的互聯(lián)網(wǎng)分層架構(gòu)
常見互聯(lián)網(wǎng)分布式架構(gòu)如上,分為:
整個(gè)系統(tǒng)的高可用,又是通過每一層的冗余+自動(dòng)故障轉(zhuǎn)移來(lái)綜合實(shí)現(xiàn)的。
四、分層高可用架構(gòu)實(shí)踐
1.客戶端層->反向代理層的高可用
客戶端層到反向代理層的高可用,是通過反向代理層的冗余來(lái)實(shí)現(xiàn)的。以nginx為例:有兩臺(tái)nginx,一臺(tái)對(duì)線上提供服務(wù),另一臺(tái)冗余以保證高可用,常見的實(shí)踐是keepalived存活探測(cè),相同virtual IP提供服務(wù)。
自動(dòng)故障轉(zhuǎn)移:當(dāng)nginx掛了的時(shí)候,keepalived能夠探測(cè)到,會(huì)自動(dòng)的進(jìn)行故障轉(zhuǎn)移,將流量自動(dòng)遷移到shadow-nginx,由于使用的是相同的virtual IP,這個(gè)切換過程對(duì)調(diào)用方是透明的。
2. 反向代理層->站點(diǎn)層的高可用
反向代理層到站點(diǎn)層的高可用,是通過站點(diǎn)層的冗余來(lái)實(shí)現(xiàn)的。假設(shè)反向代理層是nginx,nginx.conf里能夠配置多個(gè)web后端,并且nginx能夠探測(cè)到多個(gè)后端的存活性。
自動(dòng)故障轉(zhuǎn)移:當(dāng)web-server掛了的時(shí)候,nginx能夠探測(cè)到,會(huì)自動(dòng)的進(jìn)行故障轉(zhuǎn)移,將流量自動(dòng)遷移到其他的web-server,整個(gè)過程由nginx自動(dòng)完成,對(duì)調(diào)用方是透明的。
3. 站點(diǎn)層->服務(wù)層的高可用
站點(diǎn)層到服務(wù)層的高可用,是通過服務(wù)層的冗余來(lái)實(shí)現(xiàn)的?!胺?wù)連接池”會(huì)建立與下游服務(wù)多個(gè)連接,每次請(qǐng)求會(huì)“隨機(jī)”選取連接來(lái)訪問下游服務(wù)。
自動(dòng)故障轉(zhuǎn)移:當(dāng)service掛了的時(shí)候,service-connection-pool能夠探測(cè)到,會(huì)自動(dòng)的進(jìn)行故障轉(zhuǎn)移,將流量自動(dòng)遷移到其他的service,整個(gè)過程由連接池自動(dòng)完成,對(duì)調(diào)用方是透明的(所以說(shuō)RPC-client中的服務(wù)連接池是很重要的基礎(chǔ)組件)。
4. 服務(wù)層>緩存層的高可用
服務(wù)層到緩存層的高可用,是通過緩存數(shù)據(jù)的冗余來(lái)實(shí)現(xiàn)的。 緩存層的數(shù)據(jù)冗余又有幾種方式:第一種是利用客戶端的封裝,service對(duì)cache進(jìn)行雙讀或者雙寫。
緩存層也可以通過支持主從同步的緩存集群來(lái)解決緩存層的高可用問題。
以redis為例,redis天然支持主從同步,redis官方也有sentinel哨兵機(jī)制,來(lái)做redis的存活性檢測(cè)。
自動(dòng)故障轉(zhuǎn)移:當(dāng)redis主掛了的時(shí)候,sentinel能夠探測(cè)到,會(huì)通知調(diào)用方訪問新的redis,整個(gè)過程由sentinel和redis集群配合完成,對(duì)調(diào)用方是透明的。
說(shuō)完緩存的高可用,這里要多說(shuō)一句,業(yè)務(wù)對(duì)緩存并不一定有“高可用”要求,更多的對(duì)緩存的使用場(chǎng)景,是用來(lái)“加速數(shù)據(jù)訪問”:把一部分?jǐn)?shù)據(jù)放到緩存里,如果緩存掛了或者緩存沒有命中,是可以去后端的數(shù)據(jù)庫(kù)中再取數(shù)據(jù)的。
這類允許“cache miss”的業(yè)務(wù)場(chǎng)景,緩存架構(gòu)的建議是:
將kv緩存封裝成服務(wù)集群,上游設(shè)置一個(gè)代理(代理可以用集群的方式保證高可用),代理的后端根據(jù)緩存訪問的key水平切分成若干個(gè)實(shí)例,每個(gè)實(shí)例的訪問并不做高可用。
緩存實(shí)例掛了屏蔽:當(dāng)有水平切分的實(shí)例掛掉時(shí),代理層直接返回cache miss,此時(shí)緩存掛掉對(duì)調(diào)用方也是透明的。key水平切分實(shí)例減少,不建議做re-hash,這樣容易引發(fā)緩存數(shù)據(jù)的不一致。
5. 服務(wù)層>數(shù)據(jù)庫(kù)層的高可用
大部分互聯(lián)網(wǎng)技術(shù),數(shù)據(jù)庫(kù)層都用了“主從同步,讀寫分離”架構(gòu),所以數(shù)據(jù)庫(kù)層的高可用,又分為“讀庫(kù)高可用”與“寫庫(kù)高可用”兩類。
服務(wù)層到數(shù)據(jù)庫(kù)讀的高可用,是通過讀庫(kù)的冗余來(lái)實(shí)現(xiàn)的。
既然冗余了讀庫(kù),一般來(lái)說(shuō)就至少有2個(gè)從庫(kù),“數(shù)據(jù)庫(kù)連接池”會(huì)建立與讀庫(kù)多個(gè)連接,每次請(qǐng)求會(huì)路由到這些讀庫(kù)。
自動(dòng)故障轉(zhuǎn)移:當(dāng)讀庫(kù)掛了的時(shí)候,db-connection-pool能夠探測(cè)到,會(huì)自動(dòng)的進(jìn)行故障轉(zhuǎn)移,將流量自動(dòng)遷移到其他的讀庫(kù),整個(gè)過程由連接池自動(dòng)完成,對(duì)調(diào)用方是透明的(所以說(shuō)DAO中的數(shù)據(jù)庫(kù)連接池是很重要的基礎(chǔ)組件)。
服務(wù)層到數(shù)據(jù)庫(kù)寫的高可用,是通過寫庫(kù)的冗余來(lái)實(shí)現(xiàn)的。
以mysql為例,可以設(shè)置兩個(gè)mysql雙主同步,一臺(tái)對(duì)線上提供服務(wù),另一臺(tái)冗余以保證高可用,常見的實(shí)踐是keepalived存活探測(cè),相同virtual IP提供服務(wù)。
自動(dòng)故障轉(zhuǎn)移:當(dāng)寫庫(kù)掛了的時(shí)候,keepalived能夠探測(cè)到,會(huì)自動(dòng)的進(jìn)行故障轉(zhuǎn)移,將流量自動(dòng)遷移到shadow-db-master,由于使用的是相同的virtual IP,這個(gè)切換過程對(duì)調(diào)用方是透明的。
五、總結(jié)
高可用HA(High Availability)是分布式系統(tǒng)架構(gòu)設(shè)計(jì)中必須考慮的因素之一,它通常是指,通過設(shè)計(jì)減少系統(tǒng)不能提供服務(wù)的時(shí)間。
方法論上,高可用是通過冗余+自動(dòng)故障轉(zhuǎn)移來(lái)實(shí)現(xiàn)的。
整個(gè)互聯(lián)網(wǎng)分層系統(tǒng)架構(gòu)的高可用,又是通過每一層的冗余+自動(dòng)故障轉(zhuǎn)移來(lái)綜合實(shí)現(xiàn)的,具體的:
轉(zhuǎn)自:http://www.cnblogs.com/afee666/p/6930029.html
網(wǎng)站欄目:高可用互聯(lián)網(wǎng)應(yīng)用的架構(gòu)及技術(shù)實(shí)踐
網(wǎng)頁(yè)網(wǎng)址:http://www.rwnh.cn/news40/98340.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、網(wǎng)站導(dǎo)航、做網(wǎng)站、電子商務(wù)、App開發(fā)、軟件開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容