2021-02-15 分類: 網(wǎng)站建設(shè)
智東西(公眾號:zhidxcom)文 | 心緣
2017年的一個碧空如洗、清風朗日的早晨,智東西前往百度位于山西省陽泉市的云計算中心參觀,參觀內(nèi)容包括整體運營、各大機房服務(wù)器、清潔能源、高效供電方式、自然冷卻等節(jié)電技術(shù)和人工智能預測調(diào)控等等(探秘:李彥宏花47億蓋的大房子)。
時光荏苒,轉(zhuǎn)眼間2年已過,經(jīng)歷一個豬年,陽泉云計算中心也搖身一變,除了是亞洲單體規(guī)模大的數(shù)據(jù)中心,還成了春晚搶紅包流暢體驗的大功臣。
為了承擔起春晚紅包的頂級流量,陽泉云計算中心做了哪些升級?和上一次我們的參觀相比,它又哪些不一樣的亮點呢?云計算中心如何成為百度AI技術(shù)堅實的中流砥柱?帶著這些疑問,智東西和數(shù)家媒體一同再次來探訪這個李彥宏花47億蓋的“大房子”。
說起豬年春晚,想必多數(shù)人印象最深的就是瘋狂搶紅包。百度作為央視春晚的c位合作品牌,策劃了一場全民狂歡的“紅包之夜”。這個夜晚,全球觀眾參與百度APP紅包互動次數(shù)達到208億次,春晚數(shù)據(jù)流量為每秒峰值5000萬次,每分鐘峰值10億次。
作為百度春晚活動的主力部隊,陽泉云計算中心如何實現(xiàn)如此大規(guī)模數(shù)據(jù)的高效協(xié)同與調(diào)配?懷著好奇,我們探訪了陽泉云計算中心的內(nèi)部。
本次來訪剛巧趕上陽泉變天,過了安檢,進入園區(qū),涼風直直往人衣領(lǐng)里鉆,抬頭正對著的便是陽泉云計算中心的ECC監(jiān)控中心。
這里的中心園區(qū)按照設(shè)計標準T3+建造,占地面積約360畝,規(guī)劃建筑面積超過20萬平方米,而團隊總共只有60余人。
也就是說,平均每個員工占地將近6畝、3000+平方米,個頂個的“大地主”。
▲百度云計算(陽泉)中心園區(qū)鳥瞰圖
百度陽泉云計算中心于2014年9月投入使用,截至4月8日,百度陽泉云計算中心已安全運行1744天。該數(shù)據(jù)中心目前已建成投產(chǎn)12萬平方米,采用了百度400多項數(shù)據(jù)中心、網(wǎng)絡(luò)及服務(wù)器專利技術(shù),服務(wù)器裝機能力超過28萬臺。去年1月,該數(shù)據(jù)中心成為國內(nèi)首個服務(wù)器規(guī)模突破10萬臺的單體數(shù)據(jù)中心,目前已上線服務(wù)器超過15萬臺。
我們首先來到百度云計算(陽泉)中心監(jiān)控中心,一個超大的屏幕上囊括了PUE、網(wǎng)絡(luò)架構(gòu)、暖通架構(gòu)、電氣架構(gòu)、告警情況等各種數(shù)值圖表。
▲百度云計算(陽泉)中心監(jiān)控中心
當時屏幕顯示的PUE(Power Usage Effectiveness,電力使用效率)值已經(jīng)低至1.062。
PUE值指的是數(shù)據(jù)中心消耗的所有能源與IT負載消耗的能源之比,是國際上通用的數(shù)據(jù)中心電力使用效率的衡量指標。PUE值越接近于1,表示一個數(shù)據(jù)中心的綠色化程度越高。
而據(jù)工作人員介紹,2018年陽泉云計算中心的年均PUE值達到1.09,能源效率國內(nèi)第一,比全國數(shù)據(jù)中心平均1.73在基礎(chǔ)設(shè)施能效方面提升了88%,目前整個數(shù)據(jù)中心每年節(jié)電2.5億度,相當于13萬戶居民一年的用電量。
作為亞洲單體最強大的算力平臺,陽泉云計算中心的其他數(shù)字也相當亮眼:擁有超過300萬顆CPU核、超過6EB級存儲容量,可存儲的信息量相當于30多萬個中國國家圖書館的藏書總量 (備注:中國國家圖書館是亞洲規(guī)模大、世界第三的國家圖書館) 。
內(nèi)部探訪,機房自然是最主要的環(huán)節(jié)。
在參觀天蝎整機柜服務(wù)器、“冰山”冷存儲服務(wù)器等各種百度自研服務(wù)器后,我們首次踏入百度大腦的核心區(qū)域——AI計算集群,能夠為訓練、推理應(yīng)用提供近百萬級的TFLOPS算力。
▲AI計算集群
1、超級AI服務(wù)器X-MAN 2.0與X-MAN 3.0
當前的AI計算集群由百度自主研發(fā)的AI服務(wù)器X-MAN 2.0組成。X-MAN 2.0在2017年上線,支持8卡NVLink高速互聯(lián),是國內(nèi)首個采用冷板式液體冷卻技術(shù)的GPU解決方案,實現(xiàn)了超高的散熱效率,規(guī)模應(yīng)用后,可以全面去除制冷機組,全面實現(xiàn)無冷機運行。
X-MAN經(jīng)過了三代技術(shù)升級。去年12月,百度X-MAN 3.0在加拿大舉行的第32屆NIPS神經(jīng)信息處理系統(tǒng)大會上揭開神秘面紗。
▲百度X-MAN 3.0
X-MAN 1.0采用的是PCle Fabric技術(shù)架構(gòu),到X-MAN 2.0升級成NVLink,而X-MAN 3.0的重磅升級則在于多機互聯(lián),采用了硬件系統(tǒng)模塊化、互聯(lián)接口標準化、互聯(lián)拓撲高靈活性的設(shè)計思路,提升了多元化AI加速芯片的兼容性,據(jù)悉每秒能完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計算,極大加快了深度學習模型的訓練速度。
或許等到下一次來參觀數(shù)據(jù)中心時,我們就能看見X-MAN 3.0的大規(guī)模應(yīng)用。
2、支持100G的AI高速無損網(wǎng)絡(luò)互聯(lián)技術(shù)
陽泉云計算中心還使用了百度自主研發(fā)高性能交換機,提供超大規(guī)模的網(wǎng)絡(luò)吞吐,支持10G、25G的通用計算網(wǎng)絡(luò)接入和100G的AI高速無損網(wǎng)絡(luò)互聯(lián)技術(shù)。
在數(shù)據(jù)中心外部,百度網(wǎng)絡(luò)構(gòu)建了三個時延圈:從數(shù)據(jù)中心覆蓋用戶時延不超過30ms,從POP點覆蓋用戶的時延不超過10ms,從CDN覆蓋用戶的時延不超過2ms,確保全國用戶的全面覆蓋和就近接入。
在數(shù)據(jù)中心內(nèi)部,百度通過大帶寬、低時延、無損網(wǎng)絡(luò),把數(shù)據(jù)中心數(shù)十萬臺服務(wù)器連接成為一個超級計算機。
3、參與制定國際AI技術(shù)標準
除了研發(fā)創(chuàng)新的高速互聯(lián)、供電、散熱等技術(shù)來解決AI硬件加速模塊和系統(tǒng)設(shè)計中的硬件挑戰(zhàn)外,百度還積極參與國際AI領(lǐng)域技術(shù)標準的制定。
在今年3月美國圣何塞舉辦的2019 OCP全球峰會上,百度宣布與Facebook、微軟聯(lián)合制定OAM (OCP Accelerator Module)標準,主要對AI硬件加速模塊、主板、互聯(lián)拓撲等制定了相關(guān)的基礎(chǔ)規(guī)范。
該標準通過模塊化、標準化指導AI硬件加速模塊和系統(tǒng)設(shè)計,增強不同AI硬件加速模塊和系統(tǒng)的互操作性,加速新AI硬件加速模塊的大規(guī)模落地應(yīng)用,最終推動AI硬件生態(tài)的良性發(fā)展。
經(jīng)過經(jīng)年累月AI技術(shù)和業(yè)務(wù)實踐的積累,百度面向企業(yè)和個人開發(fā)者提供全方位、低門檻的AI服務(wù),其中百度智能云正是百度決勝AI時代重要組成部分。
1、百度智能云:“ABC”三位一體戰(zhàn)略
百度智能云是百度旗下面向企業(yè)及開發(fā)者的智能云計算服務(wù)平臺,是幫助各行業(yè)實現(xiàn)智能化升級和轉(zhuǎn)型的對外一站式服務(wù)輸出窗口。
百度智能云于2015年正式對外開放運營,基于百度18年技術(shù)積累,提出ABC(AI、Big Data、Cloud Computing)三位一體發(fā)展戰(zhàn)略,要用“最全面最落地的A+最開放最安全的B+持續(xù)的C”與IoT、區(qū)塊鏈、邊緣計算結(jié)合。
這一服務(wù)體系擁有智能邊緣、云端全功能AI芯片、安全存儲、一站式解決方案等全面ABC功能,全形態(tài)輸出150多項AI能力,9個開源的大數(shù)據(jù)服務(wù)能力,以及10種計算實例、6類網(wǎng)絡(luò)組件、3級對象存儲等強大的基礎(chǔ)云服務(wù)能力。
人們耳熟能詳?shù)娜四樧R別、OCR、圖像識別、語音技術(shù)、自然語言處理技術(shù)、深度學習等AI能力自是不在話下。
一方面,百度智能云為百度自身業(yè)務(wù)提供了強大的智能云計算服務(wù),承載了搜索、百度地圖、小度、Apollo等多款用戶量過億的產(chǎn)品、服務(wù)和解決方案;另一方面,百度智能云還為金融、新零售、新制造等創(chuàng)新行業(yè)構(gòu)建服務(wù)。
2、傳統(tǒng)智能化升級的三個實例
百度智能云ABC已經(jīng)落地農(nóng)業(yè)加工、鋼鐵、金融、能源、物流、傳媒、氣象、旅游等多個行業(yè),與山西省政府、首鋼、廣發(fā)銀行、新華社、首都機場、中國氣象局、攜程等政府部門和知名企業(yè)合作,推動社會一二三產(chǎn)業(yè)的智能化變革升級。
在航空領(lǐng)域,百度智能云與某航司合作,從安檢口的身份驗證、自助值機行李托運到自助登機,通過提供百度人臉識別等技術(shù),幫助實現(xiàn)更便捷高效的自助服務(wù)體驗。再加上百度大數(shù)據(jù)分析采集、百度云網(wǎng)絡(luò)和計算支持的輔助,機場的核心區(qū)域流量監(jiān)控、智慧問詢、兩艙尋人等智慧服務(wù)得以實現(xiàn)升級。
在智慧交通領(lǐng)域,百度智能云與某交警深度合作,將人臉、車輛、地圖等多項能力整合輸出,不僅能實時查詢車輛/車位、費用、基礎(chǔ)設(shè)施等信息,還通過車輛軌跡分析、車輛狀態(tài)分析、整體綜合分析,實現(xiàn)智慧調(diào)度、智慧停車和智能監(jiān)控功能,最終優(yōu)化配置城市交通資源,緩解交通堵塞等問題。
在智慧制造領(lǐng)域,百度智能云與某鋼鐵集團合作,利用智能質(zhì)檢有效提升良品率,通過車間生產(chǎn)優(yōu)化提高精度,借助智能遠程運維提高設(shè)備生命……經(jīng)由對各個細分環(huán)節(jié)地智能化升級,生產(chǎn)效率得到巨大的提升。
在AI時代的賽道上,智能時代的基礎(chǔ)設(shè)施建設(shè)成為國內(nèi)外云巨頭至關(guān)重要的競爭力。百度作為提供AI基礎(chǔ)解決方案的主要玩家之一,在自身累積經(jīng)驗地基礎(chǔ)上,正用的AI能力為各行業(yè)智能化轉(zhuǎn)型提供助力。
而隨著越來越多的企業(yè)接入網(wǎng)絡(luò),海量數(shù)據(jù)處理、高速傳輸、節(jié)能減排、避免宕機等問題都成為以百度為代表的云計算提供商必須解決的問題。通用型服務(wù)器等產(chǎn)品越來越難以滿足超大規(guī)模數(shù)據(jù)中心的需求,技術(shù)創(chuàng)新和定制化服務(wù)已經(jīng)成為必然趨勢。
當前題目:陽泉云計算中心,撐起百度的超強AI算力!
本文來源:http://www.rwnh.cn/news/101086.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、營銷型網(wǎng)站建設(shè)、標簽優(yōu)化、全網(wǎng)營銷推廣、網(wǎng)頁設(shè)計公司、外貿(mào)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容