2015年,UCloud在國內云廠商中首先推出了K80-GPU云主機。此后,我們又相繼推出了P40、V100等GPU云主機、定制化物理機以及UAI-Train、UAI-Inference等以GPU為基礎的AI產品,為人工智能用戶持續(xù)創(chuàng)造價值。如今,我們更進一步,推出專門的GPU可用區(qū)。通過對架構精裁,其相比于普通可用區(qū),GPU價格降低20%,帶寬價格降低64%,并支持10G/25G物理網絡和VPC私有網絡,憑借獨享性能、豐富產品互聯(lián)、自助購買、按月租賃,幫助用戶避免自行維護GPU集群做AI訓練的高昂投入。
目前,福建GPU可用區(qū)A已對全部用戶開放,并支持在控制臺直接購買下單。
降低20%成本,支持按月付費
GPU使用成本高,一方面是GPU卡本身非常昂貴,另一方面功耗與機柜成本幾乎占據了整體成本的40%,而這部分成本可以被有效降低。為此UCloud在國內臻選電力成本較低且符合基礎標準的機房建立GPU可用區(qū)。此次上線的GPU可用區(qū)位于福建省,為省級骨干IDC機房,符合國際數(shù)據中心標準Tier3,提供移動線路。
UCloud的云計算核心原本為標準可用區(qū)設計,目的是支撐上萬級別的服務器,近百種不同的云計算服務。為了提升整體性價比,我們花費1周時間,便對GPU可用區(qū)快速進行了定制,推出了一個全新版本的迷你型云計算核心,內部代號“螞蟻”?!拔浵仭焙诵膲嚎s了超過50%的云控制面成本,依然能支撐起完整的物理云主機與網絡產品并提供穩(wěn)定的服務。
受益于功耗、機柜、云計算核心攤銷成本的降低,GPU可用區(qū)的物理云單價比UCloud其他標準可用區(qū)都要便宜20%。以V100物理云為例,GPU可用區(qū)在北京二可用區(qū)E的列表單價降低5000元/月,和業(yè)內相比也有突出的價格優(yōu)勢。UCloud亦提供更具性價比的GPU機型可供選擇。
GPU可用區(qū)的計費模式與其他可用區(qū)一致,物理機支持按月與按年付費,可隨時釋放。用戶不必一次性投入巨大的開支,可自如增減集群規(guī)模,應對市場的動態(tài)變化。此外,福建GPU可用區(qū)提供移動單線網絡,帶寬費用比其他可用區(qū)降低64%。
大單精浮點性能104 TFLOPs,獨享物理機
GPU可用區(qū)以成熟的物理云產品體系為依托。計算、存儲、網絡性能均沒有任何虛擬化帶來的額外開銷。這對AI訓練這樣看重絕對性能的場景非常重要。
一臺GPU物理機大能支持104 TFLOPs的單精度浮點性能,約等于2000顆CPU的算力。采用10G與25G兩套物理網絡環(huán)境。25G網絡帶來更高的集群運算效率,集群規(guī)?!?0臺計算節(jié)點時,均推薦采用25G。和普通可用區(qū)提供的GPU云主機相比,整體性能翻倍。
物理云主機產品已實現(xiàn)后臺資源交付入庫、系統(tǒng)裝機等流程高度自動化,并支持多種鏡像、多種RAID模式可選。用戶直接在控制臺點選后就自動執(zhí)行裝機操作,30分鐘內裝機完成即可使用,免去傳統(tǒng)物理機運輸、搭建、部署、調試等冗長過程。
物理云主機裝機中
針對物理機難以避免的硬件故障隱患,UCloud硬件運維團隊維護了詳細的固件問題列表,發(fā)現(xiàn)隱患會及時發(fā)起固件的全網升級;物理云主機在交付用戶前、用戶退還機器后均會自動執(zhí)行完整的硬件檢測。此外物理云集成了UCloud監(jiān)控平臺,通過監(jiān)控提前發(fā)現(xiàn)磁盤故障、GPU卡溫度過高等硬件問題,并通知NOC團隊快速處理(7*24小時)。
GPU物理云的網關有A/B兩套互備集群,網絡流量可在AB集群之間平滑切換。由于此架構,在主網關出現(xiàn)故障時能實現(xiàn)快速切換到備用網關,最小化對用戶的影響;亦能通過集群切換實現(xiàn)網絡架構的平滑升級。通過這套模式,北京地區(qū)的物理云集群實現(xiàn)了從10G網關到25G網關的在線動態(tài)升級,用戶除了低峰期網絡瞬斷外完全無感知。未來GPU可用區(qū)的網關也能通過這種能力不斷更新版本。
物理云網關互備集群
豐富的產品互聯(lián)
GPU可用區(qū)支持標準的網絡產品,包括彈性EIP、私有網絡VPC、NAT網關等。未來計劃將上線高速通道UDPN,和廣州可用區(qū)互聯(lián)。
在AI訓練場景下,TB級別的訓練數(shù)據如何搬遷上云是用戶的核心訴求。UCloud提供高性能NAS盤柜寄送服務,可支持大100T的離線數(shù)據搬遷,傳輸作業(yè)完成后,會以低階格式化方式擦除數(shù)據,以確保數(shù)據安全。
分布式訓練場景下通常需要大容量的中央存儲節(jié)點。GPU可用區(qū)目前提供SSD磁盤的高性能物理機作為存儲節(jié)點。后續(xù)將提供UFS(分布式文件存儲)產品,給用戶提供最優(yōu)的存儲選擇。
對福建GPU可用區(qū)有任何建議和疑問,歡迎點擊http://ucloudtml.mikecrm.com/aiTDtNg垂詢。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
本文標題:降低20%成本,國內首個GPU可用區(qū)上線-創(chuàng)新互聯(lián)
標題鏈接:http://www.rwnh.cn/article48/jddep.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供商城網站、App開發(fā)、品牌網站設計、網站維護、做網站、關鍵詞優(yōu)化
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)