本篇內(nèi)容主要講解“Hadoop設計概念是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hadoop設計概念是什么”吧!
創(chuàng)新互聯(lián)建站專注于陽泉網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供陽泉營銷型網(wǎng)站建設,陽泉網(wǎng)站制作、陽泉網(wǎng)頁設計、陽泉網(wǎng)站官網(wǎng)定制、小程序制作服務,打造陽泉網(wǎng)絡公司原創(chuàng)品牌,更為您提供陽泉網(wǎng)站排名全網(wǎng)營銷落地服務。一、Hadoop簡介
Apache Hadoop是目前最流行的軟件框架,可使用簡單的高級編程模型實現(xiàn)大型數(shù)據(jù)集的分布式存儲和處理。Hadoop是Apache Software Foundation的一個開源項目,可以安裝在服務器集群上,以便這些服務器可以通信并協(xié)同工作來存儲和處理大型數(shù)據(jù)集。Hadoop近年來因其有效處理大數(shù)據(jù)的能力而變得非常成功。它允許公司將所有數(shù)據(jù)存儲在一個系統(tǒng)中,并對這些數(shù)據(jù)進行分析,否則傳統(tǒng)解決方案不可能或非常昂貴。
圍繞Hadoop構(gòu)建的許多配套工具提供了各種各樣的處理技術。與輔助系統(tǒng)和實用程序的集成非常出色,使Hadoop的實際工作更輕松,更高效。這些工具共同構(gòu)成了Hadoop生態(tài)系統(tǒng)。
大家可以將Hadoop視為大數(shù)據(jù)操作系統(tǒng),從而可以在所有龐大的數(shù)據(jù)集上運行不同類型的工作負載。其范圍從離線批處理到機器學習再到實時流處理。
二、Hadoop設計概念
為了解決處理和存儲大型數(shù)據(jù)集的挑戰(zhàn),Hadoop是根據(jù)以下核心特征構(gòu)建的:
1、分布 - 存儲和處理不是構(gòu)建一臺大型超級計算機,而是分布在一組通信和協(xié)同工作的小型機器上。
2、橫向可擴展性 - 只需添加新計算機即可輕松擴展Hadoop集群。每臺新機器都會按比例增加Hadoop集群的總存儲和處理能力。
3、容錯 - 即使少數(shù)硬件或軟件組件無法正常工作,Hadoop仍可繼續(xù)運行。
4、成本優(yōu)化 - Hadoop不需要昂貴的高端服務器,無需商業(yè)許可即可正常工作。
5、編程抽象 - Hadoop負責處理與分布式計算相關的所有混亂細節(jié)。借助高級API,用戶可以專注于實現(xiàn)解決現(xiàn)實問題的業(yè)務邏輯。
6、數(shù)據(jù)位置 - Hadoop不會將大型數(shù)據(jù)集移動到運行應用程序的位置,而是運行數(shù)據(jù)已經(jīng)存在的應用程序。
三、Hadoop組件
Hadoop分為兩個核心組件:HDFS分布式文件系統(tǒng);YARN集群資源管理技術。
1、HDFS:
HDFS是一個Hadoop分布式文件系統(tǒng)。它可以在您需要的任意數(shù)量的服務器上運行 - HDFS可以輕松擴展到數(shù)千個節(jié)點和數(shù)PB的數(shù)據(jù)。HDFS設置越大,某些磁盤,服務器或網(wǎng)絡交換機出現(xiàn)故障的概率就越大。HDFS通過在多個服務器上復制數(shù)據(jù)來幸免于這些類型的故障。HDFS自動檢測給定組件是否已發(fā)生故障,并采取對用戶透明發(fā)生的必要恢復操作。
HDFS設計用于存儲數(shù)百兆字節(jié)或千兆字節(jié)的大型文件,并為它們提供高吞吐量的流數(shù)據(jù)訪問。最后但同樣重要的是,HDFS支持一次寫入多次讀取模型。對于這個用例,HDFS就像一個魅力。但是,如果您需要存儲大量具有隨機讀寫訪問權限的小文件,那么其他系統(tǒng)(如RDBMS和Apache HBase)可以做得更好。
2、YARN:
YARN(Yet Another Resource Negotiator)負責管理Hadoop集群上的資源,并支持運行處理存儲在HDFS上的數(shù)據(jù)的各種分布式應用程序。與HDFS類似,YARN遵循主從設計,ResourceManager進程充當主節(jié)點,多個NodeManager充當工作者。他們有以下責任:
(1)ResourceManager
跟蹤實時NodeManagers以及群集中每臺服務器上的可用計算資源量。為應用程序分配可用資源。監(jiān)視Hadoop集群上所有應用程序的執(zhí)行情況。
(2)節(jié)點管理器
管理Hadoop集群中單個節(jié)點上的計算資源(RAM和CPU)。運行各種應用程序的任務,并強制它們在指定的計算資源的限制范圍內(nèi)。
YARN以資源容器的形式將集群資源分配給各種應用程序,資源容器表示RAM量和CPU核心數(shù)量的組合。
Hadoop = HDFS + YARN
在同一群集上運行的HDFS和YARN守護程序為我們提供了一個用于存儲和處理大型數(shù)據(jù)集的強大平臺。
到此,相信大家對“Hadoop設計概念是什么”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)成都網(wǎng)站設計公司網(wǎng)站,更多相關內(nèi)容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
網(wǎng)頁名稱:Hadoop設計概念是什么-創(chuàng)新互聯(lián)
本文鏈接:http://www.rwnh.cn/article30/dscspo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、網(wǎng)站設計、小程序開發(fā)、移動網(wǎng)站建設、外貿(mào)建站、網(wǎng)站排名
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容