nosql分類圖,nosql介紹

nosql數(shù)據(jù)庫是什么具有代表性以key-value的形式存儲的

什么是NoSQL

噶爾網(wǎng)站制作公司哪家好，找創(chuàng)新互聯(lián)！從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、自適應(yīng)網(wǎng)站建設(shè)等網(wǎng)站項目制作，到程序開發(fā)，運營維護。創(chuàng)新互聯(lián)公司2013年成立到現(xiàn)在10年的時間，我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗，來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。

大家有沒有聽說過“NoSQL”呢?近年，這個詞極受關(guān)注?？吹健癗oSQL”這個詞，大家可能會誤以為是“No!SQL”的縮寫，并深感憤怒：“SQL怎么會沒有必要了呢?”但實際上，它是“Not Only SQL”的縮寫。它的意義是：適用關(guān)系型數(shù)據(jù)庫的時候就使用關(guān)系型數(shù)據(jù)庫，不適用的時候也沒有必要非使用關(guān)系型數(shù)據(jù)庫不可，可以考慮使用更加合適的數(shù)據(jù)存儲。

為彌補關(guān)系型數(shù)據(jù)庫的不足，各種各樣的NoSQL數(shù)據(jù)庫應(yīng)運而生。

為了更好地了解本書所介紹的NoSQL數(shù)據(jù)庫，對關(guān)系型數(shù)據(jù)庫的理解是必不可少的。那么，就讓我們先來看一看關(guān)系型數(shù)據(jù)庫的歷史、分類和特征吧。

關(guān)系型數(shù)據(jù)庫簡史

1969年，埃德加?6?1弗蘭克?6?1科德(Edgar Frank Codd)發(fā)表了劃時代的論文，首次提出了關(guān)系數(shù)據(jù)模型的概念。但可惜的是，刊登論文的《IBM Research Report》只是IBM公司的內(nèi)部刊物，因此論文反響平平。1970年，他再次在刊物《Communication of the ACM》上發(fā)表了題為“A Relational Model of Data for Large Shared Data banks”(大型共享數(shù)據(jù)庫的關(guān)系模型)的論文，終于引起了大家的關(guān)注。

科德所提出的關(guān)系數(shù)據(jù)模型的概念成為了現(xiàn)今關(guān)系型數(shù)據(jù)庫的基礎(chǔ)。當時的關(guān)系型數(shù)據(jù)庫由于硬件性能低劣、處理速度過慢而遲遲沒有得到實際應(yīng)用。但之后隨著硬件性能的提升，加之使用簡單、性能優(yōu)越等優(yōu)點，關(guān)系型數(shù)據(jù)庫得到了廣泛的應(yīng)用。

通用性及高性能

雖然本書是講解NoSQL數(shù)據(jù)庫的，但有一個重要的大前提，請大家一定不要誤解。這個大前提就是“關(guān)系型數(shù)據(jù)庫的性能絕對不低，它具有非常好的通用性和非常高的性能”。毫無疑問，對于絕大多數(shù)的應(yīng)用來說它都是最有效的解決方案。

突出的優(yōu)勢

關(guān)系型數(shù)據(jù)庫作為應(yīng)用廣泛的通用型數(shù)據(jù)庫，它的突出優(yōu)勢主要有以下幾點:

保持數(shù)據(jù)的一致性(事務(wù)處理)

由于以標準化為前提，數(shù)據(jù)更新的開銷很小(相同的字段基本上都只有一處)

可以進行JOIN等復(fù)雜查詢

存在很多實際成果和專業(yè)技術(shù)信息(成熟的技術(shù))

這其中，能夠保持數(shù)據(jù)的一致性是關(guān)系型數(shù)據(jù)庫的最大優(yōu)勢。在需要嚴格保證數(shù)據(jù)一致性和處理完整性的情況下，用關(guān)系型數(shù)據(jù)庫是肯定沒有錯的。但是有些情況不需要JOIN，對上述關(guān)系型數(shù)據(jù)庫的優(yōu)點也沒有什么特別需要，這時似乎也就沒有必要拘泥于關(guān)系型數(shù)據(jù)庫了。

關(guān)系型數(shù)據(jù)庫的不足

不擅長的處理

就像之前提到的那樣，關(guān)系型數(shù)據(jù)庫的性能非常高。但是它畢竟是一個通用型的數(shù)據(jù)庫，并不能完全適應(yīng)所有的用途。具體來說它并不擅長以下處理：

大量數(shù)據(jù)的寫入處理

為有數(shù)據(jù)更新的表做索引或表結(jié)構(gòu)(schema)變更

字段不固定時應(yīng)用

對簡單查詢需要快速返回結(jié)果的處理

。。。。。。

NoSQL數(shù)據(jù)庫

為了彌補關(guān)系型數(shù)據(jù)庫的不足(特別是最近幾年)，NoSQL數(shù)據(jù)庫出現(xiàn)了。關(guān)系型數(shù)據(jù)庫應(yīng)用廣泛，能進行事務(wù)處理和JOIN等復(fù)雜處理。相對地，NoSQL數(shù)據(jù)庫只應(yīng)用在特定領(lǐng)域，基本上不進行復(fù)雜的處理，但它恰恰彌補了之前所列舉的關(guān)系型數(shù)據(jù)庫的不足之處。

易于數(shù)據(jù)的分散

如前所述，關(guān)系型數(shù)據(jù)庫并不擅長大量數(shù)據(jù)的寫入處理。原本關(guān)系型數(shù)據(jù)庫就是以JOIN為前提的，就是說，各個數(shù)據(jù)之間存在關(guān)聯(lián)是關(guān)系型數(shù)據(jù)庫得名的主要原因。為了進行JOIN處理，關(guān)系型數(shù)據(jù)庫不得不把數(shù)據(jù)存儲在同一個服務(wù)器內(nèi)，這不利于數(shù)據(jù)的分散。相反，NoSQL數(shù)據(jù)庫原本就不支持JOIN處理，各個數(shù)據(jù)都是獨立設(shè)計的，很容易把數(shù)據(jù)分散到多個服務(wù)器上。由于數(shù)據(jù)被分散到了多個服務(wù)器上，減少了每個服務(wù)器上的數(shù)據(jù)量，即使要進行大量數(shù)據(jù)的寫入操作，處理起來也更加容易。同理，數(shù)據(jù)的讀入操作當然也同樣容易。

提升性能和增大規(guī)模

下面說一點題外話，如果想要使服務(wù)器能夠輕松地處理更大量的數(shù)據(jù)，那么只有兩個選擇：一是提升性能，二是增大規(guī)模。下面我們來整理一下這兩者的不同。

首先，提升性能指的就是通過提升現(xiàn)行服務(wù)器自身的性能來提高處理能力。這是非常簡單的方法，程序方面也不需要進行變更，但需要一些費用。若要購買性能翻倍的服務(wù)器，需要花費的資金往往不只是原來的2倍，可能需要多達5到10倍。這種方法雖然簡單，但是成本較高。

另一方面，增大規(guī)模指的是使用多臺廉價的服務(wù)器來提高處理能力。它需要對程序進行變更，但由于使用廉價的服務(wù)器，可以控制成本。另外，以后只要依葫蘆畫瓢增加廉價服務(wù)器的數(shù)量就可以了。

不對大量數(shù)據(jù)進行處理的話就沒有使用的必要嗎？

NoSQL數(shù)據(jù)庫基本上來說為了“使大量數(shù)據(jù)的寫入處理更加容易(讓增加服務(wù)器數(shù)量更容易)”而設(shè)計的。但如果不是對大量數(shù)據(jù)進行操作的話，NoSQL數(shù)據(jù)庫的應(yīng)用就沒有意義嗎?

答案是否定的。的確，它在處理大量數(shù)據(jù)方面很有優(yōu)勢。但實際上NoSQL數(shù)據(jù)庫還有各種各樣的特點，如果能夠恰當?shù)乩眠@些特點將會是非常有幫助。具體的例子將會在第2章和第3章進行介紹，這些用途將會讓你感受到利用NoSQL的好處。

希望順暢地對數(shù)據(jù)進行緩存(Cache)處理

希望對數(shù)組類型的數(shù)據(jù)進行高速處理

希望進行全部保存

多樣的NoSQL數(shù)據(jù)庫

NoSQL數(shù)據(jù)庫存在著“key-value存儲”、“文檔型數(shù)據(jù)庫”、“列存儲數(shù)據(jù)庫”等各種各樣的種類，每種數(shù)據(jù)庫又包含各自的特點。下一節(jié)讓我們一起來了解一下NoSQL數(shù)據(jù)庫的種類和特點。

NoSQL數(shù)據(jù)庫是什么

NoSQL說起來簡單，但實際上到底有多少種呢?我在提筆的時候，到NoSQL的官方網(wǎng)站上確認了一下，竟然已經(jīng)有122種了。另外官方網(wǎng)站上也介紹了本書沒有涉及到的圖形數(shù)據(jù)庫和對象數(shù)據(jù)庫等各個類別。不知不覺間，原來已經(jīng)出現(xiàn)了這么多的NoSQL數(shù)據(jù)庫啊。

本節(jié)將為大家介紹具有代表性的NoSQL數(shù)據(jù)庫。

key-value存儲

這是最常見的NoSQL數(shù)據(jù)庫，它的數(shù)據(jù)是以key-value的形式存儲的。雖然它的處理速度非?？?，但是基本上只能通過key的完全一致查詢獲取數(shù)據(jù)。根據(jù)數(shù)據(jù)的保存方式可以分為臨時性、永久性和兩者兼具三種。

臨時性

memcached屬于這種類型。所謂臨時性就是 “數(shù)據(jù)有可能丟失”的意思。memcached把所有數(shù)據(jù)都保存在內(nèi)存中，這樣保存和讀取的速度非?？?，但是當memcached停止的時候，數(shù)據(jù)就不存在了。由于數(shù)據(jù)保存在內(nèi)存中，所以無法操作超出內(nèi)存容量的數(shù)據(jù)(舊數(shù)據(jù)會丟失)。

在內(nèi)存中保存數(shù)據(jù)

可以進行非?？焖俚谋４婧妥x取處理

數(shù)據(jù)有可能丟失

永久性

Tokyo Tyrant、Flare、ROMA等屬于這種類型。和臨時性相反，所謂永久性就是“數(shù)據(jù)不會丟失”的意思。這里的key-value存儲不像memcached那樣在內(nèi)存中保存數(shù)據(jù)，而是把數(shù)據(jù)保存在硬盤上。與memcached在內(nèi)存中處理數(shù)據(jù)比起來，由于必然要發(fā)生對硬盤的IO操作，所以性能上還是有差距的。但數(shù)據(jù)不會丟失是它最大的優(yōu)勢。

在硬盤上保存數(shù)據(jù)

可以進行非?？焖俚谋４婧妥x取處理(但無法與memcached相比)

數(shù)據(jù)不會丟失

兩者兼具

Redis屬于這種類型。Redis有些特殊，臨時性和永久性兼具，且集合了臨時性key-value存儲和永久性key-value存儲的優(yōu)點。Redis首先把數(shù)據(jù)保存到內(nèi)存中，在滿足特定條件(默認是15分鐘一次以上，5分鐘內(nèi)10個以上，1分鐘內(nèi)10000個以上的key發(fā)生變更)的時候?qū)?shù)據(jù)寫入到硬盤中。這樣既確保了內(nèi)存中數(shù)據(jù)的處理速度，又可以通過寫入硬盤來保證數(shù)據(jù)的永久性。這種類型的數(shù)據(jù)庫特別適合于處理數(shù)組類型的數(shù)據(jù)。

同時在內(nèi)存和硬盤上保存數(shù)據(jù)

可以進行非?？焖俚谋４婧妥x取處理

保存在硬盤上的數(shù)據(jù)不會消失(可以恢復(fù))

適合于處理數(shù)組類型的數(shù)據(jù)

面向文檔的數(shù)據(jù)庫

MongoDB、CouchDB屬于這種類型。它們屬于NoSQL數(shù)據(jù)庫，但與key-value存儲相異。

不定義表結(jié)構(gòu)

面向文檔的數(shù)據(jù)庫具有以下特征：即使不定義表結(jié)構(gòu)，也可以像定義了表結(jié)構(gòu)一樣使用。關(guān)系型數(shù)據(jù)庫在變更表結(jié)構(gòu)時比較費事，而且為了保持一致性還需修改程序。然而NoSQL數(shù)據(jù)庫則可省去這些麻煩(通常程序都是正確的)，確實是方便快捷。

可以使用復(fù)雜的查詢條件

跟key-value存儲不同的是，面向文檔的數(shù)據(jù)庫可以通過復(fù)雜的查詢條件來獲取數(shù)據(jù)。雖然不具備事務(wù)處理和JOIN這些關(guān)系型數(shù)據(jù)庫所具有的處理能力，但除此以外的其他處理基本上都能實現(xiàn)。這是非常容易使用的NoSQL數(shù)據(jù)庫。

不需要定義表結(jié)構(gòu)

可以利用復(fù)雜的查詢條件

面向列的數(shù)據(jù)庫

Cassandra、Hbase、HyperTable屬于這種類型。由于近年來數(shù)據(jù)量出現(xiàn)爆發(fā)性增長，這種類型的NoSQL數(shù)據(jù)庫尤其引人注目。

面向行的數(shù)據(jù)庫和面向列的數(shù)據(jù)庫

普通的關(guān)系型數(shù)據(jù)庫都是以行為單位來存儲數(shù)據(jù)的，擅長進行以行為單位的讀入處理，比如特定條件數(shù)據(jù)的獲取。因此，關(guān)系型數(shù)據(jù)庫也被稱為面向行的數(shù)據(jù)庫。相反，面向列的數(shù)據(jù)庫是以列為單位來存儲數(shù)據(jù)的，擅長以列為單位讀入數(shù)據(jù)。

高擴展性

面向列的數(shù)據(jù)庫具有高擴展性，即使數(shù)據(jù)增加也不會降低相應(yīng)的處理速度(特別是寫入速度)，所以它主要應(yīng)用于需要處理大量數(shù)據(jù)的情況。另外，利用面向列的數(shù)據(jù)庫的優(yōu)勢，把它作為批處理程序的存儲器來對大量數(shù)據(jù)進行更新也是非常有用的。但由于面向列的數(shù)據(jù)庫跟現(xiàn)行數(shù)據(jù)庫存儲的思維方式有很大不同，應(yīng)用起來十分困難。

高擴展性(特別是寫入處理)

應(yīng)用十分困難

最近，像Twitter和Facebook這樣需要對大量數(shù)據(jù)進行更新和查詢的網(wǎng)絡(luò)服務(wù)不斷增加，面向列的數(shù)據(jù)庫的優(yōu)勢對其中一些服務(wù)是非常有用的，但是由于這與本書所要介紹的內(nèi)容關(guān)系不大，就不進行詳細介紹了。

總結(jié)：

NoSQL并不是No-SQL，而是指Not Only SQL。

NoSQL的出現(xiàn)是為了彌補SQL數(shù)據(jù)庫因為事務(wù)等機制帶來的對海量數(shù)據(jù)、高并發(fā)請求的處理的性能上的欠缺。

NoSQL不是為了替代SQL而出現(xiàn)的，它是一種替補方案，而不是解決方案的首選。

絕大多數(shù)的NoSQL產(chǎn)品都是基于大內(nèi)存和高性能隨機讀寫的（比如具有更高性能的固態(tài)硬盤陣列），一般的小型企業(yè)在選擇NoSQL時一定要慎重！不要為了NoSQL而NoSQL，可能會導致花了冤枉錢又耽擱了項目進程。

NoSQL不是萬能的，但在大型項目中，你往往需要它！

以下哪個選項屬于文檔型nosql

nosql四大分類：1、KV鍵值對。

2、文檔型數(shù)據(jù)庫。

3、列存儲數(shù)據(jù)庫。

4、圖關(guān)系數(shù)據(jù)庫。nosql是非關(guān)系型數(shù)據(jù)庫，NoSQL（NotOnlySQL），意思是"不僅僅是SQL"，指的是非關(guān)系型數(shù)據(jù)庫，是對不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)庫管理系統(tǒng)的統(tǒng)稱。

漫談工業(yè)大數(shù)據(jù)9：開源工業(yè)大數(shù)據(jù)軟件簡介（上）

今天真是一個美好的時代，有無數(shù)的開源系統(tǒng)可以為我們提供服務(wù)，現(xiàn)在有許多開發(fā)軟件可以用到工業(yè)大數(shù)據(jù)中，當然很多系統(tǒng)還不成熟，應(yīng)用到工業(yè)中還需要小心，并且需要開發(fā)人員對其進行一定的優(yōu)化和調(diào)整。下面就簡單介紹一些開源的大數(shù)據(jù)工具軟件，看看有哪些能夠應(yīng)用到工業(yè)大數(shù)據(jù)領(lǐng)域。

下面這張圖是我根據(jù)網(wǎng)上流傳的一張開源大數(shù)據(jù)軟件分類圖整理的：

我們可以把開源大數(shù)據(jù)軟件分成幾類，有一些可以逐步應(yīng)用到工業(yè)大數(shù)據(jù)領(lǐng)域，下面就一一介紹一下這些軟件。（以下系統(tǒng)介紹大都來源于網(wǎng)絡(luò)）

1、數(shù)據(jù)存儲類

（1）關(guān)系數(shù)據(jù)庫MySQL

這個就不用太多介紹了吧，關(guān)系型數(shù)據(jù)庫領(lǐng)域應(yīng)用最廣泛的開源軟件，目前屬于 Oracle 旗下產(chǎn)品。

（2）文件數(shù)據(jù)庫Hadoop

Hadoop是大數(shù)據(jù)時代的明星產(chǎn)品，它最大的成就在于實現(xiàn)了一個分布式文件系統(tǒng)（Hadoop Distributed FileSystem），簡稱HDFS。HDFS有高容錯性的特點，并且設(shè)計用來部署在低廉的硬件上，而且它提供高吞吐量來訪問應(yīng)用程序的數(shù)據(jù)，適合那些有著超大數(shù)據(jù)集的應(yīng)用程序。

Hadoop可以在工業(yè)大數(shù)據(jù)應(yīng)用中用來作為底層的基礎(chǔ)數(shù)據(jù)庫，由于它采用了分布式部署的方式，如果是私有云部署，適用于大型企業(yè)集團。如果是公有云的話，可以用來存儲文檔、視頻、圖像等資料。

（3）列數(shù)據(jù)庫Hbase

HBase是一個分布式的、面向列的開源數(shù)據(jù)庫，HBase是Apache的Hadoop項目的子項目。HBase不同于一般的關(guān)系數(shù)據(jù)庫，它是一個適合于非結(jié)構(gòu)化數(shù)據(jù)存儲的數(shù)據(jù)庫。另一個不同的是HBase基于列的而不是基于行的模式。

基于Hbase開發(fā)的OpenTSDB，可以存儲所有的時序（無須采樣）來構(gòu)建一個分布式、可伸縮的時間序列數(shù)據(jù)庫。它支持秒級數(shù)據(jù)采集所有metrics，支持永久存儲，可以做容量規(guī)劃，并很容易的接入到現(xiàn)有的報警系統(tǒng)里。

這樣的話，它就可以替代在工業(yè)領(lǐng)域用得最多的實時數(shù)據(jù)庫。

（4）文檔數(shù)據(jù)庫MongoDB

MongoDB是一個介于關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫之間的產(chǎn)品，是非關(guān)系數(shù)據(jù)庫當中功能最豐富，最像關(guān)系數(shù)據(jù)庫的。他支持的數(shù)據(jù)結(jié)構(gòu)非常松散，是類似json的bson格式，因此可以存儲比較復(fù)雜的數(shù)據(jù)類型。Mongo最大的特點是他支持的查詢語言非常強大，其語法有點類似于面向?qū)ο蟮牟樵冋Z言，幾乎可以實現(xiàn)類似關(guān)系數(shù)據(jù)庫單表查詢的絕大部分功能，而且還支持對數(shù)據(jù)建立索引。

MongoDB適合于存儲工業(yè)大數(shù)據(jù)中的各類文檔，包括各類圖紙、文檔等。

（5）圖數(shù)據(jù)庫Neo4j/OrientDB

圖數(shù)據(jù)庫不是存放圖片的，是基于圖的形式構(gòu)建的數(shù)據(jù)系統(tǒng)。

Neo4j是一個高性能的,NOSQL圖形數(shù)據(jù)庫，它將結(jié)構(gòu)化數(shù)據(jù)存儲在網(wǎng)絡(luò)上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全的事務(wù)特性的Java持久化引擎，但是它將結(jié)構(gòu)化數(shù)據(jù)存儲在網(wǎng)絡(luò)(從數(shù)學角度叫做圖)上而不是表中。Neo4j也可以被看作是一個高性能的圖引擎，該引擎具有成熟數(shù)據(jù)庫的所有特性。程序員工作在一個面向?qū)ο蟮?、靈活的網(wǎng)絡(luò)結(jié)構(gòu)下而不是嚴格、靜態(tài)的表中——但是他們可以享受到具備完全的事務(wù)特性、企業(yè)級的數(shù)據(jù)庫的所有好處。

OrientDB是兼具文檔數(shù)據(jù)庫的靈活性和圖形數(shù)據(jù)庫管理鏈接能力的可深層次擴展的文檔-圖形數(shù)據(jù)庫管理系統(tǒng)?？蛇x無模式、全模式或混合模式下。支持許多高級特性，諸如ACID事務(wù)、快速索引，原生和SQL查詢功能。可以JSON格式導入、導出文檔。若不執(zhí)行昂貴的JOIN操作的話，如同關(guān)系數(shù)據(jù)庫可在幾毫秒內(nèi)可檢索數(shù)以百記的鏈接文檔圖。

這些數(shù)據(jù)庫都可以用來存儲非結(jié)構(gòu)化數(shù)據(jù)。

2、數(shù)據(jù)分析類

（1）批處理MapReduce/Spark

MapReduce是一種編程模型，用于大規(guī)模數(shù)據(jù)集（大于1TB）的并行運算。概念"Map（映射）"和"Reduce（歸約）"，是它們的主要思想，都是從函數(shù)式編程語言里借來的，還有從矢量編程語言里借來的特性。它極大地方便了編程人員在不會分布式并行編程的情況下，將自己的程序運行在分布式系統(tǒng)上。當前的軟件實現(xiàn)是指定一個Map（映射）函數(shù)，用來把一組鍵值對映射成一組新的鍵值對，指定并發(fā)的Reduce（歸約）函數(shù)，用來保證所有映射的鍵值對中的每一個共享相同的鍵組。

Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎。Spark 是一種與 Hadoop 相似的開源集群計算環(huán)境，但是兩者之間還存在一些不同之處，這些有用的不同之處使 Spark 在某些工作負載方面表現(xiàn)得更加優(yōu)越，換句話說，Spark 啟用了內(nèi)存分布數(shù)據(jù)集，除了能夠提供交互式查詢外，它還可以優(yōu)化迭代工作負載。盡管創(chuàng)建 Spark 是為了支持分布式數(shù)據(jù)集上的迭代作業(yè)，但是實際上它是對 Hadoop 的補充，可以在 Hadoop 文件系統(tǒng)中并行運行。

這些大數(shù)據(jù)的明星產(chǎn)品可以用來做工業(yè)大數(shù)據(jù)的處理。

（2）流處理Storm

Storm是一個開源的分布式實時計算系統(tǒng)，可以簡單、可靠的處理大量的數(shù)據(jù)流。Storm有很多使用場景：如實時分析，在線機器學習，持續(xù)計算，分布式RPC，ETL等等。Storm支持水平擴展，具有高容錯性，保證每個消息都會得到處理，而且處理速度很快（在一個小集群中，每個結(jié)點每秒可以處理數(shù)以百萬計的消息）。Storm的部署和運維都很便捷，而且更為重要的是可以使用任意編程語言來開發(fā)應(yīng)用。

（3）圖處理Giraph

Giraph是什么？Giraph是Apache基金會開源項目之一，被定義為迭代式圖處理系統(tǒng)。他架構(gòu)在Hadoop之上，提供了圖處理接口，專門處理大數(shù)據(jù)的圖問題。

Giraph的存在很有必要，現(xiàn)在的大數(shù)據(jù)的圖問題又很多，例如表達人與人之間的關(guān)系的有社交網(wǎng)絡(luò)，搜索引擎需要經(jīng)常計算網(wǎng)頁與網(wǎng)頁之間的關(guān)系，而map-reduce接口不太適合實現(xiàn)圖算法。

Giraph主要用于分析用戶或者內(nèi)容之間的聯(lián)系或重要性。

（4）并行計算MPI/OpenCL

OpenCL（全稱Open Computing Language，開放運算語言）是第一個面向異構(gòu)系統(tǒng) 通用目的并行編程的開放式、免費標準，也是一個統(tǒng)一的編程環(huán)境，便于軟件開發(fā)人員為高性能計算服務(wù)器、桌面計算系統(tǒng)、手持設(shè)備編寫高效輕便的代碼，而且廣泛適用于多核心處理器(CPU)、圖形處理器(GPU)、Cell類型架構(gòu)以及數(shù)字信號處理器(DSP)等其他并行處理器，在游戲、娛樂、科研、醫(yī)療等各種領(lǐng)域都有廣闊的發(fā)展前景。

（5）分析框架Hive

Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具，可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表，并提供簡單的sql查詢功能，可以將sql語句轉(zhuǎn)換為MapReduce任務(wù)進行運行。其優(yōu)點是學習成本低，可以通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計，不必開發(fā)專門的MapReduce應(yīng)用，十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。

（6）分析框架Pig

Apache Pig 是apache平臺下的一個免費開源項目，Pig為大型數(shù)據(jù)集的處理提供了更高層次的抽象，很多時候數(shù)據(jù)的處理需要多個MapReduce過程才能實現(xiàn)，使得數(shù)據(jù)處理過程與該模式匹配可能很困難。有了Pig就能夠使用更豐富的數(shù)據(jù)結(jié)構(gòu)。[2]

Pig LatinPig Latin 是一個相對簡單的語言，一條語句就是一個操作，與數(shù)據(jù)庫的表類似，可以在關(guān)系數(shù)據(jù)庫中找到它（其中，元組代表行，并且每個元組都由字段組成）。

Pig 擁有大量的數(shù)據(jù)類型，不僅支持包、元組和映射等高級概念，還支持簡單的數(shù)據(jù)類型，如 int、long、float、double、chararray 和 bytearray。并且，還有一套完整的比較運算符，包括使用正則表達式的豐富匹配模式。

nosql能夠用再哪些場景

nosql分類太多了，下面列舉幾個比較常見的：

Redis：非常適合需要表達時間線的web服務(wù)，例如微博

Cassandra：只有順序?qū)?，沒有隨機寫的設(shè)計，滿足高負荷情形的性能需求

MongoDB：面向文檔，擅長處理非結(jié)構(gòu)化數(shù)據(jù)

Neo4J：可以快速實現(xiàn)基于圖的計算（如果用SQL計算可能花更長的時間）

希望對你所有幫助。

什么是nosql非結(jié)構(gòu)化數(shù)據(jù)庫

基本含義NoSQL(NoSQL = Not Only SQL )，意即“不僅僅是SQL”，是一項全新的數(shù)據(jù)庫革命性運動，早期就有人提出，發(fā)展至2009年趨勢越發(fā)高漲。NoSQL的擁護者們提倡運用非關(guān)系型的數(shù)據(jù)存儲，相對于鋪天蓋地的關(guān)系型數(shù)據(jù)庫運用，這一概念無疑是一種全新的思維的注入。NoSQLNoSQL數(shù)據(jù)庫的四大分類鍵值(Key-Value)存儲數(shù)據(jù)庫這一類數(shù)據(jù)庫主要會使用到一個哈希表，這個表中有一個特定的鍵和一個指針指向特定的數(shù)據(jù)。Key/value模型對于IT系統(tǒng)來說的優(yōu)勢在于簡單、易部署。但是如果DBA只對部分值進行查詢或更新的時候，Key/value就顯得效率低下了。[3] 舉例如：Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.列存儲數(shù)據(jù)庫。這部分數(shù)據(jù)庫通常是用來應(yīng)對分布式存儲的海量數(shù)據(jù)。鍵仍然存在，但是它們的特點是指向了多個列。這些列是由列家族來安排的。如：Cassandra, HBase, Riak.文檔型數(shù)據(jù)庫文檔型數(shù)據(jù)庫的靈感是來自于Lotus Notes辦公軟件的，而且它同第一種鍵值存儲相類似。該類型的數(shù)據(jù)模型是版本化的文檔，半結(jié)構(gòu)化的文檔以特定的格式存儲，比如JSON。文檔型數(shù)據(jù)庫可以看作是鍵值數(shù)據(jù)庫的升級版，允許之間嵌套鍵值。而且文檔型數(shù)據(jù)庫比鍵值數(shù)據(jù)庫的查詢效率更高。如：CouchDB, MongoDb. 國內(nèi)也有文檔型數(shù)據(jù)庫SequoiaDB，已經(jīng)開源。圖形(Graph)數(shù)據(jù)庫圖形結(jié)構(gòu)的數(shù)據(jù)庫同其他行列以及剛性結(jié)構(gòu)的SQL數(shù)據(jù)庫不同，它是使用靈活的圖形模型，并且能夠擴展到多個服務(wù)器上。NoSQL數(shù)據(jù)庫沒有標準的查詢語言(SQL)，因此進行數(shù)據(jù)庫查詢需要制定數(shù)據(jù)模型。許多NoSQL數(shù)據(jù)庫都有REST式的數(shù)據(jù)接口或者查詢API。[2] 如：Neo4J, InfoGrid, Infinite Graph.因此，我們總結(jié)NoSQL數(shù)據(jù)庫在以下的這幾種情況下比較適用：1、數(shù)據(jù)模型比較簡單；2、需要靈活性更強的IT系統(tǒng)；3、對數(shù)據(jù)庫性能要求較高；4、不需要高度的數(shù)據(jù)一致性；5、對于給定key，比較容易映射復(fù)雜值的環(huán)境。

MPP 和 NoSQL 有什么區(qū)別? 架構(gòu)上, 應(yīng)用上

MPP是一種進行系統(tǒng)擴展的方式，它由多個SMP服務(wù)器通過一定的節(jié)點互聯(lián)網(wǎng)絡(luò)進行連接，協(xié)同工作，完成相同的任務(wù)，從用戶的角度來看是一個服務(wù)器系統(tǒng)。每一個節(jié)點只能訪問自己本地資源（內(nèi)存，存儲等），是一種完全無共享結(jié)構(gòu)（Share Nothing）結(jié)構(gòu)。

而NoSql=Not Only Sql。泛指的是非關(guān)系型數(shù)據(jù)庫。大概分為四類。Key-Value存儲的數(shù)據(jù)庫，列式存儲數(shù)據(jù)庫（Hbase），文檔型數(shù)據(jù)庫和圖形數(shù)據(jù)庫。

新聞標題：nosql分類圖,nosql介紹
鏈接URL：http://www.rwnh.cn/article8/dsijoip.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供軟件開發(fā)、小程序開發(fā)、網(wǎng)站策劃、關(guān)鍵詞優(yōu)化、電子商務(wù)、網(wǎng)站營銷

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片