内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

DataPipeline的常見問題和解題思路

這篇文章給大家分享的是有關DataPipeline的常見問題和解題思路。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

成都創(chuàng)新互聯(lián)是一家集網站建設,花都企業(yè)網站建設,花都品牌網站建設,網站定制,花都網站建設報價,網絡營銷,網絡優(yōu)化,花都網站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網站。

Q1: DataPipeline支持的讀取方式

A:DataPipeline在成立之初只有一種模式,只支持實時流同步,在我們看來這是未來的一種趨勢。

但在后來發(fā)現(xiàn),很多客戶實際上有批量同步的需求。比如,銀行在每天晚上可能會有一些月結、日結,證券公司也有類似的結算服務?;谝恍v史原因,或出于對性能、數據庫配置的考慮,可能有的數據庫本身不能開change log。所以實際上并不是所有情況下都能從源端獲取實時的流數據。

考慮到上述問題,我們認為一個產品在支撐數據融合過程中,必須能同時支撐批量和流式兩種處理模式,且在產品里面出于性能和穩(wěn)定性考慮提供不同的處理策略,這才是一個相對來說比較合理的基礎架構。

詳情參見:DataPipeline CTO陳肅:構建批流一體數據融合平臺的一致性語義保證

Q2:目標端的連接方式是什么


A:對于關系型數據庫,寫入方式為JDBC,未來版本將通過文件加載的方式提高吞吐率。其它類型的目的地,根據具體類型各不相同。例如FTP目的地用的是FTP Client,Kafka目的地用的是Kafka Producer。

Q3:采集和寫入能否對數據進行加密

A:如果是要對數據內容加密可以使用高級清洗。

Q4:DataPipeline安裝部署模式

A:DataPipeline 產品是采用Docker容器的部署方式,支持Docker集群;支持虛擬環(huán)境(VMW)部署,但不推薦,DataPipeline正在研發(fā)支持非Docker部署。

Q5:DataPipeline是否支持圖形化監(jiān)控

A:DataPipeline支持讀寫速率、數據量、任務進度、錯誤隊列、操作記錄、表結構等圖形化監(jiān)控。

Q6:數據庫日志保留策略多久合適

A:如,MySQL Binlog保留策略,建議保留日志策略>=3天。

Q7: 后續(xù)增量導入數據如何保證一致性

A:DataPipeline默認支持at least once同步機制,保證數據不會在同步過程中丟失。這適合源端有主鍵、目的地有主鍵去重能力的場景,例如關系型數據庫到關系型數據庫的同步。


如果類似Hive這樣沒有主鍵去重能力的目的地,DataPipeline支持開啟任務級別的端到端一致性選項,通過多階段提交協(xié)議來保證數據一致性。

Q8:監(jiān)控報警一般在項目上如何使用

A:DataPipeline的數據任務有監(jiān)控看板和報警兩種方式,報警會發(fā)送到指定的郵箱,根據錯誤類型,可以選擇重啟或通知技術支持,DataPipeline會有工程師協(xié)助客戶排查錯誤。

Q9:是否方便擴容

A:DataPipeline支持動態(tài)擴容,當集群資源緊張時,無需暫停現(xiàn)有任務,增加新節(jié)點后,即可以實現(xiàn)集群的擴容。


Q10:如果一條數據多次、頻繁變化,DataPipeline如何保證數據的并行和順序?

A:DataPipeline源端會將任務按照一定原則拆分為多個互不干擾的子任務進行并行執(zhí)行。例如:在JDBC源讀取場景下,如果任務包括多張表,每個表是由一個獨立線程進行順序讀取的,線程并行度可以在任務屬性中進行設置。


為了保證順序寫入和讀取,默認每個單獨子任務會創(chuàng)建一個獨立的topic,設置一個分區(qū),這樣目標端消費的時候,同一個topic只有一個consumer在進行消費,從而保證消費的順序性。如果可以接受非順序消費,也可以為一個topic創(chuàng)建多個分區(qū),這樣目的端可以更好地利用Kafka的并行能力提高吞吐量。


以上就是DataPipeline的常見問題和解題思路的詳細內容了,看完之后是否有所收獲呢?如果還想學到更多技能或想了解更多相關內容,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊。

網頁標題:DataPipeline的常見問題和解題思路
當前路徑:http://www.rwnh.cn/article42/gjhhec.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供品牌網站設計、網站排名、小程序開發(fā)用戶體驗、自適應網站網站策劃

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網站建設
张家港市| 郯城县| 祥云县| 龙海市| 芷江| 渭南市| 循化| 黑山县| 南丰县| 乌拉特中旗| 家居| 萨嘎县| 江口县| 泉州市| 贵州省| 龙川县| 九江县| 平凉市| 玛纳斯县| 泉州市| 会东县| 龙山县| 云霄县| 吉林省| 莆田市| 福州市| 华宁县| 县级市| 黎平县| 哈密市| 临漳县| 滁州市| 石嘴山市| 峨边| 梁河县| 石家庄市| 汉沽区| 鄂托克旗| 临安市| 建宁县| 宜兰市|