我們一切通訊和互聯(lián)網(wǎng)應用都建立在通訊網(wǎng)絡上。所以三大運營商-電信,移動,聯(lián)通能夠接觸到全部中國互聯(lián)網(wǎng)的流量數(shù)據(jù),這話不假。
我們先從技術上看看運營商的數(shù)據(jù)是如何獲取的,都有哪些類型。
前面說過,所有互聯(lián)網(wǎng)應用數(shù)據(jù)都要經(jīng)過通訊設備傳輸。有線和無線的數(shù)據(jù)終端產(chǎn)生的數(shù)據(jù),最終匯集到有線骨干網(wǎng)絡,再通過路由器向相應目的地分發(fā)。固網(wǎng)流量數(shù)據(jù)有2種獲得方式:
1.直接分光,可以得到99.99%的流量數(shù)據(jù);
2.端口鏡像,主要是80,8080這兩個http協(xié)議常用端口。移動流量數(shù)據(jù)獲取要復雜一些,涉及不同運營商蜂窩網(wǎng)絡標準,主要對接GPRS,CDMA,LTE網(wǎng)絡端口來獲取。
運營商都有自己的數(shù)據(jù)平臺,數(shù)據(jù)處理主要采用DPI-Deep Package Inspection 深度數(shù)據(jù)報文解析技術-所謂“深度”是和普通的報文解析層次比較而言的,“普通報文檢測”僅分析IP包的4層以下的內(nèi)容,包括源地址、目的地址、源端口、目的端口以及協(xié)議類型,而DPI 除了對前面的層次分析外,還增加了應用層分析,識別各種應用及其內(nèi)容。對應用層的識別依賴于對市場活躍流量對應的業(yè)務和供應廠商的持續(xù)跟蹤和更新。
另外一個數(shù)據(jù)采集方式是通過日志溯源系統(tǒng),日志溯源系統(tǒng)3大運營商有自己的格式,數(shù)據(jù)和日志的join工作也已經(jīng)完成,一般采用流日志的格式,以文件形式保存,不能夠做到實時。
運營商數(shù)據(jù)平臺主要采集的是用戶上行流量-即用戶向網(wǎng)絡主動發(fā)送請求的數(shù)據(jù)。此外移動網(wǎng)絡中還有基站信令數(shù)據(jù),用于維護用戶設備與網(wǎng)絡鏈路的鏈接,不受用戶控制,隨時隨地的發(fā)生。這部分數(shù)據(jù)也有很大商業(yè)價值,比如LBS信息,但因為數(shù)據(jù)歸屬部門不同,一般不納入運營商的數(shù)據(jù)采集體系。
運營商數(shù)據(jù)解析有很多技術障礙需要克服,比如NAT問題,在IPv4向IPv6過渡過程中,為提高IP地址復用率造成的用戶識別困難數(shù)據(jù)分片造成的數(shù)據(jù)完整性問題;還有數(shù)據(jù)緩存清洗問題,https加密問題等等。
因此,在了解了運營商數(shù)據(jù)產(chǎn)生傳輸機制后,運營商為大數(shù)據(jù)應用而建立的數(shù)據(jù)平臺,并沒有外界看起來的那么順手和輕松。
打個比方,運營商視角網(wǎng)絡上的數(shù)據(jù)好比由無數(shù)條不同材質(zhì),形狀,顏色的珠子串成的項鏈,被拆散混在一起,還夾雜著各種連接件一股腦的丟進管道網(wǎng)絡里,奔向不同的目的地。你觀察管道川流不息的珠子流,想重新還原出一個完整項鏈的樣子...
談何容易。
下面我們談談運營商數(shù)據(jù)適合的應用場景。
對于單個用戶而言,他至少是依賴某一個運營商來進行網(wǎng)絡通信,因此如果以國家安全的名義,技術上是可以追溯這個用戶的全部網(wǎng)絡行為數(shù)據(jù)的(日志回溯系統(tǒng)為此而建立),從而對用戶進行精準畫像。
但是針對某一個市場,省份的用戶群,畢竟我們有3個運營商,沒有哪一個運營商擁有全部數(shù)據(jù)。不過每一個運營商的數(shù)據(jù)在市場上是垂直分布的,體量也足夠大,因此樣本覆蓋是很全的,所以很適合做統(tǒng)計分析和洞察。整個市場好比是一塊大蛋糕,每個運營商都自上而下的切了一塊,你看看切面就知道蛋糕的配料組成和分布了。
至于大多廣告主希望的針對個人用戶的重定向,精準營銷,運營商數(shù)據(jù)技術上可以做,但是實際上很難操作。因為數(shù)據(jù)安全敏感性原因。運營商所有數(shù)據(jù)都有一個宗旨:“不出網(wǎng)”,這個不出網(wǎng)的概念是不能對接到運營商機房以外的任何系統(tǒng)里。運營商不敢為了數(shù)據(jù)應用這點芝麻利益,觸碰用戶隱私法律邊界。
綜上所述,運營商數(shù)據(jù)適合做金融征信,但需要脫敏處理;適合統(tǒng)計分析和市場洞察。
運營商的數(shù)據(jù)一直被營銷業(yè)界視為無可替代的寶貴資源,千方百計想要合作應用。
但大家往往忽略的是:數(shù)據(jù)不是電信運營商的核心資產(chǎn),數(shù)據(jù)應用也不是他們的核心業(yè)務,與收入來源。
運營商網(wǎng)絡關注點在于大覆蓋,高速率,和低延時。吸引更多的入網(wǎng)用戶賺取服務費是他們的業(yè)務核心。
我國的運營商是國營企業(yè),面臨直接的政府監(jiān)管。雖然在大數(shù)據(jù)時代,運營商也變相推出一些數(shù)據(jù)產(chǎn)品,但都非常謹慎,經(jīng)濟上不會為了數(shù)據(jù)里的芝麻,丟了數(shù)百億的運營收入的大西瓜。所以,運營商的數(shù)據(jù)應用,面臨很多業(yè)務上的限制,也面臨很多技術上的壁壘,這一點往往是外部沒有想到的。
希望這一小段文字,能夠幫助大家更好的理解運營商數(shù)據(jù)問題。
網(wǎng)站標題:運營商數(shù)據(jù)是如何獲取的,有哪些合適的應用場景?
鏈接分享:http://www.rwnh.cn/news3/191853.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供Google、網(wǎng)站設計公司、網(wǎng)站導航、微信公眾號、品牌網(wǎng)站制作、軟件開發(fā)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)