2022-12-05 分類: 網(wǎng)站建設(shè)
“谷歌中文網(wǎng)站管理員博客”剛剛發(fā)表了一篇新文章,國(guó)平SEO介紹了一下《google 網(wǎng)站管理員工具》中推出的新功能 -“網(wǎng)站性能”。這個(gè)工具是通過(guò)google工具欄記錄了用戶訪問(wèn)你網(wǎng)站的速度,并給出了很多加快你網(wǎng)站速度的建議。
http://www.googlechinawebmaster.com/2009/12/blog-post_30.html
而最近也傳聞google將會(huì)把網(wǎng)頁(yè)加載速度作為影響排名的一個(gè)因素。那么網(wǎng)頁(yè)打開速度是不是能影響SEO效果?如果能影響,那是怎么影響的呢?
在揭示其中的道理之前,我希望大家能把上面那些傳聞或“網(wǎng)站性能”的功能都忘掉。讓我們追本溯源,來(lái)看看網(wǎng)頁(yè)打開速度和SEO流量之間的關(guān)系。
做SEO有時(shí)候不需要聽從別人給你的信息和意見,你只要專注于研究搜索引擎,同樣也能成功的。這種關(guān)系的發(fā)現(xiàn),也得益于早期我非常重視數(shù)據(jù)分析,所以我在《怎么樣去學(xué)SEO(二)》中把數(shù)據(jù)分析能力列為SEOer應(yīng)該具備的四大能力之一。由于有很多數(shù)據(jù)做支撐,現(xiàn)在我來(lái)給大家分析其中的聯(lián)系,大家就容易看懂很多。
到了后期,連google也認(rèn)識(shí)到了網(wǎng)頁(yè)速度和SEO流量之間的關(guān)系,所以在這個(gè)“網(wǎng)站性能”以前就推出過(guò)相關(guān)的工具來(lái)幫助網(wǎng)站管理員。
要說(shuō)明這種關(guān)系,就要從搜索引擎爬蟲說(shuō)起。不知道大家對(duì)于搜索引擎爬蟲在一個(gè)網(wǎng)站上的行為有沒有概念,我現(xiàn)在發(fā)一下某個(gè)網(wǎng)站(不是alibaba)的一些數(shù)據(jù)出來(lái),大家就能意識(shí)到一些爬蟲的特性了。下面是從服務(wù)器LOG日志中分析出的數(shù)據(jù)。
圖1:爬蟲訪問(wèn)次數(shù)
圖2:爬蟲停留時(shí)間
從上面圖1中可以看到google訪問(wèn)這個(gè)網(wǎng)站206次,這206次里面是由很多個(gè)不同的爬蟲訪問(wèn)的。圖2顯示:有的爬蟲一天之內(nèi)來(lái)了8次,一共停留了2小時(shí)左右,有的爬蟲來(lái)了1次,停留了20多個(gè)小時(shí)以上。所以這個(gè)網(wǎng)站是被很多個(gè)爬蟲在不間斷的訪問(wèn)的。為了計(jì)算方便,可以把google所有的爬蟲停留在這個(gè)網(wǎng)站的總時(shí)間加起來(lái)。雖然一天只有24個(gè)小時(shí)的,但是google的爬蟲這一天花在這個(gè)網(wǎng)站上的時(shí)間可能是成百上千多個(gè)小時(shí)。這里真實(shí)的數(shù)據(jù)是:在這個(gè)網(wǎng)站中,google所有爬蟲那天在這個(gè)網(wǎng)站上花費(fèi)的實(shí)際總時(shí)間是721個(gè)小時(shí)。
而服務(wù)器LOG日志里同樣可以分析出爬蟲在一個(gè)網(wǎng)頁(yè)上的停留時(shí)間。如:
圖3:爬蟲停留時(shí)間
得到了這兩個(gè)數(shù)據(jù)以后,用所有爬蟲總的停留時(shí)間除以單個(gè)頁(yè)面的停留時(shí)間,就是搜索引擎爬蟲這天所抓取的頁(yè)面總量。
721 小時(shí)× 3600 秒 ÷ 35 秒 = 74160 頁(yè)
那么得到這個(gè)搜索引擎爬蟲這天所抓取的頁(yè)面總量有什么用呢?
對(duì)于一般的小網(wǎng)站來(lái)說(shuō),一天能被抓取 74160頁(yè)是一個(gè)很不錯(cuò)數(shù)據(jù)。但是我上面給出的是一個(gè)中型網(wǎng)站,它整個(gè)網(wǎng)站的頁(yè)面總量有800多萬(wàn)有SEO價(jià)值的頁(yè)面。那么,在最理想的情況下,這些頁(yè)面被搜索引擎抓取完要花費(fèi)的時(shí)間為:
800萬(wàn) ÷ 74160 頁(yè) = 108 天
這是理論上最理想的情況,實(shí)際上真實(shí)的情況為:
由于有多個(gè)爬蟲在抓取網(wǎng)站,有很多的頁(yè)面在一天之內(nèi)是會(huì)被爬蟲重復(fù)抓取的。有的頁(yè)面一天之內(nèi)被抓取20多次,有的頁(yè)面一天之內(nèi)只被抓取1次。通過(guò) “停留總時(shí)間 ÷ 單個(gè)頁(yè)面停留時(shí)間” 得到的頁(yè)面數(shù)量,是沒有去除那些重復(fù)抓取的頁(yè)面的。所以搜索引擎一天之內(nèi)實(shí)際抓取的不重復(fù)頁(yè)面沒有74160頁(yè)那么多,而是40000頁(yè)的樣子。還有一點(diǎn),爬蟲今天抓取的頁(yè)面,到了明天還有很多會(huì)被重復(fù)抓取。所以爬蟲不光在同一天內(nèi)會(huì)重復(fù)抓取很多頁(yè)面,而且到了下一天還是會(huì)重復(fù)抓取前一天抓取過(guò)的很多頁(yè)面。
這樣下來(lái),爬蟲平均每天抓取不重復(fù)的頁(yè)面數(shù)量就只有10000頁(yè)的樣子了。那么,要爬蟲把這個(gè)網(wǎng)站所有的頁(yè)面抓取完需要的時(shí)間為:
800萬(wàn) ÷ 1萬(wàn)頁(yè) = 800天
其實(shí),這個(gè)800天抓取完整個(gè)網(wǎng)站還是太理想化了。實(shí)際的情況是很多網(wǎng)站由于結(jié)構(gòu)的原因,有些網(wǎng)頁(yè)創(chuàng)建后4-5年,都還沒被爬蟲抓取過(guò)。
上面的這個(gè)分析過(guò)程,都沒用到什么驚天動(dòng)地的計(jì)算方法。只要你有一點(diǎn)數(shù)據(jù)分析的意識(shí),就能看清楚事實(shí)的。當(dāng)一個(gè)網(wǎng)站收錄量不理想,大家就應(yīng)該去看看那些頁(yè)面是不是被搜索引擎爬蟲瀏覽過(guò)。如果一個(gè)頁(yè)面都沒有被搜索引擎爬蟲瀏覽過(guò),是不可能會(huì)被收錄的。一個(gè)網(wǎng)站的收錄量沒有上去,那SEO流量的提升就會(huì)有很大的一個(gè)瓶頸。
根據(jù)我們剛才上面的那個(gè)分析過(guò)程,要提升網(wǎng)站的收錄量,首先要解決的就是搜索引擎每天抓取網(wǎng)站的抓取量。而:
抓取量 = 爬蟲總的停留時(shí)間 ÷ 單個(gè)頁(yè)面的停留時(shí)間
一個(gè)網(wǎng)站,爬蟲總的停留時(shí)間在某個(gè)期間是保持相對(duì)固定的。當(dāng)然,有方法提高爬蟲總的停留時(shí)間,不過(guò)這不是這篇文章要講的內(nèi)容。我們先通過(guò)減少個(gè)頁(yè)面的停留時(shí)間也可以增加爬蟲的抓取量。
減少爬蟲單個(gè)頁(yè)面的停留時(shí)間,可以簡(jiǎn)單的認(rèn)為提高網(wǎng)頁(yè)加載速度就可以了,雖然實(shí)際上這兩個(gè)因素之間還存在著一個(gè)對(duì)應(yīng)關(guān)系,但是這里先不講。這個(gè)時(shí)候,網(wǎng)頁(yè)的加載速度就和抓取量之間有了一個(gè)正比的關(guān)系,網(wǎng)頁(yè)加載速度越快,爬蟲整個(gè)的抓取量就越大。抓取量越大,有效收錄量就會(huì)增加,從而促使SEO流量增加,因?yàn)榻o一個(gè)大中型網(wǎng)站帶來(lái)流量的,90%以上都是長(zhǎng)尾詞。大中型網(wǎng)站,有時(shí)甚至是小網(wǎng)站,只要收錄量增加一定的百分比,SEO流量也會(huì)增加一定的百分比。網(wǎng)頁(yè)的加載速度,就和SEO流量之間建立了一個(gè)這樣的關(guān)系。
其實(shí),google也知道網(wǎng)頁(yè)速度和SEO流量之間的關(guān)系,所以早在“網(wǎng)站性能”這個(gè)功能推出以前,就推出了另一個(gè)功能讓大家去用,那個(gè)功能就是“google 網(wǎng)站管理員工具”里的“抓取統(tǒng)計(jì)信息”。那里把爬蟲對(duì)你網(wǎng)站的抓取量,和你網(wǎng)頁(yè)下載的平均時(shí)間都列了出來(lái)。
如果大家平常注意觀察這里面的數(shù)據(jù)就會(huì)發(fā)現(xiàn)這樣的規(guī)律:一旦網(wǎng)站下載時(shí)間減少了,那抓取量就會(huì)增大一點(diǎn)。
一般小網(wǎng)站,這樣的規(guī)律還不是太明顯。因?yàn)橛衅渌绊戇@個(gè)規(guī)律的因素存在,而且小網(wǎng)站頁(yè)面數(shù)太少了,爬蟲隨便多增加幾百頁(yè)的抓取量就影響了50%以上的抓取量。但是在大中型網(wǎng)站,這個(gè)規(guī)律是非常明顯的。如:
抓取統(tǒng)計(jì)信息
當(dāng)這個(gè)網(wǎng)站加快了網(wǎng)頁(yè)加載速度,爬蟲的抓取量就穩(wěn)步增加了。這個(gè)圖表能很有利的證明上面提到的理論。
這個(gè)圖表也再次證明了我在《google 的良苦用心:網(wǎng)站管理員工具》里說(shuō)的:“google網(wǎng)站管理員工具里的每個(gè)功能都是和SEO相關(guān)的”。
關(guān)于網(wǎng)頁(yè)速度和排名,google否認(rèn)曾經(jīng)將網(wǎng)頁(yè)速度列為提高排名的因素。而 Matt Cutts 最近也說(shuō):In a nutshell – while slow page load times won’t negatively impact your rankings, fast load times may have a positive effect. 有人把它翻譯成:網(wǎng)頁(yè)加載速度慢,不會(huì)影響Google排名,但是網(wǎng)頁(yè)加載快卻對(duì)排名有積極作用。 其實(shí)這樣翻譯是沒有理解這句話,Matt Cutts的意思是:網(wǎng)頁(yè)加載速度慢,不會(huì)影響Google排名,但是網(wǎng)頁(yè)加載快卻有積極作用。拿掉以前那個(gè)翻譯中的“對(duì)排名”三個(gè)字即可。至于其中的原因,我想通過(guò)這篇文章大家都理解了吧。
這也是為什么我要在《內(nèi)部鏈接還是外部鏈接》里強(qiáng)調(diào)一下的:有時(shí)候是因?yàn)?ldquo;你沒有掌握到他們那么多信息,所以你無(wú)法理解他們的話。也不會(huì)推測(cè)出他們的潛臺(tái)詞以及他們沒有說(shuō)全的話而已。” 我其實(shí)很少關(guān)注Matt Cutts說(shuō)什么,但是我看到那篇翻譯的文章,就斷定Matt Cutts不會(huì)那么說(shuō)。
本文標(biāo)題:SEM一家之言:網(wǎng)頁(yè)加載速度是如何影響SEO效果的?
網(wǎng)站路徑:http://www.rwnh.cn/news48/219698.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App設(shè)計(jì)、響應(yīng)式網(wǎng)站、做網(wǎng)站、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站排名、網(wǎng)頁(yè)設(shè)計(jì)公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容