2014-07-05 分類: 網(wǎng)站建設(shè)
搜索引擎蜘蛛抓取份額是什么?抓取份額是由什么決定的?怎樣節(jié)省抓取份額?對(duì)大中型網(wǎng)站來(lái)說(shuō),這是個(gè)頗為重要的seo問(wèn)題,有時(shí)候會(huì)成為網(wǎng)站自然流量的瓶頸,今天創(chuàng)新互聯(lián)就一一為大家介紹一下。
強(qiáng)調(diào)一下,以下這些概念對(duì)百度同樣適用。
顧名思義,抓取份額是搜索引擎蜘蛛花在一個(gè)網(wǎng)站上的抓取頁(yè)面的總的時(shí)間上限。對(duì)于特定網(wǎng)站,搜索引擎蜘蛛花在這個(gè)網(wǎng)站上的總時(shí)間是相對(duì)固定的,不會(huì)無(wú)限制地抓取網(wǎng)站所有頁(yè)面。
抓取份額的英文Google用的是crawl budget,直譯是爬行預(yù)算,我覺得不太能說(shuō)明是什么意思,所以用抓取份額表達(dá)這個(gè)概念。
抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。
抓取需求
抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁(yè)面。
決定抓取需求的主要有兩個(gè)因素。一是頁(yè)面權(quán)重,網(wǎng)站上有多少頁(yè)面達(dá)到了基本頁(yè)面權(quán)重,搜索引擎就想抓取多少頁(yè)面。二是索引庫(kù)里頁(yè)面是否太久沒更新了。說(shuō)到底還是頁(yè)面權(quán)重,權(quán)重高的頁(yè)面就不會(huì)太久不更新。
頁(yè)面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁(yè)面。
抓取速度限制
搜索引擎蜘蛛不會(huì)為了抓取更多頁(yè)面,把人家網(wǎng)站服務(wù)器拖垮,所以對(duì)某個(gè)網(wǎng)站都會(huì)設(shè)定一個(gè)抓取速度的上限,crawl ratelimit,也就是服務(wù)器能承受的上限,在這個(gè)速度限制內(nèi),蜘蛛抓取不會(huì)拖慢服務(wù)器、影響用戶訪問(wèn)。
服務(wù)器反應(yīng)速度夠快,這個(gè)速度限制就上調(diào)一點(diǎn),抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。
所以,抓取速度限制是搜索引擎“能”抓取的頁(yè)面數(shù)。
抓取份額是由什么決定的?
抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時(shí)又“能”抓的頁(yè)面數(shù)。
網(wǎng)站權(quán)重高,頁(yè)面內(nèi)容質(zhì)量高,頁(yè)面夠多,服務(wù)器速度夠快,抓取份額就大。
小網(wǎng)站沒必要擔(dān)心抓取份額
小網(wǎng)站頁(yè)面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個(gè)幾百頁(yè),十幾天怎么也全站抓取一遍了,所以幾千個(gè)頁(yè)面的網(wǎng)站根本不用擔(dān)心抓取份額的事。數(shù)萬(wàn)個(gè)頁(yè)面的網(wǎng)站一般也不是什么大事。每天幾百個(gè)訪問(wèn)要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了。
大中型網(wǎng)站可能需要考慮抓取份額
幾十萬(wàn)頁(yè)以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問(wèn)題。
抓取份額不夠,比如網(wǎng)站有 1千萬(wàn)頁(yè)面,搜索引擎每天只能抓幾萬(wàn)個(gè)頁(yè)面,那么把網(wǎng)站抓一遍可能需要幾個(gè)月,甚至一年,也可能意味著一些重要頁(yè)面沒辦法被抓取,所以也就沒排名,或者重要頁(yè)面不能及時(shí)被更新。
要想網(wǎng)站頁(yè)面被及時(shí)、充分抓取,首先要保證服務(wù)器夠快,頁(yè)面夠小。如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁(yè)面速度直接提高抓取速度限制,因而提高抓取份額。
怎樣節(jié)省抓取份額?
當(dāng)然首先是降低頁(yè)面文件大小,提高服務(wù)器速度,優(yōu)化數(shù)據(jù)庫(kù),降低抓取時(shí)間。
然后,盡量避免上面列出的浪費(fèi)抓取份額的東西。有的是內(nèi)容質(zhì)量問(wèn)題,有的是網(wǎng)站結(jié)構(gòu)問(wèn)題,如果是結(jié)構(gòu)問(wèn)題,最簡(jiǎn)單的辦法是robots文件禁止抓取,但多少會(huì)浪費(fèi)些頁(yè)面權(quán)重,因?yàn)闄?quán)重只進(jìn)不出。
某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權(quán)重流動(dòng)和分配的,精心設(shè)計(jì)的nofollow會(huì)使無(wú)意義頁(yè)面權(quán)重降低,提升重要頁(yè)面權(quán)重。搜索引擎抓取時(shí)會(huì)使用一個(gè)URL抓取列表,里面待抓URL是按頁(yè)面權(quán)重排序的,重要頁(yè)面權(quán)重提升,會(huì)先被抓取,無(wú)意義頁(yè)面權(quán)重可能低到搜索引擎不想抓取。
網(wǎng)站名稱:搜索引擎蜘蛛抓取份額是什么?
分享地址:http://www.rwnh.cn/news/27564.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導(dǎo)航、網(wǎng)頁(yè)設(shè)計(jì)公司、外貿(mào)建站、靜態(tài)網(wǎng)站、品牌網(wǎng)站設(shè)計(jì)、App設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容