2021-09-02 分類: 網(wǎng)站建設(shè)
網(wǎng)站優(yōu)化過程中收錄一直是一個(gè)不管是菜鳥還是老鳥都非常揪心的問題,收錄盡管與網(wǎng)站排名沒有直接關(guān)系,但是排名與收錄的的關(guān)系總所周知,隨著百度算法的不斷更新,百度對于收錄的準(zhǔn)則也越來越高,如何做好收錄成了不管是站長還是企業(yè)都非常關(guān)心的一個(gè)問題,接下來就來談?wù)劸W(wǎng)站為什么不收錄的問題。
一、是否知道這個(gè)頁面的存在
對頁面進(jìn)行收錄當(dāng)然首先就必須要知道有這個(gè)頁面,蜘蛛都不知道這個(gè)頁面,談何收錄這一點(diǎn)主要分為2大類:搜索引擎找不到網(wǎng)頁入口和不讓搜索引擎抓取。
1.搜索引擎找不到網(wǎng)頁入口
很多時(shí)候不是你更新了文章搜索引擎就要來抓取收錄的,要怎么讓蜘蛛知道你的更新呢除了有規(guī)律的更新,可以向百度站長平臺主動(dòng)提交URL或者是提交站點(diǎn)地圖,也可以讓搜索引擎被動(dòng)收集,這就是通過外鏈讓蜘蛛知道你的網(wǎng)頁,還有很多時(shí)候蜘蛛來到了你的網(wǎng)站,卻找不到你更新的鏈接,因?yàn)榫W(wǎng)站的鏈接結(jié)構(gòu)做得太復(fù)雜或是內(nèi)鏈結(jié)構(gòu)差,以致搜索引擎在抓取時(shí)間類不會(huì)爬到網(wǎng)站深處的頁面,這也造成蜘蛛不知道該頁面的存在。所以不管怎么樣,第一步我們要保證頁面能被蜘蛛看到,關(guān)于這一點(diǎn)可以通過查看網(wǎng)站日志來判斷蜘蛛是否來訪過。
2.不讓搜索引擎抓取
很多網(wǎng)站有意無意的直接在robots文件屏蔽了百度或網(wǎng)站部分頁面,卻整天在找原因?yàn)槭裁粗┲氩粊碜ト∥业捻撁?,這能怪百度嗎你都不讓別人進(jìn)門了,百度是怎么收錄你的網(wǎng)頁所以有必要時(shí)常去檢查一下網(wǎng)站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛發(fā)現(xiàn)了這個(gè)頁面,也有權(quán)利抓取這個(gè)頁面了,那能否正常抓取就是一個(gè)很大的問題,我們都知道蜘蛛抓取這個(gè)頁面要從域名到DNS服務(wù)器再到網(wǎng)站空間,所以其中任何一個(gè)環(huán)節(jié)出現(xiàn)問題,蜘蛛都不能正常的抓取,首先域名需要備案,然后域名解析要正常,如果解析出現(xiàn)問題,域名是不能訪問網(wǎng)站ip地址的,這個(gè)時(shí)候網(wǎng)站打不開,蜘蛛抓取不了頁面。在有就是經(jīng)常提到的空間服務(wù)器了,服務(wù)器長期打不開那肯定是抓取不了的,這個(gè)大家都知道。并且如果服務(wù)器比較卡或者不穩(wěn)定,就會(huì)影響蜘蛛的抓取,蜘蛛不能很好的去抓取頁面或由于加載慢只抓取到網(wǎng)頁一半,這就很大程度上影響了網(wǎng)站的收錄。
三,具體可以看《草根站長做SEO,如何選擇域名和空間》很多人覺得蜘蛛抓取就代表著收錄,其實(shí)這是錯(cuò)誤的,蜘蛛訪問網(wǎng)站抓取頁面并不代表就要收錄你的網(wǎng)頁,頁面被抓取后要進(jìn)行對比篩選,符合要求的才會(huì)被收錄,為什么有的頁面會(huì)被收錄后又被吐出來就是因?yàn)橹┲朐诓煌5倪^濾,這個(gè)我們先不談。既然是符合要求才會(huì)收錄,那收錄標(biāo)準(zhǔn)到底是什么呢
1.行業(yè)不同標(biāo)準(zhǔn)也不同
這個(gè)是顯而易見的,新聞?lì)惥W(wǎng)站肯定比一般企業(yè)站容易收錄,而對于醫(yī)療、bocai、成人用品等網(wǎng)站,標(biāo)準(zhǔn)肯定是更加嚴(yán)格,所以對于不同的行業(yè),百度給予的收錄標(biāo)準(zhǔn)也是不一樣的。
2.不同的網(wǎng)站標(biāo)準(zhǔn)不同
百度有一個(gè)優(yōu)先抓取的原則,對于絕大多數(shù)用戶喜歡,權(quán)重高的網(wǎng)站收錄得要快,就像新浪網(wǎng)、騰訊網(wǎng)收錄得肯定要比一般網(wǎng)站要快,為什么因?yàn)樾湃?,這類網(wǎng)站本身就有其嚴(yán)格的過濾系統(tǒng),在此類網(wǎng)站公布的內(nèi)容百度基本是直接抓了就收,搜索引擎是互聯(lián)網(wǎng)與用戶的橋梁,它的目的就是給用戶提供有價(jià)值的內(nèi)容,你能為它提供良好的內(nèi)容,它當(dāng)然也會(huì)對你更好,這是互利的。所以搜索引擎不是做慈善,你的網(wǎng)站能給它什么
3.主體收錄標(biāo)準(zhǔn)
百度有一個(gè)收錄標(biāo)準(zhǔn)值,對頁面進(jìn)行評分,滿足評分收錄,否則扔掉。這個(gè)在百度網(wǎng)站綜合得分算法一文中已經(jīng)說過了,主要是從頁面基礎(chǔ)、站內(nèi)、站外、用戶四個(gè)方面進(jìn)行評分,感興趣的可以看一看,這里就簡單談一談網(wǎng)站頁面的內(nèi)容,
(1)頁面字?jǐn)?shù)建議是在500-800字,內(nèi)容健康良好,信息豐富;
(2)受眾多:文章要有一定得用戶需求,也即用戶檢索需求的大小;
(3)時(shí)效性:寫最新的東西用戶和搜索引擎都喜歡
(4)稀缺性:稀缺主要是描述頁面在互聯(lián)網(wǎng)中的獨(dú)特性。稀缺不等于無重復(fù),只有對于大量完全無增益的重復(fù)頁面,我們才應(yīng)該認(rèn)為其稀缺度較低。
四、是否有干凈的域名
剛說了百度的收錄標(biāo)準(zhǔn),其實(shí)這一點(diǎn)也屬于一個(gè)特別的標(biāo)準(zhǔn),域名不干凈同樣是影響網(wǎng)站收錄的一個(gè)重要原因,這個(gè)不干凈我們分為2種情況。第一種就是域名在購買之前就有人用過了,不僅使用了而且還是用廢了,這樣的域名背景就是不干凈,這就相當(dāng)于以前如果你去考警察,如果家里是黑幫世家,那肯定是會(huì)影響你的,這和百度的收錄是一個(gè)道理,嚴(yán)重的甚至域名直接作廢。另一種情況是我們經(jīng)常說的降權(quán),網(wǎng)站被降權(quán)這段時(shí)間是百度的一個(gè)審核期,網(wǎng)站的內(nèi)容就算滿足了上面所說的3點(diǎn)也可能收錄慢或者是不收錄,這個(gè)就需要我們堅(jiān)持了。有恒心,能再次獲得百度的信賴就會(huì)收錄正常。
五、是否達(dá)到收錄大限度
等級不同的網(wǎng)站總收錄的大限度不同,日收錄限制也不同。在新浪上更新1萬篇文章可能會(huì)收錄90%,但是如果在你的企業(yè)站更新1w篇文章可能是只會(huì)收錄幾十篇。這就是因?yàn)樾吕说牡燃壉饶愕母?。等級不等于?quán)重,權(quán)重只是等級的一個(gè)部分,等級是網(wǎng)站的重要程度,就像我們一個(gè)網(wǎng)站中不同頁面的重要程度不一樣,而在整個(gè)互聯(lián)網(wǎng)不同網(wǎng)站的重要程度也不一樣。所以中小型網(wǎng)站不要為了有大量的收錄不斷的去大量更新文章,這樣的做法是錯(cuò)誤的。不同的行業(yè)的更新的頻率和數(shù)量是不一樣,娛樂新聞行業(yè)可能需要幾分鐘更新一次,但是小型企業(yè)站可以幾天或者幾周更新一次都沒有關(guān)系。
分享名稱:網(wǎng)站優(yōu)化之百度收錄:為何網(wǎng)站不被收錄
標(biāo)題網(wǎng)址:http://www.rwnh.cn/news/124843.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、網(wǎng)頁設(shè)計(jì)公司、Google、響應(yīng)式網(wǎng)站、網(wǎng)站營銷、網(wǎng)站維護(hù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容