2023-06-07 分類: 網站建設
大家應該都知道百度已經全站https并取消referer關鍵詞顯示了,那么“百度蜘蛛referer”又是什么?有什么妙用嗎?藝龍SEO負責人劉明發(fā)現(xiàn)通過百度蜘蛛referer可以快速定位部分站內url的報錯(4xx或者5xx)原因。隨后社區(qū)版主飛鷹正義也對文章做了補充修正,現(xiàn)推薦給各位同學們。
什么是百度蜘蛛的referer百度蜘蛛的referer,是指當百度蜘蛛抓取某一個URL的時候,在HTTP頭中帶的Referer字段。請注意,這個定義和百度近聲明去除Referer中關鍵詞數(shù)據沒有任何關系。這次講的是spider發(fā)起的HTTP請求,百度而去除的是用戶發(fā)起的。如果百度蜘蛛抓取百度首頁的logo,會發(fā)起這樣的請求:
上面Referer字段很明確的表示了他是從www.baidu.com這個頁面上發(fā)現(xiàn)并抓取了www.baidu.com/img/bd_logo1.png。而大家在服務器訪問日志中也應該能看到相應的記錄。目前發(fā)現(xiàn)只有當百度抓取一個網頁的同時,又抓取了網頁中的:img、js和css才會帶上referer字段。這部分額外的抓取量,應該不會占用百度分配的抓取配額,屬于“買1送1”。
對于站長的意義如果你發(fā)現(xiàn)有一批URL(僅限于img,js,css)報錯(4xx或者5xx),但是一直找不到入口在哪,也就是說你不明白百度蜘蛛是從哪里發(fā)現(xiàn)這些錯誤URL的。這個字段可以幫助你迅速定位。
舉個例子比如我們的SEO日志分析系統(tǒng)中可以看到,符合下面這種URL Pattern的路徑每天有6萬到10萬的抓取而且全部報404。
從發(fā)現(xiàn)問題至今過了1個月,查遍整個網站我也沒找到入口。今天偶然仔細查了一下日志,想起了百度蜘蛛的referer,馬上就能定位問題了。這些404的URL來自于一套沒人維護也沒人關注的頁面(往往是這樣)。收錄流量都不錯。由于近公司圖片系統(tǒng)更新,圖片的URL全部更改了,但這套頁面并沒有跟著更新。
如果站點沒有記錄referer怎么辦iis請在這里勾選“cs(Referer)”:
apache請參考:
apache log配置“Combined Log Format”章節(jié)
apache log配置的官方鏈接
Nginx請參考:
nginx log配置
nginx log配置的官方鏈接
結束語· 很多SEO問題并不是立即致命的,所以沒有及時解決。流量就像螞蟻啃大象一樣一點一點啃掉了。
· 系統(tǒng)性的知識積累還是會在關鍵時刻發(fā)揮作用的。
· 感謝飛鷹對本文的修正。
本文名稱:利用百度蜘蛛referer找到報錯頁面入口
鏈接分享:http://www.rwnh.cn/news11/263511.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供定制開發(fā)、網站收錄、標簽優(yōu)化、定制網站、網站營銷、微信公眾號
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內容