2015-07-17 分類: 網站建設
「robots」robots合同書是正確對待蜘蛛爬取網址地質圖,robots合同書是指搜索引擎與網址正中間的合同書文本文檔,換句話說爬蟲協議書,用于特殊spider在網址上的爬取范圍。其作用是可以屏蔽對網址對搜索引擎不友好的聯接,比如動態(tài)和數據格式聯接此外存在時屏蔽日常任務一切不肯被引入的網頁頁面。
「robots」robots合同書是正確對待蜘蛛爬取網址地質圖,也用以網站建設維護信息內容和較為比較敏感信息,確保顧客個人信息和個人隱私保護不被損害。存在于網址網站根目錄正,以格式文件存在,注意robots文件夾名字不能隨便變動。
SEO大神為何要懂robots?
撰寫::表述針對某一網絡爬蟲,
:表述嚴禁爬取
:允許爬取
.*使用通配符,表述所有
.$結束符,表述以什么結尾
/根域下是指網址網站根目錄
注:爐灶顯示英文狀況下的,并且后面有一個空格符,首寫務必小寫字母。
例:
1、User-agent:*Disallow:/針對所有網絡爬蟲嚴禁爬取根目錄下的所有聯接
2、User-agent:BaiduspiderDisallow:/嚴禁百度蜘蛛爬取網址所有連接
3、User-agent:*Disallow:/a/針對所有的網絡爬蟲嚴禁爬取網址根目錄下的a文件目錄
4、User-agent:*Disallow:/a針對所有的網絡爬蟲嚴禁爬取網址根目錄下為“a”剛開始的文本文檔5、User-agent:*Disallow:/*?*(?表述動態(tài)符)嚴禁爬取網址根目錄下帶?號的動態(tài)聯接
6、User-agent:*Disallow:/*.js$嚴禁爬取網址根目錄下邊以.js結尾的文本文檔
7、User-agent:*Disallow:/a/Allow:/a/b/嚴禁爬取網址根目錄下邊“a”,允許爬取“a”文件目錄下面的“b”文件目錄。
8、User-agent:*Disallow:/a/Allow:/a/b嚴禁爬取網址根目錄下邊“a”文件目錄,允許爬取“a”文件目錄中以“b”剛開始的文本文檔。
網頁題目:robots合同書是正確對待蜘蛛爬取網址地質圖
網頁URL:http://www.rwnh.cn/news/35934.html
成都網站建設公司_創(chuàng)新互聯,為您提供軟件開發(fā)、微信小程序、網頁設計公司、搜索引擎優(yōu)化、動態(tài)網站、云服務器
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯
猜你還喜歡下面的內容