什么是robots.txt?Robots協(xié)議(也稱為爬蟲協(xié)議、機(jī)器人協(xié)議等)的全稱是“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)”,網(wǎng)站通過Robots協(xié)議告訴搜索引擎哪些頁(yè)面可以抓取,哪些頁(yè)面不能抓取。robots.txt是一個(gè)協(xié)議,而不是一個(gè)命令。robots.txt是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的一個(gè)文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。那么各位站長(zhǎng)對(duì)robots了解多少?知道robots文件怎么寫嗎?下面創(chuàng)新互聯(lián)小編就來為大家介紹。
robots協(xié)議原理
Robots協(xié)議是國(guó)際互聯(lián)網(wǎng)界通行的道德規(guī)范,基于以下原則建立:
1、搜索技術(shù)應(yīng)服務(wù)于人類,同時(shí)尊重信息提供者的意愿,并維護(hù)其隱私權(quán);
2、網(wǎng)站有義務(wù)保護(hù)其使用者的個(gè)人信息和隱私不被侵犯。
robots功能
Robots協(xié)議用來告知搜索引擎營(yíng)銷哪些頁(yè)面能被抓取,哪些頁(yè)面不能被抓取;可以屏蔽一些網(wǎng)站中比較大的文件,如:圖片,音樂,視頻等,節(jié)省服務(wù)器帶寬;可以屏蔽站點(diǎn)的一些死鏈接。方便搜索引擎抓取網(wǎng)站內(nèi)容;設(shè)置網(wǎng)站地圖連接,方便引導(dǎo)蜘蛛爬取頁(yè)面。
網(wǎng)站robots.txt文件如何寫作?
robots.txt文件寫法如下:
User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個(gè)通配符。
robots文件的寫法
Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄。
Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄。
Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄。
Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。
Disallow: /*?* 禁止訪問網(wǎng)站中所有包含問號(hào) (?) 的網(wǎng)址。
Disallow: /.jpg$ 禁止抓取網(wǎng)頁(yè)所有的.jpg格式的圖片。
Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。
Allow: /cgi-bin/ 這里定義是允許爬尋cgi-bin目錄下面的目錄。
Allow: /tmp 這里定義是允許爬尋tmp的整個(gè)目錄。
Allow: .htm$ 僅允許訪問以".htm"為后綴的URL。
Allow: .gif$ 允許抓取網(wǎng)頁(yè)和gif格式圖片。
Sitemap: 網(wǎng)站地圖 告訴爬蟲這個(gè)頁(yè)面是網(wǎng)站地圖。
對(duì)于robots.txt文件的寫法就為大家分享到這里,當(dāng)一個(gè)搜索蜘蛛訪問一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁(yè)面。
成都網(wǎng)站制作思路網(wǎng)小編提醒大家,僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時(shí),才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容,請(qǐng)勿建立robots.txt文件。
參考資料:
成都seo顧問收費(fèi)標(biāo)準(zhǔn)是多少?seo顧問多少錢一年
大連seo關(guān)鍵詞優(yōu)化-百度排名首頁(yè)-百度推廣-網(wǎng)站優(yōu)化
網(wǎng)絡(luò)營(yíng)銷工程師好學(xué)嗎?網(wǎng)絡(luò)營(yíng)銷工程師培訓(xùn)考試
網(wǎng)站信息維護(hù)包括哪些內(nèi)容?做好網(wǎng)站維護(hù)工作
詞條標(biāo)簽:robots協(xié)議,
猜您關(guān)注:
營(yíng)銷策劃書怎么寫?手機(jī)、ktv、ppt、產(chǎn)品、酒店行業(yè)
成都網(wǎng)站關(guān)鍵字優(yōu)化報(bào)價(jià)4513元全包「成都
seo優(yōu)化報(bào)價(jià)」
網(wǎng)站欄目:seo教程-網(wǎng)站robot什么意思?robots.txt如何寫作?
網(wǎng)頁(yè)鏈接:http://www.rwnh.cn/news/193637.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、品牌網(wǎng)站設(shè)計(jì)、微信公眾號(hào)、關(guān)鍵詞優(yōu)化、品牌網(wǎng)站制作、企業(yè)建站
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)