搜索引擎都有自己的“搜索機(jī)器人”(ROBOTS),并通過這些ROBOTS在網(wǎng)絡(luò)上沿著網(wǎng)頁上的鏈接(一般是http和src鏈接)不斷抓取資料建立自己的數(shù)據(jù)庫。 對于網(wǎng)站管理者和內(nèi)容提供者來說,有時候會有一些站點內(nèi)容,不希望被ROBOTS抓取而公開。為了解決這個問題,ROBOTS開發(fā)界提供了兩個辦法:一個是robots.txt,另一個是The Robots META標(biāo)簽。
一、robots.txt 1、什么是robots.txt? robots.txt是一個純文本文件,通過在這個文件中聲明該網(wǎng)站中不想被robots訪問的部分,這樣,該網(wǎng)站的部分或全部內(nèi)容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內(nèi)容。 當(dāng)一個搜索機(jī)器人訪問一個站點時,它會首先檢查該站點根目錄下是否存在robots.txt,如果找到,搜索機(jī)器人就會按照該文件中的內(nèi)容來確定訪問的范圍,如果該文件不存在,那么搜索機(jī)器人就沿著鏈接抓取。 robots.txt必須放置在一個站點的根目錄下,而且文件名必須全部小寫。 網(wǎng)站 URL 相應(yīng)的 robots.txt的 URL http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt
2、robots.txt的語法 "robots.txt"文件包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示: ":"。 在該文件中可以使用#進(jìn)行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow行,詳細(xì)情況如下: User-agent: 該項的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多條User-agent記錄說明有多個robot會受到該協(xié)議的限制,對該文件來說,至少要有一條User-agent記錄。如果該項的值設(shè)為*,則該協(xié)議對任何機(jī)器人均有效,在"robots.txt"文件中, "User-agent:*"這樣的記錄只能有一條。 Disallow : 該項的值用于描述不希望被訪問到的一個URL,這個URL可以是一條完整的路徑,也可以是部分的,任何以Disallow 開頭的URL均不會被robot訪問到。例如"Disallow: /help"對/help.html 和/help/index.html都不允許搜索引擎訪問,而"Disallow: /help/"則允許robot訪問/help.html,而不能訪問/help/index.html。 任何一條Disallow記錄為空,說明該網(wǎng)站的所有部
網(wǎng)站建設(shè)中遇到的問題,以及“Web標(biāo)準(zhǔn)”思想的產(chǎn)生、發(fā)展和推廣。讓你明白為什么要采用和推廣Web 標(biāo)準(zhǔn)。
第二部分從技術(shù)細(xì)節(jié)上講解了網(wǎng)站實際制作開發(fā)過程中如何向Web標(biāo)準(zhǔn)過渡,如何采用和符合Web標(biāo)準(zhǔn)。通過閱讀本書,你可以清楚一些基本問題: Web標(biāo)準(zhǔn)是什么? 網(wǎng)站一定要用標(biāo)準(zhǔn)嗎? 用標(biāo)準(zhǔn)和不用標(biāo)準(zhǔn)的區(qū)別? 如何采用標(biāo)準(zhǔn)? 如何向標(biāo)準(zhǔn)過渡? 適合什么樣的人看這本書適合的讀者是:所有的
網(wǎng)站設(shè)計者、開發(fā)者和所有者。 這不是廣告詞。不論對這一行業(yè)的新手還是資深人士,本書都將對你產(chǎn)生深刻影響。它告訴我們怎樣做是正確的,以及應(yīng)該如何做。也許本書介紹的思想和技術(shù)你可能不會馬上接受或貫徹到工作中,但它是Web發(fā)展的趨勢,是阻擋不了的發(fā)展趨勢。它的重要性已經(jīng)并將繼續(xù)在Web領(lǐng)域體現(xiàn)。 對我們有什么好處如果你是Web設(shè)計師、開發(fā)者或所有者,如果你正在困惑自己應(yīng)該學(xué)習(xí)什么,怎么做,如果你正在猶豫自己網(wǎng)站的發(fā)展方向,如果你正在想如何把自己提高一個層次,如果你正在頭疼不斷的網(wǎng)站升級問題,本書正是你需要的! 它告訴你Web開發(fā)的技術(shù)將如何發(fā)展,未來的Web將是怎樣的??辞宄诉@些,如何發(fā)展網(wǎng)站,自己如何定位就容易得多。
任何書都有它的價值所在。如果需要一個理由購買這本書,那么我會這樣說:你可以不買這本書,但是本書的思想和技術(shù)你一定要了解,總有一天你會需要它,這一點是百分之百肯定的。與其被動地、等到迫不得已的時候再來了解和學(xué)習(xí),為什么不現(xiàn)在就行動? 譯者的感受對于本書的作者Jeffrey Zeldman,國內(nèi)設(shè)計師和開發(fā)者可能并不熟悉,但在國外,同行無人不知。他領(lǐng)導(dǎo)的Web標(biāo)準(zhǔn)組織(www.Webstandards.org)幫助終止了Microso ft 與Netscape之間的瀏覽器之戰(zhàn),使得我們不再需要考慮瀏覽器不同版本問題。他也是資深的設(shè)計師,對網(wǎng)站技術(shù)的歷史和發(fā)展了如指掌。通過翻譯本書,我們對Web標(biāo)準(zhǔn)的發(fā)展歷史、Web標(biāo)準(zhǔn)技術(shù)的應(yīng)用進(jìn)行了系統(tǒng)而全面的了解。特別是許多技術(shù)細(xì)節(jié)的來龍去脈,常常讓我們頓悟:原來如此! 本書不像Flash或者Photoshop教程那么有趣,也不像程序語言教材那樣立竿見影,但我們還是決定翻 Disallow: /cgi-bin/
本文題目:網(wǎng)站結(jié)構(gòu)合理的重要性
分享鏈接:http://www.rwnh.cn/news/59364.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗、網(wǎng)站導(dǎo)航、網(wǎng)站排名、面包屑導(dǎo)航、定制網(wǎng)站、虛擬主機(jī)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)