2014-02-09 分類: 網(wǎng)站建設(shè)
很多專業(yè)的seo技術(shù)人員都說,如果想要學(xué)習(xí)seo,首先你得知道搜索引擎的工作原理,其原因就是,知道搜索引擎原理,才能從實(shí)質(zhì)出發(fā),學(xué)習(xí)seo工作原理,首先我們得從這三部分下手,第一是,爬行和抓?。核阉饕嬷┲胪ㄟ^跟蹤鏈接發(fā)現(xiàn)和訪問網(wǎng)頁,然后去讀取頁面中的HTML代碼,存入到數(shù)據(jù)庫里面。第二是,預(yù)處理:索引程序?qū)δ切┳ト淼捻撁孢M(jìn)行文字的提取、中文分詞、索引、倒排索引等處理,這是用來排名程序的調(diào)用問題。第三是,排名:這也是大家最關(guān)心的,當(dāng)用戶輸入關(guān)鍵詞后,排名程序調(diào)用索引數(shù)據(jù),計(jì)算相關(guān)性,然后按一定的格式生成搜索結(jié)果頁面也就是關(guān)鍵詞的排名。以下是具體的介紹,一起來了解一下。
第一、蜘蛛爬行和處理
百度蜘蛛程序會發(fā)出頁面訪問請求,這個(gè)時(shí)候服務(wù)器就會返回HTML代碼,這個(gè)時(shí)候,蜘蛛程序就會把收到的代碼存入到原始的頁面數(shù)據(jù)庫,而且搜索引擎未來提高爬行的速度,會使用多個(gè)蜘蛛進(jìn)行分布爬行,當(dāng)爬到網(wǎng)站的時(shí)候,第一件事是需要訪問robots.txt協(xié)議,看哪些允許抓取,哪些不允許抓取,蜘蛛是會遵守協(xié)議的,對于蜘蛛抓取是有兩種抓取形式的,一種是深度的抓取、另一種是廣度優(yōu)先抓取策略。但是百度蜘蛛抓取的網(wǎng)頁太多所以并不是每一個(gè)都可以抓取到,那么這個(gè)時(shí)候我們就需要去吸引蜘蛛來抓取我們的網(wǎng)頁,那么有哪些方法呢?
1、網(wǎng)站域名比較久,這樣的域名網(wǎng)站蜘蛛會認(rèn)為是質(zhì)量高、資質(zhì)老的網(wǎng)站,所以會優(yōu)先深度去抓取內(nèi)容。
2、網(wǎng)頁的更新頻率,這樣的網(wǎng)站會根據(jù)網(wǎng)站每天生成的內(nèi)容進(jìn)行數(shù)據(jù)統(tǒng)計(jì),然后發(fā)現(xiàn)每次都有新內(nèi)容產(chǎn)出,那么就會經(jīng)常去抓取。
3、導(dǎo)入鏈接。
4、URL結(jié)構(gòu)等等。
第二、預(yù)處理
預(yù)處理在seo技術(shù)中也叫“索引”這是因?yàn)樗饕穷A(yù)處理最主要的內(nèi)容,前面說了蜘蛛抓取了網(wǎng)頁的內(nèi)容,那么這個(gè)時(shí)候就需要對內(nèi)容去進(jìn)行處理,因?yàn)獒槍τ谶@個(gè)關(guān)鍵詞有很多競爭對手,這時(shí)候需要選出最符合要求的內(nèi)容來展示在最前面,這里主要就有提取內(nèi)容的文字,中文分詞,去停止詞,消除噪聲,去重正向索引和倒排索引,鏈接計(jì)算,質(zhì)量判斷這些工作去有價(jià)值的內(nèi)容刷選。
第三、網(wǎng)站關(guān)鍵詞排名
經(jīng)過了前面兩項(xiàng)的重重選擇就開始對關(guān)鍵詞進(jìn)行排名了,這里的排名會經(jīng)過一個(gè)關(guān)鍵詞在網(wǎng)站的一個(gè)詞頻及密度,來體現(xiàn)關(guān)鍵詞在網(wǎng)站的一個(gè)重要性,同時(shí)還會計(jì)算出相關(guān)性,接著就會進(jìn)行過濾這個(gè)過濾是對于那些網(wǎng)站有作弊嫌疑的網(wǎng)站做的懲罰,最后就會確定好網(wǎng)站關(guān)鍵詞排名,排名程序會調(diào)用原始頁面的標(biāo)題標(biāo)簽、說明標(biāo)簽、快照日期等數(shù)據(jù)據(jù)顯示在頁面上面。
不知道看到這里,大家對于搜素引擎的原理知道多少,在做網(wǎng)站優(yōu)化排名的時(shí)候,千萬不能操之過急,首先需要考慮到搜索引擎的工作原理,才能避免一些不必要的錯(cuò)誤,在每一點(diǎn)上去規(guī)范優(yōu)化操作技術(shù)。
網(wǎng)頁題目:做seo搜索引擎工作原理你要知
URL分享:http://www.rwnh.cn/news/5991.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、小程序開發(fā)、域名注冊、手機(jī)網(wǎng)站建設(shè)、虛擬主機(jī)、網(wǎng)頁設(shè)計(jì)公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容