2014-02-11 分類: 網(wǎng)站建設(shè)
大家都知道,我們平時習慣用百度進行搜索,而百度正好能夠展現(xiàn)給用戶想要的,而這里就涉及一個百度搜索引擎的工作原理,其他搜索引擎比如360、搜狗也都一樣,機器有一套的程序算法,當用戶搜索相關(guān)詞時,能夠給與展現(xiàn)的機會。
搜索引擎工作原理流程主要分為四個階段:
第一,抓取階段:在互聯(lián)網(wǎng)中,搜索引擎蜘蛛來網(wǎng)站頁面進行深度、廣度的信息抓取;我們知道的搜索蜘蛛名稱有baiduspider(百度蜘蛛)、360Spider(360蜘蛛)、Googlebot(谷歌蜘蛛)、SogouNews Spider(搜狗蜘蛛)、Yahoo! Slurp China或者Yahoo(雅虎蜘蛛)、YoudaoBot(有道蜘蛛)等等。
第二,過濾階段:
搜索引擎蜘蛛過濾掉低價值質(zhì)量的網(wǎng)站內(nèi)容信息,建立臨時數(shù)據(jù)庫。比如過濾掉沒有內(nèi)容,過濾掉頁面僅一個圖片的,或者過濾重復內(nèi)容的。網(wǎng)站收錄,就是這一個步驟實現(xiàn)的。
第三,索引階段:
搜索引擎對有質(zhì)量價值的信息進行提取,將提取信息組織并放到所建立的索引庫中存儲。蜘蛛抓取之后,會將數(shù)據(jù)存放在一個臨時數(shù)據(jù)庫,再從臨時數(shù)據(jù)庫中調(diào)出更有價值的數(shù)據(jù)建立索引庫。
第四,展示排序階段:
當用戶在搜索引擎上輸入一個關(guān)鍵詞時,檢索系統(tǒng)處理搜索請求,將其搜索根據(jù)各種算法進行計算排序,把用戶搜索的某個關(guān)鍵詞或用戶搜索相近的關(guān)鍵詞展現(xiàn)在首頁的位置(漂紅的內(nèi)容),這就是用戶在搜索引擎上輸入一個詞看到的內(nèi)容展示排序的結(jié)果。
頁面排序取決于頁面的權(quán)重,權(quán)重取決于三個方面: 相關(guān)性、 鏈接權(quán)重 、用戶行為
當然,第一和第二階段也可稱為爬行和抓取過程,接下來是索引過程,最后就是用戶檢索過程,搜索詞經(jīng)過處理后進行排序。搜索引擎發(fā)展到爬蟲抓取2.0時代時,是由計算機算法決定的,計算機算法也不斷在更新升級以及人工智能化,才最終展現(xiàn)的越來越精準。seo實際就是配合搜索引擎的工作原理而產(chǎn)生的,是為了更好的用戶體驗而存在的。
文章標題:關(guān)于搜索引擎工作原理,這些知識你知道嗎
鏈接地址:http://www.rwnh.cn/news/24780.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、網(wǎng)站設(shè)計公司、企業(yè)網(wǎng)站制作、虛擬主機、網(wǎng)站營銷、動態(tài)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容