中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

網(wǎng)站搜索引擎

2021-09-04    分類: 網(wǎng)站建設(shè)

1.什么是搜索引擎
搜索引擎( Search Engines)是指一些能夠主動(dòng)搜索信息(搜索網(wǎng)頁上的單詞和特定的簡短內(nèi)容描述)并將其自動(dòng)索引的Web網(wǎng)站,其索引內(nèi)容儲存在可供檢索的大型數(shù)據(jù)庫中,并建立索引和目錄服務(wù)。搜索引擎是一個(gè)提供信息檢索服務(wù)的網(wǎng)站,它使用某些程序把互聯(lián)網(wǎng)上的所有信息歸類,以幫助人們在茫?;ヂ?lián)網(wǎng)中找到需要的信息。
搜索引擎是用于幫助互聯(lián)網(wǎng)用戶查詢信息的搜索工具,現(xiàn)在搜索引擎已經(jīng)成為必備的上網(wǎng)工具了。如果你要購買一件商品,但你不知道去哪家網(wǎng)上商城購買,那么去找搜索引擎,搜索引擎可以滿足你的需求。
互聯(lián)網(wǎng)的快速發(fā)展,也導(dǎo)致了互聯(lián)網(wǎng)上大量“垃圾”信息的出現(xiàn),而搜索引擎的作用之一就是將比較好的網(wǎng)站、質(zhì)量比較高的網(wǎng)站排在搜索結(jié)果的前面,這樣就可以有效幫助用戶找到他們想要找的東西,這就是引擎的作用。
常見的搜索引擎介紹如下。

google:全球大的搜索引擎,1998年9月7日以私有股份公司的形式創(chuàng)立,目標(biāo)是設(shè)計(jì)并管理一個(gè)互聯(lián)網(wǎng)搜索引擎。Google公司總部位于美國加利福尼亞山景城,在世界各地設(shè)有銷售和工程辦事處。2010年, Google退出中國市場。
百度:全球大的中文搜索引擎,2000年1月由李彥宏、徐勇兩人創(chuàng)立于北京中關(guān)村,致力于提供“簡單,可依賴”的信息獲取方式。“百度”二字源于中國宋朝詞人辛棄疾《青玉案·元夕》中的詩句“眾里尋他千百度”,象征著百度對中文信息檢索技術(shù)的執(zhí)著追求。
雅虎:美國著名的互聯(lián)網(wǎng)門戶網(wǎng)站,20世紀(jì)末互聯(lián)網(wǎng)奇跡的創(chuàng)造者之一,其服務(wù)包括搜索引擎、電子郵件獨(dú)立用戶新聞等,業(yè)務(wù)遍及24供多元化的網(wǎng)絡(luò)服務(wù)。
Bing:微軟公司推出的一款用以取代live Search的搜索引擎,簡體中文版Bing于2009年6月1日正式開放,其他語言版本于200年6月3日正式在全球范圍內(nèi)發(fā)布。微軟方面稱,此款搜索引擎將以全新姿態(tài)面世,將帶來新革命。其內(nèi)測代號為“Kumo”,后來才被命名為“Bing”
搜搜:騰訊旗下的搜索網(wǎng)站,是騰訊的主要業(yè)務(wù)單元之一,于2006年3月正式發(fā)布并開始運(yùn)營。搜搜目前已成為中國網(wǎng)民選的三大搜索引擎之一,主要提供實(shí)用便捷的搜索服務(wù),同時(shí)承擔(dān)騰訊的全部搜索業(yè)務(wù),是騰訊整體在線生活戰(zhàn)略中重要的組成部分。
2.搜索引擎的工作原理
搜索引擎要“知道”網(wǎng)上的新生事物,就得派“人”出去收集。每天都有新的網(wǎng)站,每天都有新的內(nèi)容,而且這些新的內(nèi)容是爆炸式的,靠人工不可能完成收集任務(wù),所以搜索引擎的發(fā)明者就設(shè)計(jì)了一個(gè)計(jì)算機(jī)程序來執(zhí)行這個(gè)任務(wù),而這個(gè)計(jì)算機(jī)程序被人們稱為“探測器”。
探測器有很多叫法,如 Crawler(爬行器)、 Spider(蜘蛛)、 Robot(機(jī)器人)。這些叫法形象地描繪了搜索引擎派岀的蜘蛛機(jī)器人爬行在互聯(lián)網(wǎng)上探測新信息的情景, Google的探測器叫做 Googlebot,百度的探測器叫做 Baiduspider,Yahoo的探測器叫做Slurp。無論名字是什么,它們都是人們編制的計(jì)算機(jī)程序。它們不分晝夜地訪問各個(gè)網(wǎng)站,取回網(wǎng)站的內(nèi)容、標(biāo)簽、圖片等,然后依照搜索引擎的算法給定制索引。
搜索引擎的工作過程可簡略分為以下3個(gè)階段。
(1)爬行抓取:搜索引擎的蜘蛛程序通過鏈接爬行到網(wǎng)站,獲得網(wǎng)站頁面的HML代碼并存入數(shù)據(jù)庫。
(2)索引處理:蜘蛛程序把抓取的頁面數(shù)據(jù)中的文字、圖片等信息進(jìn)行索引處理,為排名做準(zhǔn)備
(3)排名:用戶輸入關(guān)鍵詞后,搜索引擎的排名算法調(diào)用索引數(shù)據(jù)庫中的信息計(jì)算并處理數(shù)據(jù),然后按照相應(yīng)的格式生成結(jié)果頁面。
3.爬行抓取
搜索引擎蜘蛛程序通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從網(wǎng)站的某一個(gè)頁面(通常是首頁)開始,讀取網(wǎng)頁的內(nèi)容,找到網(wǎng)頁中的其他鏈接地址,然后通過這些鏈接地址尋找下個(gè)網(wǎng)頁直這樣循環(huán)下去,直到把這個(gè)網(wǎng)站的所有網(wǎng)頁都抓取為止。如果網(wǎng)站的內(nèi)容質(zhì)量不高或者有大量重復(fù)信息,蜘蛛程序就沒有“耐心”抓取網(wǎng)站里的所有信息了。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么蜘蛛程序就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。但是,在實(shí)際的工作中,搜索引擎蜘蛛程序是不能抓取所有的互聯(lián)網(wǎng)信息的,畢竟蜘蛛程序的帶寬資源、時(shí)間都不是無限的,它不可能“爬”到所有的頁面。受到這些因素的制約,搜索引擎只能爬行和收錄互聯(lián)網(wǎng)信息的一小部分。
4.索引處理
抓取網(wǎng)頁后,由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,提取相關(guān)信息(包括網(wǎng)頁所在URL、編碼類型、頁面內(nèi)容包含的所有關(guān)鍵詞、關(guān)鍵詞的位置、生成時(shí)間、大小、與其他網(wǎng)頁的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜的計(jì)算,得到每一個(gè)網(wǎng)頁針對頁面文字及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些信息建立網(wǎng)頁索引數(shù)據(jù)庫。
任何搜索引擎在進(jìn)行內(nèi)容索引的時(shí)候都是以文字為基礎(chǔ)的。搜索引擎在抓取頁面的時(shí)候,并非只訪問用戶能看到的文字信息,還包含大量的HTML代碼、CSS代碼、 Javascript代碼等對排名沒有作用的內(nèi)容。抓取頁面之后,搜索引擎就要處理這些信息,從HIML代碼中分離出標(biāo)簽、代碼,提取有利于網(wǎng)站排名處理的頁面文字內(nèi)容。
5.排名
建立網(wǎng)頁索引數(shù)據(jù)庫后,當(dāng)用戶輸入關(guān)鍵詞并進(jìn)行搜索時(shí),搜索系統(tǒng)程序會(huì)從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。因?yàn)樗邢嚓P(guān)網(wǎng)頁針對該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。
影響相關(guān)性的因素包含如下幾個(gè)方面:
(1)關(guān)鍵詞岀現(xiàn)的位置:頁面關(guān)鍵詞岀現(xiàn)的位置會(huì)被搜索引擎抓取并記錄到索引庫中。會(huì)對搜索引擎排名造成影響的關(guān)鍵詞位置包括標(biāo)題< title >標(biāo)簽、

標(biāo)簽等。
(2)關(guān)鍵詞出現(xiàn)頻率:一般來說,關(guān)鍵詞在頁面中出現(xiàn)的頻率越高,密度越大,說明頁面與搜索詞的相關(guān)性越高,那么網(wǎng)頁的排名也較好。但是,如果刻意造成頁面關(guān)鍵詞堆積,頁面不僅不會(huì)有較好的排名,而且會(huì)受到搜索引擎的“懲罰”。所以,在進(jìn)行頁面內(nèi)容優(yōu)化的時(shí)候,要注意關(guān)鍵詞的密度、頻率都不要太大。
(3)頁面的鏈接也影響著關(guān)鍵詞的相關(guān)性。如果頁面中有較多的搜索詞為錨文本鏈接,就說明頁面的相關(guān)性比較強(qiáng),這會(huì)對搜索引擎相關(guān)性的計(jì)算產(chǎn)生影響。
相關(guān)性計(jì)算完畢,網(wǎng)站設(shè)計(jì)過程中,搜索引擎可能還有一些過濾算法用于對排名進(jìn)行調(diào)整。雖然這些過濾算法包含對頁面作弊嫌疑的判定,相關(guān)性較高的頁面理應(yīng)排在搜索結(jié)果的前面,但是搜索引擎的過濾算法可在最后的排名中把網(wǎng)站的排名調(diào)整到后面去。經(jīng)過相關(guān)性算法、過濾算法之后,所有的網(wǎng)站設(shè)計(jì)關(guān)鍵詞排名都確定了,排名程序調(diào)用原始頁面的信息,并把這些信息在搜索結(jié)果中顯示出來。

名稱欄目:網(wǎng)站搜索引擎
當(dāng)前路徑:http://www.rwnh.cn/news/125132.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)站改版、服務(wù)器托管Google、品牌網(wǎng)站建設(shè)全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)
平原县| 台中市| 微山县| 商南县| 翼城县| 仪陇县| 潞西市| 白水县| 兴海县| 达孜县| 即墨市| 铁力市| 天镇县| 来宾市| 应用必备| 永城市| 澎湖县| 九江市| 东海县| 十堰市| 论坛| 安义县| 桑日县| 博野县| 常宁市| 九龙坡区| 眉山市| 英吉沙县| 诏安县| 九江县| 鹤峰县| 乌海市| 新和县| 靖州| 蒙自县| 定安县| 当涂县| 郁南县| 沂南县| 兴隆县| 遂溪县|