2016-11-07 分類: 網(wǎng)站建設(shè)
搜索引擎架構(gòu)可以當作軟件架構(gòu)來理解。
① 軟件架構(gòu)
百度百科對于軟件架構(gòu)的描述如下:
軟件架構(gòu),是指一系列相關(guān)的抽象模式,用于指導大型軟件系統(tǒng)各個方面的設(shè)計。
② 搜索引擎架構(gòu)
那么搜索引擎的架構(gòu),就是用于指導搜索引擎系統(tǒng)中重要的組件以及組件之間關(guān)系而設(shè)計的抽象模式。
二、設(shè)計搜索引擎架構(gòu)的目標是什么?
SEOer應該知道為什么要設(shè)計搜索引擎架構(gòu),主要有以下兩點:
① 搜索效果
搜索引擎致力于優(yōu)化用戶搜索體驗,當用戶搜索某個詞之后,可以給予用戶更多更精準的結(jié)果。這就是在質(zhì)量層面上的目標。
② 搜索效率
搜索引擎追求更快地展現(xiàn)出用戶查詢詞的搜索結(jié)果,也是為了提升用戶搜索體驗,試想如果我們搜索一個詞,搜索引擎一分鐘后才顯示出結(jié)果,這樣的搜索引擎在這個時代是要被淘汰的。這就是在速度層面上的目標。
小結(jié):因為用戶需要一個高效的搜索引擎系統(tǒng),對搜索引擎有效果和效率的要求,所以,結(jié)構(gòu)的目標也就是這兩點了。
三、搜索引擎的基本架構(gòu)是什么?
對于SEOer而言,只需要在抽象模式上了解搜索引擎架構(gòu)即可,也無需關(guān)注過多的數(shù)學公式與算法。
搜索引擎基本架構(gòu)主要有索引處理和查詢處理。
① 索引處理
索引過程主要由以下幾個組件來完成:
1)文本采集組件
文本采集組件,主要用于發(fā)現(xiàn)、存儲和傳遞文檔。
2)文本轉(zhuǎn)換組件
文本轉(zhuǎn)換組件,主要用于提取文檔中所有內(nèi)容和元數(shù)據(jù),同時將文本轉(zhuǎn)換為索引項。
元數(shù)據(jù)可以理解為頁面的基本參數(shù),如類型、結(jié)構(gòu)、多少字等等。
索引項,又可以稱之為特征,是對文檔內(nèi)容的一部分,符合要求的文檔的索引會被存放在索引表中用于搜索。
3)索引創(chuàng)建組件
索引創(chuàng)建組件,利用文本轉(zhuǎn)換組件輸出的文檔和索引項,創(chuàng)建索引表,從而實現(xiàn)快速搜索。
索引的創(chuàng)建非常重要,尤其是針對互聯(lián)網(wǎng)的信息爆炸時代,對于新的文檔加入時,應高效完成索引創(chuàng)建。為了實現(xiàn)高效,一般都采用的倒排索引。
② 查詢處理
查詢處理主要由以下幾個組件來完成:
1)用戶交互組件
用戶交互組件,提供了用戶查詢和搜索引擎展現(xiàn)搜索結(jié)果之間的接口。
搜索引擎接收到用戶的查詢詞后,在索引庫中找到相關(guān)文檔,按照程序認為的最合理的索引排序結(jié)果展現(xiàn)給用戶。
2)排序組件
排序組件,從用戶交互組件中獲得查詢詞,并且根據(jù)一定的模型給出一個得分從高到低排序的文檔。
排序的高效依賴于搜索引擎檢索技術(shù)的高低,排序的質(zhì)量取決于搜索引擎的檢索模式。
3)評價組件
評價組件,主要用于評測和評價搜索引擎系統(tǒng)的效果和效率的目標。
一來可以統(tǒng)計大量搜索日志來記錄和分析用戶行為,二來評價的結(jié)果用來調(diào)整和改善排序組件的性能,從而提升用戶的搜索體驗度。
分享名稱:【網(wǎng)絡(luò)推廣】搜索引擎的基本架構(gòu)是什么?為什么要設(shè)計搜索引擎架構(gòu)?
文章起源:http://www.rwnh.cn/news41/61691.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化、軟件開發(fā)、搜索引擎優(yōu)化、網(wǎng)頁設(shè)計公司、營銷型網(wǎng)站建設(shè)、外貿(mào)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容