中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

詳解搜索引擎技術(shù)的發(fā)展史

2017-02-22    分類: 網(wǎng)站建設(shè)

從搜索引擎所采取的技術(shù)來說,可以將搜索引擎技術(shù)的發(fā)展分為4個(gè)時(shí)代:分類目錄、文本檢索、連接分析和用戶中心。


史前一代:分類目錄的一代
這個(gè)時(shí)代也可以成為“導(dǎo)航時(shí)代”,Yahoo和hao123是這個(gè)時(shí)代的代表。通過人工收集整理,把各類別的高質(zhì)量網(wǎng)站或者網(wǎng)頁分門別類羅列,用戶可以根據(jù)分級目錄來查找高質(zhì)量的網(wǎng)站。這種方式是純?nèi)斯さ姆绞剑⑽床扇∈裁锤呱畹募夹g(shù)手段。采取分類目錄的方式,一般被收錄的網(wǎng)站質(zhì)量都較高,但是這種方式可擴(kuò)展性不強(qiáng),絕大部分網(wǎng)站不能被收錄。第一代:文本檢索的一代
文本檢索的一代采用經(jīng)典的信息檢索模型,比如布爾模型、向量空間模型或者概率模型,來計(jì)算用戶查詢關(guān)鍵詞和網(wǎng)頁文本內(nèi)容的相關(guān)程度。網(wǎng)頁之間有豐富的鏈接關(guān)系,而這一代搜索引擎并未使用這些信息。早期的很多搜索引擎比如Alta Vista、Excite等大都采取這種模式。相比分類目錄,這種方式可以收錄大部分網(wǎng)頁,并能夠按照網(wǎng)頁內(nèi)容和用戶查詢的匹配程度進(jìn)行排序。但是總體而言,搜索結(jié)果質(zhì)量不是很好。第二代:連接分析的一代
這一代的搜索引擎充分利用了網(wǎng)頁之間的鏈接關(guān)系,并深入挖掘和利用了網(wǎng)頁鏈接所代表的含義。通常而言,網(wǎng)頁鏈接代表的一種推薦關(guān)系,所以通過鏈接分析可以在海量內(nèi)容中找出重要的網(wǎng)頁。這種重要性本質(zhì)上是對網(wǎng)頁流行程度的一種衡量,因?yàn)楸煌扑]次數(shù)多的網(wǎng)頁其實(shí)代表了其具有流行性。搜索引擎通過結(jié)合網(wǎng)頁流行性和內(nèi)容相似性來改善搜索質(zhì)量。Google率先提出并使用PageRank鏈接分析技術(shù),并大獲成功,這同時(shí)也引進(jìn)了學(xué)術(shù)界和其他商業(yè)搜索引擎的關(guān)注。后來學(xué)術(shù)界陸續(xù)推出了很多改進(jìn)的鏈接分析算法。目前幾乎所有的商業(yè)搜索引擎都采取了鏈接分析技術(shù)。采用鏈接分析能夠有效改善搜索質(zhì)量,但是這種搜索引擎并未考慮用戶的個(gè)性化要求,所以只要輸入的查詢請求相同,所有用戶都會(huì)獲得相同的搜索結(jié)果。另外,很多網(wǎng)站擁有者為了獲得更高的搜索排名,針對鏈接分析算法提出了不少鏈接作弊方案,這樣導(dǎo)致搜索結(jié)果質(zhì)量變差。第三代:用戶中心的一代
目前的搜索引擎大都可以歸為第三代,即以理解用戶需求為核心。不同用戶即使輸入同一個(gè)查詢關(guān)鍵詞,但其目的也有可能不一樣。比如同樣輸入“蘋果”作為查詢詞,一個(gè)追捧iPhone的時(shí)尚青年和一個(gè)果農(nóng)的目的會(huì)有相當(dāng)大的差距。即使是同一個(gè)用戶,輸入相同的查詢詞,也會(huì)因?yàn)樗诘臅r(shí)間和場合不同,需求有所變化。而目前搜索引擎大都致力于解決如下問題,如何能夠理解用戶發(fā)出的某個(gè)很短小的查詢詞背后包含的真正需求,所以這一代搜索引擎稱之為以用戶為中心的一代。為了能夠獲取用戶的真實(shí)需求,目前搜索引擎大都做了很多技術(shù)方面的嘗試。比如利用用戶發(fā)送查詢詞時(shí)的時(shí)間和地理位置信息,利用用戶過去發(fā)出的查詢詞及相應(yīng)的點(diǎn)擊記錄、歷史信息等技術(shù)手段,來試圖理解用戶此時(shí)此刻的真正需求。

分享題目:詳解搜索引擎技術(shù)的發(fā)展史
文章網(wǎng)址:http://www.rwnh.cn/news46/74246.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)公司、移動(dòng)網(wǎng)站建設(shè)、商城網(wǎng)站網(wǎng)站制作、電子商務(wù)、網(wǎng)站導(dǎo)航

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化
轮台县| 上思县| 抚宁县| 永安市| 张家川| 通化县| 潢川县| 明光市| 西昌市| 惠州市| 定安县| 扶绥县| 蓬莱市| 仁化县| 舒城县| 盐池县| 崇明县| 普兰县| 潼南县| 平顶山市| 荔浦县| 伽师县| 莱芜市| 漳浦县| 彩票| 英吉沙县| 达尔| 策勒县| 林甸县| 塔城市| 和平区| 景宁| 如东县| 灯塔市| 嵊州市| 克山县| 伊吾县| 新和县| 子长县| 昆山市| 出国|