2016-09-17 分類: 網(wǎng)站建設(shè)
想必在做SEO的時(shí)候有同學(xué)發(fā)現(xiàn)相同的網(wǎng)站有兩個(gè)頁(yè)面但是排名的名次不同,既然是同一個(gè)網(wǎng)站那么應(yīng)該權(quán)重都一樣怎么會(huì)一個(gè)排名前面一個(gè)后面呢?在搜索引擎當(dāng)中每個(gè)網(wǎng)頁(yè)都有對(duì)應(yīng)的頁(yè)面得分在決定這兩個(gè)頁(yè)面排名順序是運(yùn)用到了TF-IDF算法跟PageRank鏈接算法,今天給大家分享關(guān)于SEO算法的文章。
鏈接分析排序的思想起源于文獻(xiàn)引文索引機(jī)制,即誰(shuí)的論文被引用次數(shù)多、引用它的論文的質(zhì)量高,誰(shuí)就被認(rèn)為是權(quán)威,論文就是好論文。這個(gè)思路移植到網(wǎng)上就是誰(shuí)的網(wǎng)頁(yè)被鏈接次數(shù)多、鏈接它的網(wǎng)頁(yè)質(zhì)量高,那個(gè)網(wǎng)頁(yè)就被認(rèn)為是質(zhì)量高、人氣旺,是用戶所需要的。鏈接分析算法大體可以分為3類,基于隨機(jī)漫游模型的,比如pagerank,Repution算法;基于Hub和Authority相互增強(qiáng)模型的,如HITS及其變種;基于概率模型的,如SALSA;百度的超鏈分析和谷歌的PageRank都屬于鏈接分析排序技術(shù)。在兩者搜索引擎之間,算法都是有異曲同工之妙之處,本文重點(diǎn)講解分析PageRank算法。
什么是PageRank算法
PageRank,網(wǎng)頁(yè)排名,又稱網(wǎng)頁(yè)級(jí)別、Google左側(cè)排名或佩奇排名,是一種由[1]根據(jù)網(wǎng)頁(yè)之間相互的超鏈接計(jì)算的技術(shù),而作為網(wǎng)頁(yè)排名的要素之一,以Google公司創(chuàng)辦人拉里·佩奇(LarryPage)之姓來(lái)命名。Google用它來(lái)體現(xiàn)網(wǎng)頁(yè)的相關(guān)性和重要性,在搜索引擎優(yōu)化操作中是經(jīng)常被用來(lái)評(píng)估網(wǎng)頁(yè)優(yōu)化的成效因素之一。Google的創(chuàng)始人拉里·佩奇和謝爾蓋·布林于1998年在斯坦福大學(xué)發(fā)明了這項(xiàng)技術(shù)。
PageRank通過(guò)網(wǎng)絡(luò)浩瀚的超鏈接關(guān)系來(lái)確定一個(gè)頁(yè)面的等級(jí)。Google把從A頁(yè)面到B頁(yè)面的鏈接解釋為A頁(yè)面給B頁(yè)面投票,Google根據(jù)投票來(lái)源(甚至來(lái)源的來(lái)源,即鏈接到A頁(yè)面的頁(yè)面)和投票目標(biāo)的等級(jí)來(lái)決定新的等級(jí)。簡(jiǎn)單的說(shuō),一個(gè)高等級(jí)的頁(yè)面可以使其他低等級(jí)頁(yè)面的等級(jí)提升。
PageRank算法原理公式
PageRank利用了互聯(lián)網(wǎng)獨(dú)特的民主特性及其巨大的鏈接結(jié)構(gòu)。實(shí)質(zhì)上,當(dāng)從網(wǎng)頁(yè)A鏈接到網(wǎng)頁(yè)B時(shí),PageRank就認(rèn)為“網(wǎng)頁(yè)A投了網(wǎng)頁(yè)B一票”??筛鶕?jù)網(wǎng)頁(yè)的得票數(shù)評(píng)定其重要性。然而,除了考慮網(wǎng) 頁(yè)得票數(shù)(即鏈接)的純數(shù)量之外,還要分析為其投票的網(wǎng)頁(yè)。“重要”網(wǎng)頁(yè)所投之票自然份量較重,有助于增強(qiáng)其他網(wǎng)頁(yè)的“重要性”。這樣,重要的、高質(zhì)量的網(wǎng)頁(yè)可獲得較高的網(wǎng)頁(yè)級(jí)別,從而在搜索結(jié)果中可獲較高的排位,假設(shè)一個(gè)由4個(gè)頁(yè)面組成的小團(tuán)體:A,B,C和D。如果所有頁(yè)面都鏈向A,那么A的PR(PageRank)值將是B,C及D的Pagerank總和。
繼續(xù)假設(shè)B也有鏈接到C,并且D也有鏈接到包括A的3個(gè)頁(yè)面。一個(gè)頁(yè)面不能投票2次。所以B給每個(gè)頁(yè)面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的PageRank上。
換句話說(shuō),根據(jù)鏈出總數(shù)平分一個(gè)頁(yè)面的PR值。
最后,所有這些被換算為一個(gè)百分比再乘上一個(gè)系數(shù)。由于“沒(méi)有向外鏈接的頁(yè)面”傳遞出去的PageRank會(huì)是0,所以,Google通過(guò)數(shù)學(xué)系統(tǒng)給了每個(gè)頁(yè)面一個(gè)最小值:
說(shuō)明:在SergeyBrin和LawrencePage的1998年原文中給每一個(gè)頁(yè)面設(shè)定的最小值是1-d,而不是這里的(1-d)/N。所以一個(gè)頁(yè)面的PageRank是由其他頁(yè)面的PageRank計(jì)算得到。Google不斷的重復(fù)計(jì)算每個(gè)頁(yè)面的PageRank。如果給每個(gè)頁(yè)面一個(gè)隨機(jī)PageRank值(非0),那么經(jīng)過(guò)不斷的重復(fù)計(jì)算,這些頁(yè)面的PR值會(huì)趨向于穩(wěn)定,也就是收斂的狀態(tài)。這就是搜索引擎使用它的原因。
簡(jiǎn)單說(shuō)來(lái),搜索引擎通過(guò)下述幾個(gè)步驟來(lái)實(shí)現(xiàn)網(wǎng)頁(yè)在其搜索結(jié)果頁(yè)中的排名:
1、找到所有與搜索關(guān)鍵詞匹配的網(wǎng)頁(yè)。
2、根據(jù)頁(yè)面因素如標(biāo)題,關(guān)鍵詞密度等排列等級(jí)。
3、計(jì)算導(dǎo)人鏈接的錨文本中的關(guān)鍵詞。
4、通過(guò)PageRank得分調(diào)整網(wǎng)站排名結(jié)果。
事實(shí)上,真正的網(wǎng)站排名過(guò)程并不是這么簡(jiǎn)單,據(jù)百度等搜索引擎介紹,搜索引擎除了用PageRank算法衡量網(wǎng)頁(yè)的重要程度以外,還有其它上百種因素來(lái)參與排序。其它搜索引擎也是如此,不可能只按照某一種規(guī)則來(lái)進(jìn)行搜索結(jié)果的排序。要想做好SEO排名,了解算法原理本身,通過(guò)從本質(zhì)出發(fā),搜索引擎結(jié)果排序其實(shí)會(huì)越做越簡(jiǎn)單。
文章名稱:SEO算法:如何通過(guò)PageRank算法判斷SEO排序結(jié)果
分享URL:http://www.rwnh.cn/news2/44902.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導(dǎo)航、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站收錄、品牌網(wǎng)站建設(shè)、Google、定制網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容