2023-01-01 分類: 網(wǎng)站建設(shè)
在6月15的《谷歌中文網(wǎng)站管理員博客》中,出現(xiàn)了一篇介紹“豐富網(wǎng)頁摘要”的文章??吹竭@篇博客,我就知道3年前對google的預(yù)測,現(xiàn)在終于變成現(xiàn)實了。不過沒想到在眾多網(wǎng)站還沒普及這些新技術(shù)的情況下,google這么快就開始應(yīng)用了。
關(guān)于“豐富網(wǎng)頁摘要”的詳細介紹,大家可以點上面的鏈接去了解。“豐富網(wǎng)頁摘要”,用一句話說明一下就是:你給你的網(wǎng)站的某些內(nèi)容,用特定的格式標注一下,就可以讓你的網(wǎng)頁在google的搜索結(jié)果中,顯示更多的結(jié)構(gòu)化的信息。比如那個博客上的截圖:
豐富網(wǎng)頁摘要
當(dāng)用戶搜索“drooling dog”,用戶能在搜索結(jié)果頁直接看到網(wǎng)頁上的產(chǎn)品有多少人評論以及價格范圍。
這些信息是在原網(wǎng)頁中本來就有的:http://www.yelp.com/biz/drooling-dog-bar-b-q-colfax
如果你的網(wǎng)站也能這樣呈現(xiàn)搜索結(jié)果給用戶,有什么好處自然是不用說的。接下來要講的是google為什么會采用“豐富網(wǎng)頁摘要”。下面給大家呈現(xiàn)一下以前我的分析過程。這樣你也能預(yù)測搜索引擎以后會做些什么了。
我們?nèi)绻驹谒阉饕娴慕嵌热タ?,就發(fā)現(xiàn)作為一個通用搜索引擎,其實是非常不容易的。搜索引擎面對的是上百億的網(wǎng)頁,先不說分詞、索引、以及抓取和排序等等的技術(shù)。先來看搜索引擎如何判斷網(wǎng)頁上有什么內(nèi)容,就發(fā)現(xiàn)是件很復(fù)雜的事情。
互聯(lián)網(wǎng)上可以說什么樣的網(wǎng)站都有,體現(xiàn)在網(wǎng)頁的代碼里,什么樣的HTML寫法都有的。 在具體的網(wǎng)頁設(shè)計上,有些網(wǎng)站用模版做網(wǎng)站,可能僅僅只有一個區(qū)域內(nèi)的內(nèi)容是有效的;而有些不用模版,網(wǎng)頁上從頭到尾都是有價值的內(nèi)容;每個網(wǎng)站的代碼都是如此不相同而且混亂,但是搜索引擎還要通過這些HTML代碼來判斷你的重點內(nèi)容。搜素引擎要從這么多繁雜的網(wǎng)頁里提煉有價值的內(nèi)容給用戶,那個過程非常的痛苦。
我曾經(jīng)和前yahoo中國的工程師一起做過一些事情,發(fā)現(xiàn)這樣的互聯(lián)網(wǎng)現(xiàn)狀太考驗一個公司的技術(shù)水平了。到如今,像google這樣的公司,在處理網(wǎng)頁噪音的時候都還遇到很多困難的。 所以,如果有一種統(tǒng)一的格式和標準,讓大家來遵守,大家把網(wǎng)站里的內(nèi)容都用這個標準把信息結(jié)構(gòu)化的話,那對搜索引擎來說是一件非常幸福的事情。
現(xiàn)在博客搜索里,google已經(jīng)開始應(yīng)用一些現(xiàn)成的標準了。如:
在google的博客搜索里搜索“SEM一家之言”,出現(xiàn)這樣的搜索結(jié)果:
google博客搜索
大家看這個搜索結(jié)果,已經(jīng)把博客發(fā)布的時間和作者給列出來了的。但是可以看到,這兩個頁面的排版和頁面代碼都是不一樣的。那搜索引擎是怎么準確的知道這兩個信息的呢? 特別是第二個結(jié)果,google列出的那個時間的格式和我博客上的格式是不一樣的。
原因倒非常簡單。因為這兩個博客都提供了RSS供稿,在RSS文件里,都用一個標準的格式寫明了時間和作者這些信息的。
RRS文件
google通過讀取這個標準化的RSS文件準確的抓取到了這些信息。
除了應(yīng)用RSS這個通用的標準,google還試圖創(chuàng)立一個自己的標準來規(guī)范化很多信息。像google base就是其中的一個實驗的項目。google base 這個項目以后會有專門的介紹。它試圖把很多的信息都規(guī)范化,如你賣的東西的價格和產(chǎn)地,是否提供運輸?shù)鹊?你的房屋租售價格和位置;甚至一個學(xué)校的課程表,都可以用特定的格式標準化。
google base還在不斷的發(fā)展和完善中,在目前的應(yīng)用中,凡是google base 里的信息,都有可能在相關(guān)的搜索結(jié)果中排在靠前的位置。
比起自己去創(chuàng)立和推廣一個標準來,應(yīng)用現(xiàn)成的標準無疑是最省事的。“微格式”和 “RDFa”就是一個這樣的現(xiàn)成的標準。具體的應(yīng)用在《谷歌中文網(wǎng)站管理員博客》的那篇文章中已經(jīng)說明了。
這些標準的應(yīng)用起來效果是非常好的。
還是同一個詞語“drooling dog”, 用美國IP,在英文版的google上搜索,在第2個搜索結(jié)果中,還是出現(xiàn)那那家“Bar B Q”,而且有個地圖標明了地址,地圖旁邊還有地址和電話。
單獨的地圖和地址電話信息
這個搜索結(jié)果不是那個“本地商家”的搜索結(jié)果。因為這個結(jié)果只顯示這一家店的地址,而且特別標注了這家店的地址和電話。
這幅地圖和地址信息在那個網(wǎng)頁上本來就有的,只是這個網(wǎng)站把它們用特定的標準標注了才有了這種效果。
我的這個分析方式,就是站在搜索引擎的角度,來考慮如何提供更好的搜索結(jié)果給用戶。這是一種很好的SEO方法。以后大家也可以從這個角度來考慮SEO。
順便說一下的是,上面那個博客搜索里的時間都比RSS文件里的時間慢一天的,這是因為google服務(wù)器所在的時區(qū)比中國時間慢的緣故。當(dāng)然谷歌是不會處理這些小細節(jié)的,包括最近谷歌的首頁上找不到登陸的地方也是。
文章標題:SEM一家之言:豐富網(wǎng)頁摘要讓網(wǎng)站與眾不同
鏈接URL:http://www.rwnh.cn/news26/227276.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、品牌網(wǎng)站設(shè)計、外貿(mào)建站、網(wǎng)站設(shè)計、Google、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容