中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

快速解鎖搜索引擎的幾大知識(shí)點(diǎn)

2014-06-12    分類(lèi): 網(wǎng)站建設(shè)

提起Search EngineOptimization(seo),想必大家一定熟悉又陌生。SEO是最先被我們所熟悉的數(shù)字營(yíng)銷(xiāo)概念之一。那為何又用“陌生” 來(lái)形容它呢?

是因?yàn)閺臉I(yè)以來(lái),大多數(shù)人僅對(duì)SEO的部分概念和術(shù)語(yǔ)有所了解,而對(duì)搜索引擎如何工作,如何解讀日常所接觸到的SEO報(bào)告,如何發(fā)現(xiàn)問(wèn)題,如何進(jìn)行優(yōu)化存在諸多盲點(diǎn),對(duì)于如何針對(duì)自身情況制定SEO策略,更是無(wú)從下手。

那么從今天起,創(chuàng)新互聯(lián)將通過(guò)一個(gè)系列文章,力爭(zhēng)為大家梳理SEO知識(shí)點(diǎn),希望大家在讀完該系列文章后,能夠獲得些許啟發(fā),更好地為所任職崗位服務(wù)。

作為第一篇,我們先來(lái)了解一些基礎(chǔ)內(nèi)容,大家是否曾思考過(guò)以下問(wèn)題:

SEO是什么?我們?nèi)绾稳ザx它?

為什么要做SEO?

移動(dòng)互聯(lián)時(shí)代,還需要做SEO嗎?

搜索引擎的工作原理是什么?在簡(jiǎn)單的 “輸入-搜索” 這幾步簡(jiǎn)單的操作后,搜索引擎是如何從海量的數(shù)據(jù)中,找尋到我們所需要的內(nèi)容,并展現(xiàn)給我們的?

帶著這些疑問(wèn),一起√get今天的知識(shí)吧!

知識(shí)點(diǎn)1:SEO是什么?我們?nèi)绾味x它?

SEO的全稱(chēng)是 “Search Engine Optimization”,中文譯為 “搜索引擎優(yōu)化”。

簡(jiǎn)單地理解,SEO是一個(gè)從自然搜索結(jié)果中獲取網(wǎng)站流量的手段和過(guò)程;

更加嚴(yán)謹(jǐn)?shù)厝ザx的話,SEO是一個(gè)“在了解搜索引擎自然排名機(jī)制的基礎(chǔ)上,對(duì)網(wǎng)站進(jìn)行內(nèi)部和外部的調(diào)整和優(yōu)化,改進(jìn)網(wǎng)站在搜索引擎中的關(guān)鍵詞自然排名,以便爭(zhēng)奪流量,進(jìn)而促成網(wǎng)站銷(xiāo)售或品牌曝光”的一個(gè)過(guò)程。


快速解鎖搜索引擎的幾大知識(shí)點(diǎn)


知識(shí)點(diǎn)2:為什么要做SEO?

網(wǎng)站所有者都希望自己的網(wǎng)站流量越大越好,無(wú)論網(wǎng)站盈利模式和目標(biāo)是什么,有人訪問(wèn)是前提。SEO則是給網(wǎng)站帶來(lái)訪問(wèn)者的最好方法。讓我們一起來(lái)了解一下SEO的“優(yōu)勢(shì)”:

低成本:雖可能會(huì)產(chǎn)生費(fèi)用,但成本相對(duì)較低

高回報(bào):來(lái)自SEO的用戶(hù)多數(shù)情況下是在 “主動(dòng)地找尋” 酒店,目標(biāo)非常精準(zhǔn)

可遷移:搜索引擎是用戶(hù)搜索、比較、購(gòu)買(mǎi)商品的重要渠道,即便移動(dòng)互聯(lián)網(wǎng)發(fā)展迅猛,SEO核心仍在,只不過(guò)載體有所變化

夠持久:精準(zhǔn)廣告投放、付費(fèi)搜索等類(lèi)型推廣模式,一旦停止投放,流量將急劇下降;線上活動(dòng)等事件營(yíng)銷(xiāo)效果明顯,但話題過(guò)后流量隨即下降。而搜索排名一旦上去,可相對(duì)穩(wěn)定地維持比較久的時(shí)間,流量也因此會(huì)源源不斷地輸送過(guò)來(lái)

可擴(kuò)展:掌握關(guān)鍵詞研究和內(nèi)容擴(kuò)展方法后,我們可以持續(xù)地,為網(wǎng)站增加目標(biāo)關(guān)鍵詞及流量

知識(shí)點(diǎn)3:移動(dòng)互聯(lián)時(shí)代,還需要做SEO嗎?

讓我們來(lái)看一些行業(yè)調(diào)查數(shù)據(jù),了解一下SEO是否還有效?

2017 年上半年,即時(shí)通信、搜索引擎、網(wǎng)絡(luò)新聞作為基礎(chǔ)的互聯(lián)網(wǎng)應(yīng)用,用戶(hù)規(guī)模趨于穩(wěn)定,搜索引擎應(yīng)用繼續(xù)保持移動(dòng)化趨勢(shì)。

雖然即時(shí)通信作為移動(dòng)互聯(lián)網(wǎng)流量核心入口的地位已經(jīng)確立。在新網(wǎng)民各類(lèi)應(yīng)用中的滲透率排名第一,高于排名第二的搜索引擎16. 9個(gè)百分點(diǎn),但搜索引擎在目前仍舊穩(wěn)居第二位。

截至 2017 年6 月,我國(guó)搜索引擎用戶(hù)規(guī)模達(dá) 6.09 億,使用率為81.1%,用戶(hù)規(guī)模較 2016 年底增加707 萬(wàn),增長(zhǎng)率為1.2%

知識(shí)點(diǎn)4:搜索引擎的工作原理?

面對(duì)數(shù)以萬(wàn)億的信息,搜索引擎如何做到在 1 秒鐘甚至更短的時(shí)間內(nèi),返回我們想要的內(nèi)容?回答這個(gè)問(wèn)題,需要對(duì)搜索引擎工作原理做個(gè)分解,大致分為 3個(gè)階段:

爬行和抓?。核阉饕娉绦蛲ㄟ^(guò)訪問(wèn)網(wǎng)頁(yè),獲得頁(yè)面HTML代碼存入數(shù)據(jù)庫(kù)

預(yù)處理:程序?qū)?shù)據(jù)庫(kù)網(wǎng)頁(yè)進(jìn)行一系列處理,為排名程序調(diào)用做準(zhǔn)備

排名:用戶(hù)輸入關(guān)鍵詞后,程序調(diào)用預(yù)處理好的數(shù)據(jù),計(jì)算相關(guān)性,生成結(jié)果

首先看第一階段,即 “爬行和抓取”

對(duì)于搜索引擎來(lái)說(shuō),首要任務(wù)是完成對(duì)互聯(lián)網(wǎng)內(nèi)網(wǎng)頁(yè)數(shù)據(jù)收集。而用于數(shù)據(jù)收集的工具,就是我們常常聽(tīng)到的“蜘蛛”,它是搜索引擎用來(lái)爬行和訪問(wèn)頁(yè)面的程序。蜘蛛發(fā)出頁(yè)面訪問(wèn)請(qǐng)求后,服務(wù)器返回HTML代碼,蜘蛛把收到的代碼存入數(shù)據(jù)庫(kù)中。蜘蛛會(huì)對(duì)鏈接進(jìn)行跟蹤,根據(jù)一個(gè)頁(yè)面上的鏈接,爬行(讀取)至下一個(gè),這也是為什么被人稱(chēng)之為“蜘蛛”。


快速解鎖搜索引擎的幾大知識(shí)點(diǎn)


在數(shù)據(jù)收集過(guò)程中,聰明的蜘蛛為了提升效率,避免重復(fù)讀取網(wǎng)頁(yè)數(shù)據(jù),搜索引擎會(huì)建立地址庫(kù),記錄 “被讀取的”,和 “發(fā)現(xiàn)但未被讀取的”頁(yè)面。構(gòu)建原始頁(yè)面數(shù)據(jù)庫(kù),以?xún)?chǔ)存讀取后的頁(yè)面數(shù)據(jù)。

讀取結(jié)束,構(gòu)建好原始數(shù)據(jù)庫(kù)后,搜索引擎將進(jìn)行第二階段的任務(wù) - “預(yù)處理”。什么是 “預(yù)處理”呢?原始數(shù)據(jù)庫(kù)中存在數(shù)以萬(wàn)億的網(wǎng)頁(yè)數(shù)據(jù),排名程序無(wú)法做到每時(shí)每刻,對(duì)數(shù)量如此龐大的數(shù)據(jù)進(jìn)行分析,也就無(wú)法在1- 2秒內(nèi)返回搜索結(jié)果。因此必須處理這些數(shù)據(jù),為最后排名程序調(diào)用做準(zhǔn)備。

預(yù)處理的第一步是對(duì)數(shù)據(jù)進(jìn)行篩選,去除無(wú)用的信息,提取文字?,F(xiàn)在搜索引擎仍以文字內(nèi)容為基礎(chǔ),數(shù)據(jù)庫(kù)中的頁(yè)面數(shù)據(jù),除了我們?cè)诰W(wǎng)頁(yè)上看到的文字外,還包含HTML標(biāo)簽、JavaScript程序等無(wú)法用于排名的內(nèi)容。程序需要去除這些無(wú)用信息,提取出可用于排名的內(nèi)容。除文字外,程序也會(huì)提取出一些特殊的包含文字信息的代碼,例如Meta標(biāo)簽中的文字、圖片替代文字、Flash文件的替代文字、鏈接錨文字等。

隨后,我們需要介紹一個(gè)小知識(shí),即中文搜索引擎所獨(dú)有的步驟 - “中文分詞”?!霸~”是程序處理數(shù)據(jù)、用戶(hù)查詢(xún)的單位和基礎(chǔ)。與英文不同,搜索引擎必須區(qū)分用戶(hù)搜索的中文內(nèi)容里,哪幾個(gè)字組成一個(gè)單詞,才能進(jìn)行下一步工作。

在分詞過(guò)后,程序需要進(jìn)行另一個(gè)步驟,即剔除 “停止詞”。在任何語(yǔ)言里,都存在出現(xiàn)頻率高,但對(duì)內(nèi)容影響不大的詞匯,例如中文“的”、“啊”、“卻”;英文中 “the” “a” “and” “to”“of”等。這些被稱(chēng)作“停止詞”,程序會(huì)去除這些停止詞,使搜索內(nèi)容更突出,減少程序計(jì)算上內(nèi)耗。

此外程序會(huì)對(duì)版權(quán)聲明文字、導(dǎo)航欄文字等對(duì)搜索無(wú)用的內(nèi)容進(jìn)行剔除,消除噪聲。

緊接著,程序還會(huì)對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行去重,同一內(nèi)容可能會(huì)重復(fù)發(fā)布在多個(gè)網(wǎng)站,為了避免將多篇重復(fù)的內(nèi)容返回給擁護(hù),所以需要在預(yù)先剔除重復(fù)內(nèi)容。

在完成上述后,程序得到的是 “獨(dú)特的,能反應(yīng)頁(yè)面主題的,以詞匯為單位的” 內(nèi)容,緊隨其后,程序?qū)⒄蛩饕?。通過(guò)提取關(guān)鍵詞,把內(nèi)容轉(zhuǎn)化成“以關(guān)鍵詞為單位” 的集合,同時(shí)記錄關(guān)鍵詞出現(xiàn)頻次、格式(黑體、加粗錨文字)、位置(標(biāo)題、頁(yè)面段首、段尾)等屬性。然后將其轉(zhuǎn)化為如下結(jié)構(gòu),儲(chǔ)存進(jìn)數(shù)據(jù)庫(kù):

經(jīng) “正向索引” 后的數(shù)據(jù),無(wú)法直接排名,因?yàn)橥魂P(guān)鍵詞可能出現(xiàn)在多個(gè)文件中,所以聰明的程序猿們,發(fā)明了 “倒排索引”,將文件重新構(gòu)造為倒排索引:

現(xiàn)在,搜索引擎已經(jīng)做好了隨時(shí)處理用戶(hù)搜索請(qǐng)求的準(zhǔn)備,那么隨之而來(lái)的,就是搜索引擎第三階段的任務(wù),即排名。


快速解鎖搜索引擎的幾大知識(shí)點(diǎn)


每當(dāng)搜索引擎接受到用戶(hù)搜索的內(nèi)容后,會(huì)進(jìn)行這樣的處理:

分詞(與預(yù)處理一樣,將我們搜索的內(nèi)容,劃分為以“詞”為基礎(chǔ)組合)

剔除停止詞(與預(yù)處理一樣,剔除不相關(guān)詞匯)

指令處理(搜索引擎默認(rèn)是在關(guān)鍵詞之間運(yùn)用 “與”的邏輯)

拼寫(xiě)矯正(對(duì)程序檢測(cè)判定為錯(cuò)誤的內(nèi)容,進(jìn)行矯正)

經(jīng)過(guò)以上處理并進(jìn)行匹配后,程序會(huì)在倒排索引數(shù)據(jù)庫(kù)中找出符合搜索內(nèi)容關(guān)鍵詞的文件集合。例如,搜索內(nèi)容包括 “關(guān)鍵詞1”“關(guān)鍵詞2”,排名程序僅需要找到含有這 2 個(gè)關(guān)鍵詞的文件,即 “文件2” “文件3”。

由于數(shù)量龐大,因此搜索引擎程序不會(huì)對(duì)這些龐大的數(shù)據(jù)進(jìn)行處理,只會(huì)針對(duì)最重要的部分頁(yè)面數(shù)據(jù)進(jìn)行排名,此外用戶(hù)通常也只會(huì)查看前兩頁(yè)搜索結(jié)果,因此,搜索引擎也不需要大費(fèi)周折地去對(duì)所有數(shù)據(jù)進(jìn)行排名。那么,怎樣針對(duì)“最重要的部分頁(yè)面數(shù)據(jù)” 去排名呢,這里就要依賴(lài)于自身算法 - 相關(guān)性計(jì)算的幫助,該算法會(huì)計(jì)算某個(gè)頁(yè)面數(shù)據(jù)與用戶(hù)搜索內(nèi)容的相關(guān)性,從而完成排名。

到這里,搜索引擎已基本完成用戶(hù)的 “搜索請(qǐng)求”,但根據(jù)2/ 8定律,約20%的搜索內(nèi)容,占總搜索次數(shù)的80%左右。搜索引擎會(huì)把常見(jiàn)詞匯的排名以及數(shù)據(jù)進(jìn)行緩存,在用戶(hù)搜索時(shí)會(huì)直接調(diào)用緩存數(shù)據(jù),從而減少一系列龐大又耗能的步驟,縮短反饋時(shí)間、提升用戶(hù)體驗(yàn)。

當(dāng)前標(biāo)題:快速解鎖搜索引擎的幾大知識(shí)點(diǎn)
文章來(lái)源:http://www.rwnh.cn/news/27142.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站動(dòng)態(tài)網(wǎng)站、關(guān)鍵詞優(yōu)化小程序開(kāi)發(fā)、云服務(wù)器品牌網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)
三门峡市| 札达县| 淮安市| 孝感市| 清远市| 郎溪县| 华安县| 循化| 积石山| 乡城县| 峡江县| 来安县| 东港市| 应城市| 康定县| 图们市| 德保县| 博乐市| 赤城县| 平阴县| 凤台县| 大石桥市| 云霄县| 黑山县| 白河县| 仪陇县| 靖西县| 阳江市| 东阿县| 宁阳县| 新巴尔虎左旗| 郎溪县| 福安市| 宝兴县| 云霄县| 修文县| 高要市| 昌黎县| 嘉定区| 宜昌市| 沈丘县|