中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

百度分詞理論之標題的設計實例解析

2021-09-23    分類: 網(wǎng)站建設

影響一個頁面在搜索引擎排名最重要的因素之一是相關度,而最直接體現(xiàn)一個頁面與用戶搜索行為是否相關的就是標題,那么想寫好一個標題你就不能不去深入的了解搜索引擎的分詞原理!以百度為例,經(jīng)過十年左右的完善,在中文搜索里百度已經(jīng)是一個非常高效的搜索引擎,大家也和點水一樣肯定都知道一個高效的搜索引擎工作肯定會涉及到很多不為人知的技術點,但我們?nèi)绻褟碗s的搜索引擎工作簡化為三個步驟那么分別是:查詢,分詞,匹配。那我們通過實例來看看搜索引擎是如何處理的呢,為了能理解的更加直觀,我們以水手(年輕時很喜歡這首歌)為主關健詞在百度進行實驗。

一 搜索引擎如何處理查詢

1,搜索引擎的被動行為。

如果用戶根據(jù)自已的意愿在搜索的關健詞的時候有加上空格,標點,那么搜索引擎會優(yōu)化按用戶的行為進行查詢,這個應該很好理解!例如:百度搜索 鄭智化水手與搜索 鄭智化 水手,所返回的結果會是不一樣的!可能這個例子還并不直觀,舉一個更直觀的例子,分別搜索:鄭智化 學 和 鄭智 化學。搜索結果分別如下圖:

2,搜索引擎的主動行為

搜索引擎收到用戶的搜索內(nèi)容,會根據(jù)自已基礎詞典與特殊詞庫為用戶的查詢進行主動分詞,如搜索:鄭智化水手,百度會根據(jù)其搜索詞庫(猜測為:人名庫+歌名庫)智能將鄭智化與水手這兩個詞分別進行查詢,搜索結果如: 那么如果搜索內(nèi)容中包含同時中文與英文百度是如何處理的呢百度會將英文做為單獨的一塊來處理,然后英文前后的詞也做為一個單獨的塊。試搜索:鄭智化bt下載,結果如下:

二,搜索引擎如何進行分詞與匹配

分詞根據(jù)字符串進行匹配,最常見的有三種分詞匹配法,分別為:正向大匹配法,反向大匹配法和最短路徑分詞法。

1,什么是正向大匹配法呢

簡單點說就是從左到右進行分詞,例如百度:武林外傳說,武林外傳與傳說是兩個不同的詞,根據(jù)用戶搜索習慣與詞庫分析百度會返回一個正向大的匹配,也就是分詞為:武林外傳說。搜索結果如下圖:

2,什么是反向大匹配法

反向分詞固名思義就是從右向左進行分詞了。回到剛才的例子,百度:鄭智化學,如果按照正向分詞那么我們應該得到的分詞結果是:鄭智化學。那么百度搜索的結果為什么卻不是這樣呢而是分成了鄭智 化學。

3,正反向同時分詞匹配

而有一種特殊的情況,就是關健詞前后組合內(nèi)容被認為粘性相差不大,而搜索結果輥也同時包含這兩組詞的話,百度會進行正反向同時進行分詞匹配,如搜索關健詞:北京華煙云,返回結果如下:

4,什么是分詞最少化

指:分出來的詞數(shù)應該是最求最少化,以搜索:武林外傳說 為例,理論可以分成:武林 外 傳說,可是百度只分成了 武林外傳 說,即能盡量將分組數(shù)減少,能分成兩組的盡量不分成三組!

分享文章:百度分詞理論之標題的設計實例解析
標題鏈接:http://www.rwnh.cn/news/128062.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、ChatGPT企業(yè)建站、網(wǎng)站設計公司、網(wǎng)頁設計公司、響應式網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

手機網(wǎng)站建設
阳春市| 德格县| 公安县| 蒲城县| 安仁县| 遂川县| 福清市| 乌审旗| 陵川县| 洮南市| 高尔夫| 浮山县| 武宣县| 西峡县| 三穗县| 锦州市| 历史| 平罗县| 顺昌县| 合川市| 泸水县| 天台县| 万荣县| 梓潼县| 东山县| 福安市| 平昌县| 东至县| 舞阳县| 亳州市| 临洮县| 澳门| 柏乡县| 龙岩市| 彭州市| 登封市| 墨脱县| 东城区| 保靖县| 镇江市| 望奎县|