2023-04-01 分類(lèi): 搜索引擎優(yōu)化
研討搜索引擎的分詞技能,無(wú)論是對(duì)用戶的檢索仍是對(duì)搜索引擎優(yōu)化都具有非常重要的意義。分詞又叫做切詞,是將連續(xù)的自序列按照一定的規(guī)范從頭組合成詞序列的進(jìn)程。
分詞的原理:中文分詞分類(lèi):
(1)依據(jù)字符串的匹配也便是機(jī)械分詞法。機(jī)械分詞法的原理是將查找欄的字符串與一個(gè)巨大的機(jī)器字典中的詞進(jìn)行匹配。常見(jiàn)的三種匹配辦法:第一種是正向匹配,比如走路和氣質(zhì),它會(huì)切分為走路、和氣質(zhì)。第二種是逆向匹配,假如用逆向匹配法走路和氣質(zhì)它會(huì)拆分為走路、和、氣質(zhì)。第三種是最少切分法,它是使每一句中切出的詞數(shù)量最少,還可以將上述的辦法相互結(jié)合。比如說(shuō)雙向匹配,一般來(lái)說(shuō)逆向匹配的切分精度越高于正向匹配,遇到的歧義現(xiàn)象也比較少。
(2)依據(jù)理解的分詞辦法。指在分詞的一起進(jìn)行句法、語(yǔ)義的剖析,使用句法信息和語(yǔ)言信息來(lái)處理歧義現(xiàn)象。
(3)依據(jù)計(jì)算的分詞辦法。是依據(jù)漢字共同呈現(xiàn)的頻率來(lái)分詞。
以百度搜索引擎為例:百度搜索引擎有一個(gè)專(zhuān)有詞典,分詞時(shí)首要查詢專(zhuān)有詞典(人名、部分地名等),將專(zhuān)有名稱切出,剩下的部分采納雙向分詞戰(zhàn)略,假如兩者切分成果相同,說(shuō)明沒(méi)有歧義,直接輸出分詞成果。假如不一致,則輸出最短路徑的那個(gè)成果,假如長(zhǎng)度相同,則挑選單字詞少的那一組切分成果。相關(guān)閱讀:描述標(biāo)簽對(duì)網(wǎng)站排名的影響
百度一起做出多種分詞辦法,首要不拆分進(jìn)行查找,然后先辨認(rèn)專(zhuān)有名詞和新詞,再對(duì)其余部分進(jìn)行拆分,選用雙向匹配的辦法。
本文標(biāo)題:分詞對(duì)搜索引擎優(yōu)化的影響
文章起源:http://www.rwnh.cn/news/249613.html
網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián),是專(zhuān)注品牌與效果的網(wǎng)站制作,網(wǎng)絡(luò)營(yíng)銷(xiāo)seo公司;服務(wù)項(xiàng)目有搜索引擎優(yōu)化等
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容