當(dāng)前,電子商務(wù)折扣網(wǎng)站存在先天的局限性,越來越跟不上時(shí)代發(fā)展的要求。開發(fā)一個(gè)可以精確搜索網(wǎng)絡(luò)折扣 信息的搜索引擎,成為電商營(yíng)銷領(lǐng)域關(guān)切的問題。遵循精確搜索引擎的基本框架,綜合使用文檔解析算法、信息提取算法、 規(guī)則匹配算法以及相關(guān)文檔的生成算法進(jìn)行優(yōu)化設(shè)計(jì),建構(gòu)了電子商務(wù)營(yíng)銷領(lǐng)域精確搜索引擎的應(yīng)用模型。實(shí)驗(yàn)表明,這個(gè) 應(yīng)用模型具備獲取較為準(zhǔn)確和全面的折扣信息的能力,并具有良好的精度和響應(yīng)速度。
在快速發(fā)展和普及網(wǎng)絡(luò)科技的今天,各式各樣的營(yíng)銷模式紛紛出現(xiàn),電子商務(wù)銷售就是最具代表性且 運(yùn)用最為廣泛的網(wǎng)絡(luò)銷售模式之一。電子商務(wù)網(wǎng)站銷售的促銷給消費(fèi)者帶來了各種形式實(shí)惠和便利。但是,
網(wǎng)絡(luò)營(yíng)銷網(wǎng)站有一定局限性,比如為用戶提供具有時(shí)效性、精準(zhǔn)度的各種折扣信息的能力不足,通過網(wǎng)站 的搜索引擎到結(jié)果的用戶并不是都能夠準(zhǔn)確找到想要的、有針對(duì)性的打折信息。如果網(wǎng)絡(luò)營(yíng)銷折扣網(wǎng)站從 用戶的角度進(jìn)行設(shè)計(jì),利用Web數(shù)據(jù)來挖掘并提供個(gè)性化信息檢索等技術(shù)支持支持這些網(wǎng)站的折扣信息搜 索,同時(shí)通過基于ISML標(biāo)記語(yǔ)言,經(jīng)過Web內(nèi)容挖掘,再把所有互聯(lián)網(wǎng)上的網(wǎng)頁(yè)被轉(zhuǎn)換成HTLM語(yǔ)言 格式,便使得基于電子商務(wù)ISML標(biāo)記語(yǔ)言格式縮小搜索范圍同時(shí)更加個(gè)性化。因此,對(duì)于電子商務(wù)網(wǎng)站 銷售活動(dòng)提供及時(shí)、準(zhǔn)確的折扣信息,有很大的應(yīng)用價(jià)值和現(xiàn)實(shí)意義。
一、當(dāng)前主流的應(yīng)用搜索引擎技術(shù)的現(xiàn)況分析
(一)電子商務(wù)營(yíng)銷技術(shù)性分析
技術(shù)性是網(wǎng)絡(luò)銷售平臺(tái)被外部環(huán)境支持的程度,其中包括電商企業(yè)、技術(shù)服務(wù)平臺(tái)、供應(yīng)鏈環(huán)境、消 費(fèi)者意識(shí)、計(jì)算機(jī)操作能力和消費(fèi)習(xí)慣能否有力支持電子商務(wù)網(wǎng)絡(luò)營(yíng)銷的設(shè)計(jì)和開展。我們討論的技術(shù)性 僅網(wǎng)銷平臺(tái)設(shè)計(jì)和使用技術(shù)的范疇,主要包括通信網(wǎng)絡(luò)技術(shù)和安全技術(shù)兩個(gè)方面。
1.網(wǎng)絡(luò)通信技術(shù)。當(dāng)前我們使用的網(wǎng)絡(luò)基本上是通過TCP/IP協(xié)議進(jìn)行通信,可分為企業(yè)內(nèi)部網(wǎng)、企業(yè) 外部網(wǎng)和互聯(lián)網(wǎng),該通信協(xié)議基本能夠滿足企業(yè)之間的內(nèi)部管理運(yùn)用及企業(yè)之間根據(jù)相互約定的規(guī)則形成 一套非常有效的信息交換系統(tǒng),并通過此系統(tǒng)改善生產(chǎn)、運(yùn)作、合作的水平。
2.網(wǎng)絡(luò)安全技術(shù)。安全問題主要來自于網(wǎng)絡(luò)安全技術(shù)本身的設(shè)計(jì)缺陷,在運(yùn)用于交易過程中一般會(huì)包 含以下幾類需要注意的問題:(1)隱私問題,涉及諸多的非公開信息,如姓名、賬號(hào)、密碼、交易對(duì)象、 數(shù)量、金額等;(2)身份認(rèn)證,例如賬號(hào)盜用、網(wǎng)絡(luò)詐騙、虛假交易等行為層出不窮;(3)信息完整性, 在交易中包含著身份信息、交易過程各個(gè)環(huán)節(jié)的信息要完整可靠,要有整套交易記錄;(4)不可抵賴性,要有交易過程的證明,證明應(yīng)該具有權(quán)威性、不可抵賴性和防篡改性。
總體而言,當(dāng)前電子商務(wù)營(yíng)銷領(lǐng)域技術(shù)基礎(chǔ)已經(jīng)足夠滿足一般網(wǎng)絡(luò)用戶的使用需求,電商企業(yè)在其運(yùn) 營(yíng)和發(fā)展的過程中可以運(yùn)用搜索引擎等網(wǎng)絡(luò)技術(shù)工具。
(二)電子商務(wù)營(yíng)銷實(shí)效性分析 我們通過單因素方差測(cè)試與分析,把選取的各搜索引擎的相關(guān)性進(jìn)行比對(duì),從而來分析它們之間的時(shí) 效性。如表1所示。
通過三個(gè)不同的搜索引擎的比較研究可以計(jì)算出F(0.05, 2192 1)= 2.9957。因此,不同的搜索引擎有一定的算法和精度的差異。顯然,雅虎的有效性比百度和谷歌的有效性更高(見表1)。因此,不同精度的搜 索引擎對(duì)通過電子商務(wù)購(gòu)物的消費(fèi)者來說,將對(duì)搜索的結(jié)果產(chǎn)生不同的差異。精確度較高的搜索引擎網(wǎng)絡(luò) 搜索引擎優(yōu)化和設(shè)計(jì)的精密性程度對(duì)電子商務(wù)
網(wǎng)絡(luò)營(yíng)銷有很大影響,電商企業(yè)借助高精度的搜索引擎能夠 實(shí)現(xiàn)商品信息的精準(zhǔn)推送,以便在整個(gè)銷售過程中占據(jù)有利地位。
二、電子商務(wù)營(yíng)銷搜索引擎的精確度優(yōu)化設(shè)計(jì)
(一)精確搜索引擎的基礎(chǔ)框架
收集索引和查詢模塊是常規(guī)搜索引擎的兩個(gè)主要部分。而精確搜索引擎不但這兩個(gè)部分,同時(shí)增加了 分析模塊和ISML語(yǔ)言標(biāo)志設(shè)計(jì)的格式轉(zhuǎn)換模塊。當(dāng)前,大多數(shù)在互聯(lián)網(wǎng)上(Internet)的頁(yè)面是使用HTML 和XML編寫的。如果是運(yùn)用XML編寫的網(wǎng)頁(yè),高精確度的搜索引擎需要先XML數(shù)據(jù)源轉(zhuǎn)換HTML文 檔格式,然后通過分析儀將它轉(zhuǎn)換成一個(gè)固定網(wǎng)站主題模式,并將這些網(wǎng)站模型通過轉(zhuǎn)換模塊將ISML語(yǔ)言 標(biāo)記,這是整個(gè)轉(zhuǎn)換的基本過程和功能模塊?;陔娮由虅?wù)精確搜索引擎模型可以設(shè)計(jì)成由以下六個(gè)模塊組 成:即蜘蛛機(jī)器人、分析模塊、轉(zhuǎn)換模塊、解析模塊、索引模塊和查詢模塊[4]。如圖1所示。
(二)精確搜索引擎的實(shí)現(xiàn)路徑
信息提取算法、文檔解析算法、規(guī)則匹配算法及相關(guān)性文檔生成算法是精確搜索引擎設(shè)計(jì)的主要幾個(gè) 部分,其構(gòu)思基本邏輯是通過蜘蛛模塊收集、掌握電子商務(wù)銷售網(wǎng)站的相關(guān)信息,然后根據(jù)規(guī)則提取樹模 型和信息提取算法對(duì)信息進(jìn)行進(jìn)一步提取,并在人工注釋的指向下自動(dòng)學(xué)習(xí)信息提取規(guī)則,實(shí)現(xiàn)提高信息 提取精度。
HTML語(yǔ)言文件解析工具是一個(gè)HTML語(yǔ)言的文件結(jié)構(gòu),該結(jié)構(gòu)是由使用標(biāo)識(shí)有限自動(dòng)機(jī)的狀態(tài)轉(zhuǎn) 換圖描述令牌算法,通過HTML格式標(biāo)準(zhǔn)考慮膨脹的各種類型的節(jié)點(diǎn)而設(shè)計(jì)的。所以,HTML文件解析 工具是一個(gè)包括所有的元素層次結(jié)構(gòu)樹且能為自動(dòng)標(biāo)記及其他后續(xù)工作做準(zhǔn)備的集成模塊,它應(yīng)該要同時(shí) 能夠?qū)崿F(xiàn),提取、標(biāo)記、分析等功能。詳細(xì)如下:
輸入:層次結(jié)構(gòu)樹的結(jié)構(gòu)元素
輸出:XML文檔或解析HTML文檔和相關(guān)元素的數(shù)組 過程:
New Elem (“ROOT”):
While (CurToken = GetToken ( ) ) //循環(huán)獲取 HTML 文檔中的 Token {switch (CurToken type)
case COMMENT, PI, CDATA, SECTION, JSTE, PHP, ASP, ENDTAG: CONTINUE;
case DOCTYPE:
//在結(jié)構(gòu)樹根節(jié)點(diǎn)的子節(jié)點(diǎn)里加入遇到的第一個(gè)文件類型 if
InsertElemAtEnd (ElemArray[0],
NewElem (“DOCTYPE”) ); continue; case else html = NewElem (“HTML”) ;
if (CurToken實(shí)施標(biāo)記非HTML元素)
設(shè)置當(dāng)前的Token為未被使用標(biāo)識(shí); else
復(fù)制 CurToken. Attributes 的內(nèi)容到 html attributes;
InsertElemAtEnd (ElemArray[0], html);
調(diào)用ParseHTML分析HTML元素的內(nèi)容;
Exit while;
}}
信息提取算法可以把良好的預(yù)處理器鏈標(biāo)記結(jié)構(gòu)格式標(biāo)簽。它的設(shè)計(jì)主要功能是:要通過提取規(guī)則來 確認(rèn)每個(gè)格式標(biāo)簽字符串在相應(yīng)的內(nèi)容和鏈匹配中是否一致,同時(shí)還要檢查并確認(rèn)鏈的第一個(gè)標(biāo)簽和提取 規(guī)則的ID為0是否一致。
如< ISMLmadefrom ID = 3 / >需求鏈中在當(dāng)前標(biāo)簽字符串包含限定符(商品產(chǎn)地:)和中低標(biāo)簽文本之 間的鏈只包含“< /li >”限定符。以此類推,如果鏈和提取規(guī)則的字符串可以相互匹配到最后格式標(biāo)簽,那么 則匹配成功;如果匹配不成功,用戶再一次進(jìn)行文檔標(biāo)注,同時(shí)形成新的規(guī)則,這是由系統(tǒng)和規(guī)則庫(kù)添加到 匹配規(guī)則,直到最終匹配成功。http://www.rwnh.cn/
此外,因?yàn)樵蕉嗟男畔⑻崛?huì)大大增加規(guī)則庫(kù)的更新頻率,將導(dǎo)致匹配效率低。解決這個(gè)問題可以通 過規(guī)則匹配算法來解決。以下對(duì)基本構(gòu)想作簡(jiǎn)要介紹:
構(gòu)建一個(gè)鏈?zhǔn)浇Y(jié)構(gòu)(如圖2),該結(jié)構(gòu)是根據(jù)一個(gè)根節(jié)點(diǎn)為樹形模型的初始狀態(tài),定義標(biāo)識(shí)各個(gè)提取信 息規(guī)則然后先后加入該鏈?zhǔn)浇Y(jié)構(gòu)中,用于匹配信息數(shù)據(jù)標(biāo)識(shí),匹配若不成功,就將該匹配失敗的規(guī)則后續(xù) 部分鏈接到前一次匹配成功的節(jié)點(diǎn)上,讓程序完成所有匹配指令;匹配若成功,則由鏈?zhǔn)浇Y(jié)構(gòu)繼續(xù)匹配后 續(xù)內(nèi)容。
該鏈?zhǔn)浇Y(jié)構(gòu)能夠?qū)崿F(xiàn)大量縮短匹配時(shí)間,提高匹配效率的地方在于:在確保每個(gè)節(jié)點(diǎn)標(biāo)簽的各路徑的 節(jié)點(diǎn)表識(shí)相互匹配的基礎(chǔ)上,采用深度遍歷搜索路徑的原理,當(dāng)識(shí)別到某條路徑可以形成關(guān)聯(lián)規(guī)則,則系 統(tǒng)根據(jù)該路徑信息提取相關(guān)標(biāo)簽鏈,然后這些所有別提取的標(biāo)簽鏈將會(huì)比存儲(chǔ)在規(guī)則庫(kù)中,當(dāng)發(fā)生匹配失 敗時(shí)就可以在當(dāng)前節(jié)點(diǎn)調(diào)取規(guī)則庫(kù)進(jìn)行直接再匹配,不用再?gòu)念^開始匹配。這種方法當(dāng)發(fā)生海量規(guī)則標(biāo)簽 的環(huán)境下,其效率優(yōu)勢(shì)將更為明顯。(如圖2所示)
三、電子商務(wù)營(yíng)銷搜索引擎算法的定量分析
精確搜索引擎算法的定量分析主要是通過關(guān)鍵詞提取與檢索實(shí)驗(yàn)來檢驗(yàn)。本實(shí)驗(yàn)把“折800”“名品打折 網(wǎng)”“我要打折網(wǎng)”“名購(gòu)網(wǎng)”“生活美”“通遼打折網(wǎng)”“易購(gòu)打折網(wǎng)”等幾家電子商務(wù)折扣網(wǎng)站加入精確算法的搜 索引擎搜索結(jié)果進(jìn)行實(shí)驗(yàn)并比較。
軟硬件環(huán)境:
CPU:英特爾 I7 4770 3.40GHz 內(nèi)存:DDR3 代,3.64GB;
軟件平臺(tái):.NET 2008平臺(tái),C#編程語(yǔ)言;
操作系統(tǒng):微軟視窗系統(tǒng)7企業(yè)普通版:
數(shù)據(jù)庫(kù)平臺(tái):SQL Server 2008.
為了能夠反映出關(guān)鍵詞對(duì)電商搜索引擎搜索結(jié)果的影響,實(shí)驗(yàn)將選取不同的關(guān)鍵詞來進(jìn)行搜索比較, 同時(shí)還將依照大宗商品綜合性及搜索關(guān)鍵詞的準(zhǔn)確性兩個(gè)特征作為實(shí)驗(yàn)指標(biāo)分別測(cè)試搜索引擎(見表1); 其中在上述兩個(gè)測(cè)試指標(biāo)中,分別選取5個(gè)關(guān)鍵詞進(jìn)行搜索測(cè)試,依照評(píng)價(jià)指標(biāo)對(duì)對(duì)應(yīng)的電商營(yíng)銷平臺(tái)進(jìn) 行評(píng)價(jià)劃分等級(jí)(見表2),最后在表3中匯總各個(gè)電商營(yíng)銷平臺(tái)的實(shí)驗(yàn)結(jié)果。
從表3可以看出,通過對(duì)“折800” “名品打折網(wǎng)” “名購(gòu)網(wǎng)”的等多款搜索引擎進(jìn)行對(duì)比實(shí)驗(yàn),可以看出“折 800”和“名品打折網(wǎng)”大宗商品電子商務(wù)引擎綜合特征檢索精度評(píng)價(jià)分?jǐn)?shù)分居于第一、第二位,證明了電子 商務(wù)搜索引擎可以給客戶一個(gè)最準(zhǔn)確的搜索結(jié)果,說明了精確搜索引擎更大范圍地搜索匹配的商品信息, 的并具有良好的精度和響應(yīng)速度,能夠大大提高用戶的使用效果。http://www.rwnh.cn/
當(dāng)前電子商務(wù)崛起使得網(wǎng)上銷售競(jìng)爭(zhēng)越發(fā)激烈,各種各樣的購(gòu)物網(wǎng)站上優(yōu)惠、折扣、促銷等信息常常 會(huì)使消費(fèi)者眼花繚亂,開發(fā)全球性折扣信息收集的電子商務(wù)網(wǎng)站,具有較高的應(yīng)用價(jià)值和現(xiàn)實(shí)意義,而高 精確度的搜索引擎是該類網(wǎng)站的基本要求?;陔娮由虅?wù)和高精確度搜索引擎模型具有良好的精度和響應(yīng) 速度,能夠更好地折扣信息查詢到相關(guān)產(chǎn)品,提高用戶對(duì)商品信息比對(duì)的效率和搜索體驗(yàn),具有較高的實(shí) 用價(jià)值。
分享題目:電商營(yíng)銷精確搜索引擎的優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)
網(wǎng)頁(yè)路徑:http://www.rwnh.cn/article1/dghioid.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、搜索引擎優(yōu)化、面包屑導(dǎo)航、定制開發(fā)、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站排名
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)