2022-07-18 分類: 網(wǎng)站建設
設計爬蟲時,通常都回避動態(tài)網(wǎng)頁(如Charkabarti,Joshi,Punera,&Pennock,2002)。識別動態(tài)網(wǎng)頁時,只需要看URL中是否出現(xiàn)問號,含問號的就是動態(tài)網(wǎng)頁。忽略動態(tài)網(wǎng)頁是因為它們?nèi)菀自斐芍┲胂葳?。蜘蛛陷阱理論上是一個無限的網(wǎng)頁集合,而蜘蛛永遠不能完整地遍歷這個集合。在線日歷就是一個容易被忽略的蜘蛛陷阱,它生成的動態(tài)網(wǎng)頁中可以標上任何日期,并包含指向后一天網(wǎng)頁的鏈接。一個爬蟲從這個日歷中找到一個網(wǎng)頁后,便會無止境地請求后一天的網(wǎng)頁。
動態(tài)的頁面(url)屬于蜘蛛陷阱,搜索引擎蜘蛛一旦爬行進入,很有可能會出不來、或是難以流暢的抓取,所以建議網(wǎng)頁一定是靜態(tài)或是經(jīng)過偽靜態(tài)處理的。
文章題目:動態(tài)頁面會對SEO產(chǎn)生什么影響
URL分享:http://www.rwnh.cn/news34/180784.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供服務器托管、企業(yè)建站、定制開發(fā)、軟件開發(fā)、網(wǎng)頁設計公司、品牌網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容