這篇文章給大家分享的是有關(guān)python爬蟲實(shí)現(xiàn)翻頁的方法的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考。一起跟隨小編過來看看吧。
10多年的平順網(wǎng)站建設(shè)經(jīng)驗(yàn),針對設(shè)計(jì)、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時(shí)及時(shí)工作處理。全網(wǎng)營銷推廣的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整平順建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計(jì),從而大程度地提升瀏覽體驗(yàn)。成都創(chuàng)新互聯(lián)公司從事“平順網(wǎng)站設(shè)計(jì)”,“平順網(wǎng)站推廣”以來,每個(gè)客戶項(xiàng)目都認(rèn)真落實(shí)執(zhí)行。
很多初學(xué)python爬蟲的小伙伴們都會遇到python爬蟲翻頁的問題,我在這里先介紹一種。
需要爬取的網(wǎng)站如圖所示
查詢的這種植物有四頁。當(dāng)我們平時(shí)翻頁時(shí),首先想到肯定是點(diǎn)擊頁面上的下一頁,寫爬蟲也是如此,想提取頁面上的鏈接進(jìn)行訪問。但是這樣做很麻煩,并且效率很低。
翻頁的方式一般有兩種:
1、觀察網(wǎng)站翻頁時(shí)鏈接變化
2、如果寫爬蟲的請求方式是post方式請求,則需要觀察post的數(shù)據(jù)的變化是否有規(guī)律
今天講得是第一種方法
如圖,當(dāng)我點(diǎn)擊下一頁時(shí),觀察到地址欄的鏈接變化
在鏈接中我們可以驚喜的發(fā)現(xiàn),有page關(guān)鍵字,而且恰好為2,我們試驗(yàn)一下,將鏈接中page的值改為3,發(fā)現(xiàn)正常訪問,正好是第三頁。因此,我們找到了翻頁方式,更改鏈接中關(guān)鍵字的值。
因此翻頁過程步驟為:
1、獲取總網(wǎng)頁數(shù)目
2、利用for循環(huán)改變page的值,進(jìn)行翻頁。
具體翻頁代碼實(shí)現(xiàn)如下:
獲取總頁碼
網(wǎng)絡(luò)請求方式
改變請求頭中的page數(shù)值
感謝各位的閱讀!關(guān)于python爬蟲實(shí)現(xiàn)翻頁的方法就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
網(wǎng)頁名稱:python爬蟲實(shí)現(xiàn)翻頁的方法
標(biāo)題URL:http://www.rwnh.cn/article48/pgedhp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、小程序開發(fā)、網(wǎng)頁設(shè)計(jì)公司、網(wǎng)站制作、網(wǎng)站導(dǎo)航、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)