小編給大家分享一下python爬蟲(chóng)cookie中怎么實(shí)現(xiàn)文件保存,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
十年建站經(jīng)驗(yàn), 網(wǎng)站設(shè)計(jì)制作、成都做網(wǎng)站客戶的見(jiàn)證與正確選擇。創(chuàng)新互聯(lián)建站提供完善的營(yíng)銷型網(wǎng)頁(yè)建站明細(xì)報(bào)價(jià)表。后期開(kāi)發(fā)更加便捷高效,我們致力于追求更美、更快、更規(guī)范。
如果我們想將cookie保存到文件中該怎么做呢?這時(shí),我們就要用到
FileCookieJar這個(gè)對(duì)象了,在這里我們使用它的子類MozillaCookieJar來(lái)實(shí)現(xiàn)Cookie的保存
import cookielib import urllib2 #設(shè)置保存cookie的文件,同級(jí)目錄下的cookie.txt filename = 'cookie.txt' #聲明一個(gè)MozillaCookieJar對(duì)象實(shí)例來(lái)保存cookie,之后寫(xiě)入文件 cookie = cookielib.MozillaCookieJar(filename) #利用urllib2庫(kù)的HTTPCookieProcessor對(duì)象來(lái)創(chuàng)建cookie處理器 handler = urllib2.HTTPCookieProcessor(cookie) #通過(guò)handler來(lái)構(gòu)建opener opener = urllib2.build_opener(handler) #創(chuàng)建一個(gè)請(qǐng)求,原理同urllib2的urlopen response = opener.open("http://www.baidu.com") #保存cookie到文件 cookie.save(ignore_discard=True, ignore_expires=True)
由此可見(jiàn),ignore_discard的意思是即使cookies將被丟棄也將它保存下來(lái),ignore_expires的意思是如果在該文件中cookies已經(jīng)存在,則覆蓋原文件寫(xiě)入,在這里,我們將這兩個(gè)全部設(shè)置為T(mén)rue。運(yùn)行之后,cookies將被保存到cookie.txt文件中,我們查看一下內(nèi)容,附圖如下
以上是“python爬蟲(chóng)cookie中怎么實(shí)現(xiàn)文件保存”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
當(dāng)前標(biāo)題:python爬蟲(chóng)cookie中怎么實(shí)現(xiàn)文件保存
URL鏈接:http://www.rwnh.cn/article32/jsccpc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、網(wǎng)站導(dǎo)航、面包屑導(dǎo)航、品牌網(wǎng)站制作、網(wǎng)站排名、網(wǎng)站內(nèi)鏈
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)