内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

Python爬蟲遇到驗證碼怎么解決

本篇內(nèi)容介紹了“Python爬蟲遇到驗證碼怎么解決”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

創(chuàng)新新互聯(lián),憑借10多年的成都網(wǎng)站建設(shè)、成都網(wǎng)站制作經(jīng)驗,本著真心·誠心服務(wù)的企業(yè)理念服務(wù)于成都中小企業(yè)設(shè)計網(wǎng)站有上千案例。做網(wǎng)站建設(shè),選創(chuàng)新互聯(lián)。

一 前言

中國知網(wǎng)的注冊頁面使用的是這種驗證碼,頁面如下:

Python爬蟲遇到驗證碼怎么解決

二 準(zhǔn)備工作

1 目標(biāo)

以知網(wǎng)的驗證碼為例,利用OCR(Optical Character Recognition 光學(xué)字符識別)技術(shù)識別圖形驗證碼。

2 安裝tesseract

2.2 下載tesseract-ocr-setup-3.05.01.exe

2.3 安裝注意事項

勾選Additional language data(download)選項,這樣可以識別多國語言。

3 安裝tesserocr

pip install tesserocr pillow

安裝好的Tesseract-OCR后,從D:\Program Files (x86)\Tesseract-OCR目錄下,將tessdata文件夾拷貝到下面目錄

E:\WebSpider\venv\Scripts

4 獲取驗證碼

將驗證碼圖形 保存到本地,命名為code.jpg

三 實戰(zhàn)

1 實戰(zhàn)

1.1 代碼

import tesserocr
from PIL import Image
 
image = Image.open('code.jpg')
result = tesserocr.image_to_text(image)
print(result)
 
image = Image.open('code1.jpg')
result = tesserocr.image_to_text(image)
print(result)
 
image = Image.open('code2.jpg')
result = tesserocr.image_to_text(image)
print(result)

1.2 效果

E:\WebSpider\venv\Scripts\python.exe E:/WebSpider/8_1.py
DTKD
JR42
PFRT

1.3 說明

code.jpg是DTKT

code1.jpg是JR42

code2.jpg是PFRT

將結(jié)果和實際圖片進行比較,正確率還是比較高的。

2 實戰(zhàn)2

2.1 代碼

import tesserocr
 
print(tesserocr.file_to_text('code.jpg'))
print(tesserocr.file_to_text('code1.jpg'))
print(tesserocr.file_to_text('code2.jpg'))

2.2 效果

E:\WebSpider\venv\Scripts\python.exe E:/WebSpider/8_1.py
DTKD
.ll?42
FFKT

2.3 說明

code.jpg是DTKT

code1.jpg是JR42

code2.jpg是PFRT

將結(jié)果和實際圖片進行比較,正確率并不是很高。

3 實戰(zhàn)3

3.1 代碼

import tesserocr
from PIL import Image
 
image = Image.open('code2.jpg')
 
image = image.convert('L')
threshold = 127
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
 
image = image.point(table, '1')
image.show()
 
result = tesserocr.image_to_text(image)
print(result)

3.2 效果

E:\WebSpider\venv\Scripts\python.exe E:/WebSpider/8_1.py
PFRT

“Python爬蟲遇到驗證碼怎么解決”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

名稱欄目:Python爬蟲遇到驗證碼怎么解決
文章源于:http://www.rwnh.cn/article30/jsceso.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司服務(wù)器托管網(wǎng)頁設(shè)計公司、外貿(mào)建站網(wǎng)站建設(shè)、企業(yè)網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網(wǎng)站優(yōu)化
图们市| 疏附县| 涡阳县| 沂水县| 防城港市| 中宁县| 临安市| 浠水县| 松阳县| 枣庄市| 嘉禾县| 应用必备| 昆明市| 股票| 无为县| 平阴县| 同心县| 金阳县| 武鸣县| 武陟县| 灵台县| 毕节市| 库伦旗| 北票市| 乃东县| 垣曲县| 兴海县| 阳原县| 巫山县| 曲阜市| 嘉黎县| 潞城市| 金川县| 安宁市| 定结县| 枞阳县| 汝阳县| 巫山县| 仪征市| 濮阳县| 尖扎县|