中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

EasyOCR的使用

001-OCR光學(xué)文字識(shí)別

創(chuàng)新互聯(lián)是專業(yè)的克井網(wǎng)站建設(shè)公司,克井接單;提供成都網(wǎng)站制作、成都做網(wǎng)站,網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行克井網(wǎng)站開發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!

一、OCR簡(jiǎn)介

OCR(Optical Character Recognition,光學(xué)文字識(shí)別)是指電子設(shè)備檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程;即針對(duì)印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過(guò)識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。

各種場(chǎng)景都有OCR的身影,我們可以在任何地方使用到OCR。Python中常見的OCR有EasyOCR、PaddleOCR等,接下來(lái)我們以EasyOCR為例,演示其如何使用。

二、EasyOCR使用

EasyOCR是一個(gè)免費(fèi)開源的OCR模塊,其有自己的一系列的訓(xùn)練好的模型,借助這些模型,我們就可以識(shí)別各種場(chǎng)景下的文字。

Github鏈接:https://github.com/JaidedAI/EasyOCR

EasyOCR官網(wǎng):https://www.jaided.ai/easyocr/

首先我們先來(lái)安裝OCR:

Windows:pip install easyocr;Mac/Linux:pip3 install easyocr

安裝完成以后

我們直接寫代碼即可

1.導(dǎo)入easyocr模塊

import easyocr

 2.實(shí)例化Reader類

Reader類中有幾個(gè)參數(shù)我們需要手動(dòng)修改

lang_list:告訴它我們要識(shí)別的語(yǔ)言,以列表的形式傳參,可以一次傳遞多種語(yǔ)言,但并非所有語(yǔ)言都可以一起使用,截止到2022年12月19日,已經(jīng)支持80+種語(yǔ)言。這是目前支持的語(yǔ)言的鏈接:https://www.jaided.ai/easyocr/。我們這里寫的ch_sim是簡(jiǎn)體中文,en是英文。

gpu:會(huì)讓你選擇使用cpu驅(qū)動(dòng)還是gpu驅(qū)動(dòng),使用gpu驅(qū)動(dòng)識(shí)別速度會(huì)更快一些,但是所要配置的環(huán)境也更復(fù)雜,如果有興趣,可以自行研究一下,這里我們就使用cpu,將gpu改為False。

download_enabled:easyocr第一次運(yùn)行時(shí)會(huì)先在線下載模型數(shù)據(jù),但是鑒于網(wǎng)絡(luò)不好,大部分人下載時(shí)都會(huì)發(fā)生錯(cuò)誤,所以將download_enabled改為False,我們手動(dòng)去下載模型數(shù)據(jù)。

model_storage_directory:這個(gè)參數(shù)是指定模型數(shù)據(jù)的引用路徑,默認(rèn)情況下在Windows系統(tǒng)中存放在C:\Users\用戶名\.EasyOCR\model中,在Mac/Linux系統(tǒng)中存放在~/.EasyOCR/model中,我們可以通過(guò)修改model_storage_directory參數(shù)自行指定模型數(shù)據(jù)的路徑,我這里就直接指定相對(duì)路徑為./model。

注意:

除此之外還有很多其他參數(shù),詳情請(qǐng)見源碼。

 

reader = easyocr.Reader(
lang_list=['ch_sim', 'en'],
gpu=False,
download_enabled=False,
model_storage_directory='./model'
)

 

 1.調(diào)用readtext方法

實(shí)例化Reader類以后,調(diào)用readtext方法讀取圖片。

readtext方法中有一個(gè)參數(shù)叫做image,把圖片傳給它即可。image參數(shù)可以接收?qǐng)D片路徑、圖片的numpy數(shù)組或者圖片的字節(jié)流對(duì)象。一般情況下我們直接傳遞圖片路徑即可,除非有要求要針對(duì)圖片做一些特殊處理。

result = reader.readtext(image='圖片')
print(result)

 三、模型下載

剛剛我們說(shuō)將download_enabled參數(shù)改為False,要去手動(dòng)下載模型數(shù)據(jù),這是模型數(shù)據(jù)下載地址:https://www.jaided.ai/easyocr/modelhub/。

ocr1

下載圖中框選中的三個(gè)即可,下載下來(lái)為zip壓縮包,一定要解壓縮,我們需要的是其中的后綴名為pth的文件,并將其移動(dòng)到我們自己創(chuàng)建的**model**文件夾中。因?yàn)槲覀円鑫淖肿R(shí)別就一定要有CRAFT,我們識(shí)別的大部分為簡(jiǎn)體中文和英文,所以下載zh_sim_g2和english_g2。當(dāng)然,如果你要識(shí)別其他語(yǔ)言,請(qǐng)?jiān)俅握移渌Z(yǔ)言的模型數(shù)據(jù)。

四、圖片

在此提供幾張圖片,供大家測(cè)試。

OCR2

按照官方的說(shuō)法,準(zhǔn)確率在90%以上,但是碰到識(shí)別不出來(lái)或者識(shí)別錯(cuò)誤的概率還是蠻大的。

ocr3


網(wǎng)站名稱:EasyOCR的使用
分享URL:http://www.rwnh.cn/article24/dgpjpce.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、網(wǎng)站制作手機(jī)網(wǎng)站建設(shè)外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站改版、全網(wǎng)營(yíng)銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作
宿迁市| 垫江县| 新泰市| 阿拉善左旗| 伊宁县| 喀什市| 栾城县| 建始县| 卢龙县| 静乐县| 宁明县| 隆化县| 西宁市| 定安县| 句容市| 满城县| 库伦旗| 泰安市| 山东| 乐都县| 辉南县| 山阴县| 海盐县| 马鞍山市| 武穴市| 菏泽市| 邹城市| 汉源县| 崇阳县| 酒泉市| 个旧市| 武汉市| 临西县| 黑水县| 健康| 洮南市| 小金县| 县级市| 三明市| 古蔺县| 琼海市|