對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解-創(chuàng)新互聯(lián)

筆者小白在收集印刷體漢字的深度學習訓練集的時候，一開始就遇到的了一個十分棘手的問題，就是如何獲取神經(jīng)網(wǎng)絡的訓練集數(shù)據(jù)。通過上網(wǎng)搜素，筆者沒有找到可用的現(xiàn)成的可下載的漢字的訓練集，于是筆者采用了代碼自建漢字的訓練集數(shù)據(jù)。

汾陽ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應用場景，ssl證書未來市場廣闊！成為創(chuàng)新互聯(lián)的ssl證書銷售渠道，可以享受市場價格4-6折優(yōu)惠！如果有意向歡迎電話聯(lián)系或者加微信：13518219792（備注：SSL證書合作）期待與您的合作！

這里采用的是python編寫程序，需要import 的python庫請?zhí)崆鞍惭b。

那么，首先如何用python輸出漢字字庫的文字？

筆者查到在計算機中漢字編碼范圍是0x4E00到0x9FA5，利用unichr（）可以將十六進制的編碼轉(zhuǎn)成人類可讀的字。

這里擴展一下在python庫中什么是unichr（），以及什么是chr（）和ord（）。

chr( )函數(shù)用一個范圍在range（256）內(nèi)的（就是0～255）整數(shù)作參數(shù)，返回一個對應的字符。

unichr( )跟它一樣，只不過返回的是Unicode字符，這個從Python 2.0才加入的unichr( )的參數(shù)范圍依賴于你的Python是如何被編譯的。

如果是配置為USC2的Unicode，那么它的允許范圍就是range（65536）或0x0000-0xFFFF；如果配置為UCS4，那么這個值應該是range（1114112）或0x000000-0x110000。

如果提供的參數(shù)不在允許的范圍內(nèi)，則會報一個ValueError的異常。

ord( )函數(shù)是chr( )函數(shù)（對于8位的ASCII字符串）或unichr( )函數(shù)（對于Unicode對象）的配對函數(shù)，它以一個字符（長度為1的字符串）作為參數(shù)，返回對應的ASCII數(shù)值，或者Unicode數(shù)值，如果所給的Unicode字符超出了你的Python定義范圍，則會引發(fā)一個TypeError的異常。

接下來就是把unicode編碼的字寫入文件呢，如果直接用open()的話，會提示UnicodeEncodeError: ‘a(chǎn)scii' codec can't encode character u'\u4e00' in position 0: ordinal not in range(128)

這里就是涉及到python讀寫文件時候的兩種方式了，一種是open（），還一種是codecs.open( )。

對于open（）這個python的內(nèi)置函數(shù)來說，打開文件的方式一般為：

f=open(file_name,access_mode = 'r',buffering = -1)。

分享標題：對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解-創(chuàng)新互聯(lián)
文章網(wǎng)址：http://www.rwnh.cn/article40/cchjho.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供Google、App開發(fā)、響應式網(wǎng)站、用戶體驗、品牌網(wǎng)站建設、自適應網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解-創(chuàng)新互聯(lián)