圖片處理 - python PIL 圖片放大的問(wèn)題
問(wèn)題描述
嘗試用pytesseract來(lái)識(shí)別一些圖片:
原始圖片尺寸較小,用pytesseract無(wú)法識(shí)別,開(kāi)始嘗試用 Mac 自帶的預(yù)覽工具來(lái)放大尺寸 ,發(fā)現(xiàn)可以正常識(shí)別了,然后嘗試用 PIL 來(lái)放大圖片,代碼如下:
images.resize((1985, 336),Image.ANTIALIAS).save(’/images’, quality=95,dpi=(72, 72))
問(wèn)題是,通過(guò) PIL 放大的圖片不能被pytesseract 正常識(shí)別,我對(duì)比了兩張圖片的信息,如下圖:
發(fā)現(xiàn)除了圖片尺寸不同外,其他信息都是相同的,但是就是無(wú)法被pytesseract正常識(shí)別,所以求教如何用 PIL 放大出可以正常被pytesseract識(shí)別的圖片(其他工具也可以)
問(wèn)題解答
回答1:你可以嘗試改變tesseract的-psm參數(shù):
image = Image.open(’ocr.png’)image.show()for p in range(4,14): print(p, ’-’, pytesseract.image_to_string(image, config='-psm {}'.format(p)))
輸出如下:
4 - 3 4’1 4’1 I] I]5 - DDd.d._...I._6 - 3 4’1 4’1 I] I]7 - 3 4’1 4’1 I] I]8 - 344009 - 3440010 - W11 - 3£1I1I]I]12 - 13 - 34400
如果圖片只有數(shù)字你也能嘗試用tessedit_char_whitelist:
pytesseract.image_to_string(image, config='-psm 8 -c tessedit_char_whitelist=1234567890')
相關(guān)文章:
1. javascript - sublime快鍵鍵問(wèn)題2. javascript - immutable配合react提升性能?3. css - 寫頁(yè)面遇到個(gè)布局問(wèn)題,求大佬們幫解答,在線等,急!~4. javascript - nodejs關(guān)于進(jìn)程間發(fā)送句柄的一點(diǎn)疑問(wèn)5. Apache 已經(jīng)把網(wǎng)站根目錄的改為allow from all了,但是服務(wù)器還是不能訪問(wèn)?6. 實(shí)現(xiàn)bing搜索工具urlAPI提交7. 配置Apache時(shí),添加對(duì)PHP的支持時(shí)語(yǔ)法錯(cuò)誤8. vue.js - Vue 如何像Angular.js watch 一樣監(jiān)聽(tīng)數(shù)據(jù)變化9. javascript - 移動(dòng)端上不能實(shí)現(xiàn)拖拽布局嗎?10. phpstudy8.1支持win11系統(tǒng)嗎?

網(wǎng)公網(wǎng)安備