最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序;
刚好最近在做一个python项目,所以顺便用python练练手
1.需要的环境:
2.7或者3.4版本的python
2.需要安装pytesseract库
依赖pil和tesseract-ocr库
本地环境是ubuntu,下面说一下 具体步骤:
2.7
1.安装pil:
直接使用pip 安装; pip install pillow
2.安装tesseract-ocr:
apt-get install tesseract-ocr
3.安装pytesseract
pip install pytesseract
使用python 3.4安装时;将pip 命令修改为pip3(都知道)
测试:
1
2
3
4
5
|
import pytesseract from pil import image img = image. open ( 'hb1.png' ) data = pytesseract.image_to_string(img) print (data) |
注意: 会出现乱码
以上这篇python 识别图片中的文字信息方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qq_33571718/article/details/78731151