本文实例为大家分享了python实现连续图文识别的具体代码,供大家参考,具体内容如下
1.工具:
1.1 剪切板。我下载并安装使用的是剪切板查看器(clipbrd.exe),成功后显示“剪贴薄查看器.exe”
1.2 截图工具并设置热键。保存图片键和退出键可任意设置,注意不能同其它热键冲突。我使用的是微信截图,进入设置---进入快捷按键---把截取屏幕键改为F1。
1.3 Python 3.x,Windows环境
1.4 注册百度云帐号,获取Appid API Key Secret Key
1.5 新建文件夹。我建的名叫‘图文识别'文件夹(C:\Users\Administrator\AppData\Local\Programs\Python\Python35-32\图文识别)
1.6 ‘图文识别'文件夹下,有3个.py文件,分别是:screenshot.py baiduap.py getText.py;有1个配置文本文件是password.ini;有个图像文件是Picture.png。
1.7 需要有以下第三方库:keyboard、PIL、aip、configparser、win32con、win32clipboard。
2 完整代码:
2.1 screenshot.py是主程序,可独立运行,主要功能为截图并保存。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
|
""" 本程序可独立运行,主要功能是截图并保存""" import sys from time import sleep import keyboard from PIL import ImageGrab #pillow from baiduap import BaiDuAPI from getText import GetText def screenShot(): """用于截图并保存""" print ( '请按F1开始截图' ) if keyboard.wait(hotkey = 'f1' ) = = None : print ( '复制剪切板的图片,请按Ctrl+b,不复制继续截图' ) if keyboard.wait(hotkey = 'Ctrl+b' ) = = None : sleep( 0.02 ) #防止获取的是上一张截图 #复制剪贴板里面的图片 im = ImageGrab.grabclipboard() im.save( 'Picture.png' ) if __name__ = = '__main__' : baiduapi = BaiDuAPI( 'password.ini' ) for _ in range (sys.maxsize): screenShot() texts = baiduapi.picture2Text( 'Picture.png' ) print (texts) GetText.setText(texts) #剪贴板剪贴 sleep( 0.02 ) GetText.getText() print ( '退出请按Ctrl+x' ) if keyboard.wait(hotkey = 'Ctrl+x' ) = = None : name = input ( '请输入保存图像识别文字文件名:' ) f = open (name + '.txt' , 'w' ) f.write(texts) f.close() break |
2.2 baiduap.py 程序可独立使用,主要功能是图像文字识别。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
from aip import AipOcr import configparser class BaiDuAPI: """图片文字识别""" #初识化方法 def __init__( self ,filePath): #self 就是BaiDuAPI() #读取工单信息 target = configparser.ConfigParser() target.read(filePath) app_id = target.get( '我的工单' , 'App_ID' ) app_key = target.get( '我的工单' , 'App_KEY' ) secret_key = target.get( '我的工单' , 'SECRET_KEY' ) self .client = AipOcr( app_id, app_key,secret_key) def picture2Text( self ,filePath): #读取图片 image = self .getPicture(filePath) texts = self .client.basicGeneral(image) #print(texts['words_result']) allTexts = '' for word in texts[ 'words_result' ]: allTexts = allTexts + word.get( 'words' ,'') return allTexts @staticmethod def getPicture(filePath): with open (filePath, 'rb' ) as fp: return fp.read() if __name__ = = '__main__' : baiduapi = BaiDuAPI( 'password.ini' ) print (baiduapi.picture2Text( 'Picture.png' )) |
2.3 getText.py 程序,主要功能是把图像识别出来的文字,保存到剪切板。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
import sys import os.path import win32clipboard as w import win32con class GetText: def getText(): #读取剪切板 w.OpenClipboard() d = w.GetClipboardData(win32con.CF_TEXT) w.CloseClipboard() return d def setText(aString): #写入剪切板 w.OpenClipboard() w.EmptyClipboard() w.SetClipboardText(aString) w.CloseClipboard() if __name__ = = '__main__' : GetText.setText( '布衣弓长' ) GetText.getText() |
2.4 password.ini 文件,用记事本编写,把百度云获取的相关信息填进去。内容是:
[我的工单];节
App_ID=151313**
App_KEY=1V2LlBhLUYaHu2Y9*******
SECRET_KEY=fGufC1CbiZ0tw1imTGoIsaGO******
3.运行。启动qq和剪贴薄查看器.exe,在python环境下运行screenshot.py。
经实测:识别率高,能快速抓取多图,但每运行一次程序,只能识别保存在Picture.png文件里图像的文字。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/weixin_41809469/article/details/84979244