来源:Python爬虫和数据挖掘
作者:Python高级人
在日常生活中,我们经常需要用到图片。众所周知,图片种类很多,这里就不一一列举了。
我们今天要完成的是一个图片转换器加上一个图片识别程序,简单明了!
1.字符识别技术
2.图像转换器
一、字符识别技术
首先介绍了文本识别技术,即在阅读图片后,提取图片中的文本。
1.开放百度开放平台
之后,让我们选择单词识别。我们可以看到语音合成和图片识别的参数是不一样的,所以不要混淆,它们使用的是同一个Python模块,可以放心使用。
说到文字识别,大致可以分为本地文档文字识别和网络文档文字识别。识别率相当高。他的用法和语音合成有很多相似之处,当然也有很多不同之处,比如:
从aip导入AipOcr
'你的APPID AK SK ' ' '
应用标识='您的应用标识'
应用编程接口密钥='您的应用编程接口密钥'
秘密密钥='你的秘密密钥'
Client=aipocr (app _ id,API _ key,secret _ key)首先使用不同的模块,其次参数不同。可以看出,配置的第一步就这么简单。
然后我们需要识别本地文件,例如:
可以看出这些都是识别图片的内容,识别效果非常好,非常完美。
文本——请求参数详细信息
参数名
是强制性的吗?
类型
可选值范围
系统默认值
解释
图像
是
线
Image,base64编码,要求base64编码的图像大小不超过4M,最短边至少15px,最长边4096px,支持jpg/png/bmp格式。
全球资源定位器(Uniform Resource Locator)
是
线
完整的图片url,URL长度不超过1024字节,base64编码后URL对应的图片大小不超过4M,最短边至少15px,最长边为4096px,支持jpg/png/bmp格式,当图像字段存在时URL字段将无效。
语言类型
不
线
中国FRE意大利水疗中心RUS日本KOR
中国工程
识别语言类型,默认为CHN_ENG。可选值包括:-CHN_ENG:中英文混合;-英语;-葡萄牙语;-FRE:法语;-德国人:德国人;-ITA:意大利语;-SPA:西班牙语;-RUS:俄罗斯;-日本人:日本人;-韩国:韩国人;
检测方向
不
线
真假
错误的
是否检测图像方向,默认不检测,即假。方向是指输入图像处于正常方向,逆时针旋转90/180/270度。可选值包括:-true:检测方向;-false:未检测到方向。
检测语言
不
线
真假
错误的
是否检测语言,默认不检测。目前支持(中文、英文、日文、韩文)
可能性
不
线
真假
返回识别结果中每一行的置信度。
文本——返回数据参数详细信息。
领域
肯定地选择
类型
解释
方向
不
数字
图像,当detect_direction=true时存在。-1:未定义,-0:正向,-1:逆时针90度,-2:逆时针180度,-:逆时针270度。
日志id
是
数字
问题位置的唯一日志id。
单词_结果_数字
是
数字
识别结果数,表示words _ result的元素数。
单词_结果
是
排列
以及定位和识别结果数组。
话
不
线
识别结果字符串
可能性
不
目标
线置信度信息;如果输入参数概率=真,则输出
平均的
不
数字
行置信平均值
差异
不
数字
线置信方差
部
不
数字
最小线置信度
可见这个API还是挺不错的。我们来谈谈图片格式转换器。
二、图片格式转换器
图片格式转换器,顾名思义,就是将图片格式相互转换。很多人为了方便直接更改后缀名称,但大家都知道,这样会影响图片的原始风格,可能图片打开后会产生错误的图片。下面我们来做一个类似的案例。
1.先安装图片处理模块枕。安装方法:
Pip安装枕套2。进口枕头
从PIL导入图像3。确定文件是否可以打开。
来自PIL进口图像
def isbad(路径):
坏=真
尝试:
Image.open(路径)。verify() #判断图片是否损坏。
除外:
坏=假
返回bad4。转换文件格式
def翻译(路径):
if isbad(路径):
尝试:
str=path.rsplit(' . ', 1)
Output_path=str[0]'。png' #输出文件名
im=Image.open(路径)
Im.save(输出路径)#保存目标文件。
返回真
除外:
False返回
else:
真的这样,我们得到了一个完整可用的png图片。代码如下:
这个项目平时用于上传文件识别图片,效果相当不错。希望你喜欢。