首页 > 编程知识 正文

python中文文字识别,ocr文字识别快捷指令

时间:2023-05-06 04:32:01 阅读:201401 作者:4122

无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。人工智能教程

Python中有一个不错的OCR库-EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。

安装包:

pip install eazyocr

错误问题:

ImportError: libX11.so.6: cannot open shared object file: No such file or directory

解决方法:

sudo yum install libX11

错误问题:

ImportError: libXext.so.6: cannot open shared object file: No such file or directory

解决办法:

sudo yum install libXext

识别代码:

# 导入easyocrimport easyocr# 创建reader对象reader = easyocr.Reader(['ch_sim','en'])# 读取图像result = reader.readtext('./企业微信截图_16104127148073.png')# 结果print(result)for i in result: word = i[1] print(word)

GPU 服务器 运行 python test.py


检测部分使用了CRAFT算法,识别模型为CRNN,它由3个主要组件组成:特征提取,序列标记(LSTM)和解码(CTC)。整个深度学习过程基于Pytorch实现。

检测:CRAFT算法
识别:CNN+RNN+CTC

OCR 应用场景如下:

1.文档识别

工作或者科研学习中,要应对大量的纸质文件、书刊杂志、PDF格式的电子资料,很难对这些格式的资料进行编辑和整理

2.拍题识别

识别试卷,保存试卷中的文字并进行评测评分

3.反垃圾

计算机目前只能处理电子字符,不能直接理解图片上的字符,但经过OCR“翻译”后,计算机就能处理那些原本读不懂的信息。比如检测图片上的违禁字眼,由此开启反垃圾新技能

4.书摘笔记

读书时,看到不错的文章段落想要做书摘笔记,但又懒得去打字或是手抄整理

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存忧伤的月饼,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索

6.病历整理

医生每天需要整理大量的病历,如果使用OCR识别技术,拍图即可生成电子资料自动记录保存,节约时间

7.档案管理

档案管理员的工作有很多需要记录,如果单纯依赖打字上传确实是一项费时费力的工作

以上列举的都是生活中你可能会遇到的麻烦,但OCR所能实现的场景和可挖掘的功能远不止这些。医疗、海关、物流、金融、传统制造业等领域都能够通过OCR识别服务,为企业提供高效、低成本的数据采集方案,节省人工数据采集、构建信息系统和维护升级的成本,让企业更智能。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。