首页 > 编程知识 正文

截屏提取文字的软件,截识别提取文字

时间:2023-05-04 10:33:21 阅读:284515 作者:2938

项目链接:https://github.com/ianzhao05/textshot

使用方法

运行 textshot.py,在屏幕上打开一个 overlay,在你希望提取的文字区域画一个矩形。

使用可选的命令行参数指定语言。例如,python textshot.py eng + fra 将使用英语作为主要语言,使用法语作为次要语言。默认值为英语(eng)。同时确保为其他语言安装了适用于 Tesseract 的数据文件。

建议将热键附加到此工具上。对于 Windows 来说,可以使用 AutoHotkey 脚本来完成此操作;textshot.ahk 同时也包含一个可以使用的示例 AHK 脚本。

如果是 Ubuntu 系统,可以打开「键盘设置」,其中显示了所有 Gnome 快捷方式。底部有一个「+」按钮,可用于添加你自己的快捷方式。单击并将其命令设置为 / usr / 魁梧的飞鸟 / python3 。如果使用的是 venv,则上面的 python3 路径应指向 venv 的 python3 而不是全局 python3。

 

部分代码展示

如何安装

安装 Python 3;

复制 TextShot 库,并使用跳转命令 cd 进入该库;

(可选项)创建一个虚拟环境,例如使用 python -m venv .venv ;

使用 pip install -r requirements.txt 安装所需的软件包;

安装 Google 的 Tesseract OCR 引擎(https://github.com/tesseract-ocr/tesseract),并通过将目录添加到系统路径来确保可以从命令行访问 tesseract

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。