首页 > 编程知识 正文

什么软件可以识别手写文字,手写识别功能

时间:2023-05-06 17:42:02 阅读:201698 作者:4676

1.手写识别软件

手写识别软件包括两部分:识别程序和识别字典。

(1)识别程序是指可执行代码和生成这些可执行代码的源程序(也可称为源代码)。这一源代码其实就是程序化的识别算法。

(2)识别字典是在识别程序运行过程中必须要用到的特殊的数据库,它包含可识别字符集中全部字符的手写特征描述(即模板)。识别字典是由字典生成程序对大量的训练样本进行复杂的运算生成的,字典生成程序和识别程序息息相关,但并不一致。识别字典的构造和生成是影响一个识别软件的性能的至关重要的关键部分;不同的公司由于所掌握的训练样本的不同和字典生成程序的不同,不可能生成和使用同样的识别字典。

 

2.识别过程描述

       联机手写文字的识别过程即是将通过手写设备采样得到的笔迹数据,经过识别程序的处理,最后转化为计算机所使用的文字代码的过程。通常分为四个阶段:预处理、归一化、特征抽取、特征匹配。见下图

 

3.识别性能指标

       通常评价一个识别软件的好坏,主要依据以下几个性能指标:

(1)     识别率:指对特定的某个大规模的测试样本集的识别正确率,通常细分为首选正确率和十选正确率。测试样本集通常分为:工整字、连笔字、自由书写字(即倒插笔字)。(见国家八六三评测)

因此,识别能力(如能否识别连笔字?能否识别倒插笔?)也是识别性能评价的一个重要指标。

(2)     识别速度:每识别一个待测样本(字)所耗费的CPU运行时间。

(3)     可识别字符集的范围大小:通常包括标准汉字(GB2312规定的6763个汉字)、异体字(繁体字和非标准的简化字)、英文字母、阿拉伯数字、标点、符号等。

(4)     识别字典的大小

(5)     对内存(RAM)的需求:即在识别过程中所需要的内存(RAM)的多少。

如果一个识别软件的识别率很高、识别速度很快、可识别字符集范围很全面、识别字典很小、内存需求也很少,那么它就是一个非常好的识别软件了。

识别性能取决于识别程序和识别字典的构造。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。