汉字是中华民族用于传承文明、传播知识、记载历史的主要工具。
早在三千年前的殷代,我国便有了刻在龟骨、兽骨上的“甲骨文”。
随着人类社会文明的进步和发展,汉字经历了由简易体到繁体,再由繁体到简易体的漫长演变过程。
进入信息时代,计算机成为我们生活中不可缺少的工具。我们可以通过计算机键盘,直接进行汉字的录入和编辑。
如果遇到不会使用汉字编码进行计算机录入,或有大量的文本处理时,单凭键盘解决这些问题,就很麻烦了。
现在,我国已经研制出一种汉字识别软件,它可以轻松地帮我们解决这些问题。
(讲话:汉字识别软件是我国863攻关项目之一,我国于70年代末开始进行汉字识别软件的研究。汉字识别软件包括手写识别系统和中文OCR系统。)
“识别”是手写输入和中文OCR输入的核心技术。
计算机是如何利用汉字识别软件进行汉字识别呢?
通过扫描仪对汉字文本进行扫描,分检出的汉字图像,由计算机将这些图形、图像转变成汉字的标准代码,这一过程,被称为计算机“认字”。然后和计算机内的识别特征库比较,找到特征最相似的字,提取文字的标准代码。这就是计算机“识别字”的过程。
汉字是世界上公认的字种最多、字型最复杂的文字。在进行汉字识别软件研究的过程中,研究人员发现,在汉字识别软件中,需要建立一个具有大字符容量的识别特征库。
经过十几年的研究,现在的汉字识别软件中,已建立了一个可以按照我们习惯笔顺书写的统计特征库,和一个可进行处理大量文本的大字符识别特征库。使手写输入系统,印刷汉字文本识别系统的性能得到大幅度的提高。开创了非键盘汉字输入新的应用领域。
现在,汉字识别软件已达到识别率高、识别速度快的世界先进技术水平。汉字识别软件除了可以识别多种书写形式的手写体外,还可以识别宋、仿宋、楷、黑等一百多种字体,并可混合识别简、繁体;常用异体字英文、数字、符号等等。
使用汉字识别软件,极大减轻录入工作强度,有效地提高录入工作速度。
汉字识别软件不仅用在商务通、连笔王等计算机上,还广泛用于电子出版物、网络资源、各种大型文献资料管理数据库。同时还可以对增值税发票、名片、车牌、银行票据、身份证等进行识别。
在计算机领域中,汉字识别软件的出现,不仅是对汉字传统文化的保留,也实现了我国计算机文字识别领域的世纪性革命。
汉字识别软件成就,得到国家领导和科研单位好评,也是国家实施863计划的重要成果。为充分发挥汉字识别软件的普及性,现在,汉字识别软件已走入产业化生产。
|
|
扫一扫在手机打开当前页
|