互联网上拉丁和阿拉伯字符的新手写识别模型
突尼斯sfax大学的研究人员最近开发了一种识别在线脚本中手写字符和符号的新方法。他们的技术是在一篇关于arxiv的预先发表的论文中提出的,他们在用拉丁字母和阿拉伯字母书写的文本方面取得了显著的成就。
近年来,研究人员创造了一种基于神经网络的体系结构,可以处理各种任务,包括图像分类、人脸识别、自然语言处理等。手写识别系统是一种计算机工具,专门设计用于以类似人类的方式识别字符和其他手写符号。
事实上,在生命的最初几年里,人类天生就有能力通过单独和集体识别特定的字符来理解不同类型的笔迹。在过去的十年里,许多研究试图在计算机系统中复制这种能力,因为它最终将能够对手写文本进行更高级和自动的分析。
研究人员在论文中写道:“我们研究了基于特征提取系统和深度近似系统的在线手写笔迹识别问题。”"我们使用一个现有的方法结合一个新的分类器来得到一个灵活的系统."
Sofax大学的研究人员引入了两个基于深度神经网络的系统:一个是在线手写分割和识别系统,它使用了长期短期记忆网络(ONHSR-LSTM)和一个由卷积长期短期记忆网络(ONHR-COVLSTM)组成的在线手写识别系统。
他们的第一个模型,叫做OnHSR-LSTM,是基于一个理论,该理论将人类的感知系统描述为一种将语言从图形符号转换为符号表示的手段。它的工作模式是检测符号或字符的共同属性,然后根据特定的感知规则进行排列,例如基于接近度和相似度。
研究人员在他们的论文中解释说:“最后,它(模型)试图建立一个手写表示,基于这样一个假设,即对形式的感知是对基本特征的识别,直到我们识别出一个物体。”因此,笔迹的表现是原始笔画的组合。手写是一系列基本代码,它们组合在一起定义一个字符或形状。
研究人员提出的第一种技术本质上是使用手写生成模型将手写笔迹分成单个椭圆笔画。然后,将这些笔画分成原码,利用神经结构识别在线手写笔迹中的文字。
研究人员提出的第二个系统,OnHR-卷积LSTM,是一个生成模型,它使用脚本的在线信号作为输入,并被训练来预测字符和单词。第二种技术特别适合序列学习任务(即涉及长序列处理和字符符号分类的任务)。
研究人员使用五个不同的数据库来训练和评估这两个系统,这些数据库包含阿拉伯和拉丁字母的手写脚本。他们的测试取得了显著的效果,这两个系统的识别率都在98%以上。有趣的是,研究人员发现,这两种技术的性能相当于人类在类似任务中的性能。
研究人员写道:“我们现在计划在大规模数据库和其他脚本上构建和测试我们提出的识别系统。
标签: