基于手写板的手写电子留言板信息管理系统的设计与实现

2015-09-16 00:42李志梅广东省自动化研究所广东广州510070
机电工程技术 2015年6期
关键词:联机手写汉字

李志梅(广东省自动化研究所,广东广州510070)

基于手写板的手写电子留言板信息管理系统的设计与实现

李志梅
(广东省自动化研究所,广东广州510070)

介绍基于市面上的成熟的手写板和手写中文识别的技术,采用数据存储分类和分析手段,建立起手写电子留言信息管理系统,实现在方便手写留言的基础上,最大限度地提高手写留言信息的使用效率和使用价值。

手写板;电子留言板存储模式;手写识别;分类存储;信息分析

0 前言

随着计算机技术和手写板技术的飞速发展,手写电子留言板在人们的生活中日益受到关注。无论作为日常交流平台,还是作为自动化系统的一部分,它都能在游客和管理者之间建立起桥梁关系,具有良好的互动效果。本文主要介绍的是,在采用市面上成熟的手写板软硬件技术以及手写联机识别的基础上,通过图片的分类存储,建立起方便游客的查询回味,更方便管理者信息管理分析的手写信息管理系统。

1 系统的总体架构

如图1所示,系统简单分为前端输入和后端处理两部分。前端输入采用手写板进行手写的输入,在书写的过程中进行手写联机识别。本系统采用分布式输入、集中管理的模式,在园区不同景点分别设置手写板,游客可以按照当时的感受,采用随想随记的模式,写下自己观感和意见。数据保存时,按照联机识别的结果,保存至总机的数据库。在数据记录的类别即为当地园区的名称。这样方便以后查询使用。

图1 系统的总体架构

2 留言信息手写板输入

由于传统的纸笔的留言方式会产生大量的纸质文件,这些纸张的购置需要一定的经费,观众留言后的文件需要大量的密集柜存档,存档时又需要博物馆社教相关专业人员进行分类整理,如此耗费经费和人力的问题催生了电子留言系统的诞生。

传统的纸笔的留言方式会产生大量的纸质文件,不仅会产生纸张购置的经费,还会需要消耗大量的人力物力进行存档以及维护,在后期使用中,例如查询、信息整理上都有不便之处。如此耗费经费和人力的问题催生了电子留言系统的诞生。首先以键盘输入文字,记录留言的方式,开始电子留言系统的雏形,但由于需要具有一定计算机技能的人员才能正确使用,也就限制了使用人群。而后语音留言方式的留言系统,利用麦克风,触摸板等方式进行留言,拓宽了留言系统的使用人群。但是鉴于语音信息的多方面原因,使留言信息整理给工作人员带来了诸多困难。这就催生了手写留言方式的留言系统。这种留言系统,同样以触摸屏为硬件载体[1],以数据库为后台系统,不同的是它的交互界面以模仿纸张的样式出现,并且配备了电脑触控笔,这种笔可以使观众在电脑屏幕上写字,就好像在纸张上写字一样。观众写好的文字会以图片的形式存储到数据库中,同时这些文字内容还会被用一个与留言系统相结合的大型屏幕展示出来,保证使观众可以看到其他观众的留言。

3 图片识别

手写汉字识别的基本原理也是将输入的文字与各个标准文字进行模式的匹配,计算类似度。将具有最大类似度的标准文字作为识别结果。但是手写体文字的人为因素随意性大,经常会出现连笔,和背景融合的现象,因而在对手写体文字的识别中一般都会加入汉字识别的预处理阶段,该阶段主要是完成汉字图像的正规化,将手写输入的文字尺寸归一及矫正变形。然后再进行汉字识别阶段,在汉字识别阶段,完成汉字的识别,涉及特征提取和分类器的设计。最后进行识别后处理阶段,利用汉字的结构知识、语义、词义等上下文先验信息进行结果的纠错和最后确定。尽管进行了这三个阶段,在对稍微潦草的文字的识别中,错误的比率依然很高。

手写体汉字按照输入方式不同,可分为联机和脱机两种。联机手写识别就是采用和计算机相连的书写板,用户一边在书写板上写汉字,机器一边识别处理,识别以笔划为单位。根据一个汉字的笔划组合、笔划之间的位置和关系,最终识别出汉字。脱机手写汉字识别需用光电转换装置,如扫描仪或摄像机将写在纸张上的文稿变为电信号,再输入到计算机进行识别,其基本思想和印刷体汉字识别一致。由于手写体人为因素随意性大,所以,手写体汉字识别的难度远高于印刷体汉字的识别[1]。

4 分类存储

图片的存储在数据库中有两种方式:(1)图片直接存储在数据库中;(2)图片数据以文件的形式直接存储在硬盘上,在数据库中保存该图片的记录附加信息(例如:路径、文件名……)[2]。这两种方式各有利弊。图片文件存入数据库中便于管理与维护,但不便于编辑,而且随着图片的大小或者数量的增加,数据库就会越来越大,也会加重数据库的负担;图片存于硬盘,便于图片编辑修改,不会引起数据库读取时I/O消耗,也不会引起数据库的过快增长而导致过大,但可能会因为不小心删除图片文件,或者修改图片附件信息,而使得图片信息与数据库不一致,造成管理和维护的不便。本系统在使用过程中,图片会不断增加,考虑到图片的数量和大小以及便于查看编辑等问题,系统采用把手写留言图片保存至硬盘固定的目录下,按照景区和时间分组存放。就是在景区的目录下采用年文件夹和月文件夹的方式存放(如:D:picture温室201521.jpg)。本系统采用SQLServer2008关系型数据库,根据系统要求需要存储图片的存储地址、所在园区、时间、姓名等信息。因此图片信息表设计如表1所示,在测试过程中得到了如表2所示的存储结果。

表1 图片表结构

表2 图片存储结果

5 信息处理

信息处理部分如图2所示分为用户管理模块,图片信息管理模块,信息查询模块

图2 信息处理结构

用户管理模块:对于系统来说,安全性是设计者必须考虑的内容。本系统通过用户管理功能,检测用户的合法性以及用户操作日志记录来实现系统安全性的保证。系统用户根据使用者的使用目的不同,分为游客、操作员和管理员三个级别,每个级别具有不同的权限。游客不需要注册、登录等操作,只要在打开查询功能页面,输入查询条件,即可以进行查询。操作员需进行注册为系统用户,具有修改自身的密码和用户名称的权限,在使用系统时进行登录,正确登录之后,进行查询、对比手写图片和识别结果信息,进行适当修正等操作。管理员同样需要进行注册,具有最高的管理权限。管理人员可以实现对操作员的注册和信息修改,以及对自身的用户名称和密码的修改权限。可以查询用户的操作员的操作日志,了解系统的使用情况。

图片识别校正:手写图片采用识别率相对较高的联机识别方式。识别信息保存于数据库的信息表里面。无论是手写联机识别还是脱机识别,都不能达到完全无误。鉴于图片软件识别过程中错漏。定期或者不定期,系统管理人员需要通过浏览方式审查存储的图片信息和识别信息的契合度,在出入比较大的情况下,修改图片识别结果信息,使得数据库存储信息更趋于完整真实。

信息查询模块:信息查询分为游客查询和系统管理者查询两种类别。

游客查询,是游客按照在留言当时留下的信息量进行查询。一般分为按照时间查询、按照姓名查询和按照类别查询三类。可以分别查询也可以三个条件相互组合查询。如果游客在留言时写了姓名,那么按照姓名查询则是相对比较快速准确的;但是如果用户在留言时只是写了留言信息图片,没有其他的信息。则可以按照大致时间进行查询,可以按照留言者书写时的大致时间段,查询这段时间内的所有图片,进行分页浏览,从而找到自己留下的信息图片。

系统管理者查询同样可按照时间和类别进行查询。不同的是,在查询结果中,会对留言信息就行统计分析,给出查询时间段或者查询类别或者在两个条件的结果中信息的大致分布,便于管理人员进行信息的筛选和使用,从而提高信息的使用效率。

6 结论

随着计算机技术的发展,手写板和手写识别技术日趋成熟。本文介绍了利用成熟的手写板成熟软硬件技术和手写识别技术,结合SQL Server的存储技术,设计开发基于手写板电子留言信息管理系统,达到手写留言,自动识别存储,分析利用的目的,减少留言的维护管理开支,提高留言信息的利用效率和价值。

[1]王冰,王越.手写汉字的文字识别[J].甘肃科技,2010,26(6):67-68.

[2]张俊兰,李源平.基于SQLServer的Asp.net图片存储技术[J].电子设计工程,2009,17(3):28-29.

(编辑:向飞)

Design and Implementation of Information Management System of Handwriting and Electronic Message Board Based on Tablet

LI Zhi-mei
(Guangdong Institute Automation,Guangzhou510070,China)

This paper introduced handwritten electronic message information management system,which based on the tablet of the marketmature and Chinese handwriting recognition technology,and the data storage and classification analysismethod,tomaximize the efficiency ofhandwrittenmessagesand use value.

tablet;electronicmessageboard;storagemode;handwriting recognition;classification storage;information analysis

TP334

A

1009-9492(2015)06-0112-03

10.3969/j.issn.1009-9492.2015.06.030

2015-05-05

李志梅,女,1981年生,安徽临泉县人,大学本科,助理研究员。研究领域:计算机信息处理,电气自动化技术应用。

猜你喜欢
联机手写汉字
多联机安装施工技术探讨
我手写我心
抓住身边事吾手写吾心
基于集成学习的MINIST手写数字识别
汉字这样记
汉字这样记
高温多联机空调系统的控制方式研究
深度学习在手写汉字识别中的应用综述
CALIS联机合作编目中的授权影印书规范著录
分析Automation技术在Word联机考试系统中的作用