基于图像分析的文字排版技术的深入研究

2013-04-15 01:50邓连瑾尤德祥
科学时代·上半月 2013年2期

邓连瑾 尤德祥

【摘 要】一种利用手机等移动设备进行电子阅读的全新模式,正以前所未有的普及速度冲击着人们的阅读习惯。如何获得最佳阅读效果,同时解决盗版电子读物对电子出版业的伤害,成为我们急需解决的问题。本论文提出了基于图像分析的文字排版技术,使得在手机等移动设备上进行阅读也能达到纸本阅读的效果,同时由于其基于图像的固有特性,出版者可以在文字内容上打上版权水印,也起到了打击盗版,维护版权的目的。

【关键词】电子阅读;基于图像;文字排版

不仅一般图像类的媒体信息需要重新排版,由于一些文本类信息具有附加显示属性,例如word里的文字信息具有格式信息,用来突出某部分的重要性等等,如果只是将文本信息传送到移动设备上,则这些重要的附加信息将被丢失,从而极大影响读者的阅读、理解过程。

如何对这些文字信息进行重排版,本文提出了全新的基于图像分析的文字排版技术,直接对包含文字的图像进行像素分析、文字分割、重新排版。在对源图像的像素进行分析,将文本块周围的空白区域去除之后,可以进行下述处理。

一、源图像文字分割

由于源图像需要重排版,所以必须对源图像按行进行文字分割,如下图所示,获得每行的上侧位置Linetop、下侧位置Linebottom,其过程和在对源图像的像素分析步骤中获得Wleft相类似[1],程序沿垂直方向自上而下不断扫描每行的像素,若从全白像素行进入有非白色像素行,则是一个新文字行的上侧,反之,若从有非白色像素行进入全白像素行,则是一个文字行的下侧。由此可知,只需扫描一次即可获得文本区域每行的上下位置,即下图所示中第一行上下侧位置为红色虚线,第二行上下侧位置为蓝色虚线,第三行上下侧位置为绿色虚线。

1)首先用户必须按照目标移动设备的屏幕分辨率设置目标图像的宽度Wdest和高度Hdest,例如有的高分辨率手机则达到800*480,则设置Wdest=800,Hdest=480;

2)然后用户选择文字排版后放置的起始位置,即根据排版要求设置变量P1;

3)接下来程序将自动按源图像中各行文字,分别进行图像信息赋值[2],如果源文字一行放置下来还不到目标图像右侧,如上图“源文字1行”所示,则将该行所在区域的右上角坐标P2自动赋值为下一行文字的起始点位置;

4)如果源文字一行放置下来超出目标图像右侧,则以目标图像右侧为分界线将源文字分为两部分,右侧部分将在放置在下一行,如“源文字2行”那样,出现了换行效果[3],最终同样最后一块的右上角坐标自动赋值为下一行文字的起始点位置,如上图中“第三行起始点坐标P3”;

5)在放置完所有源图像文字后,即可将内存中的目标图像保存到磁盘上,完成整个重排版过程。

三、实验结果分析

本文将上述基于图像的处理过程编制成计算机程序,并做了相应的重排版试验,经观察发现本文所述原理对基于图像的文本重排版处理效果非常良好,下面是处理实例,如图3所示,处理前图像宽度为873,超过一般移动设备的分辨率,用户在阅读时需要不断缩放、移动图像,非常麻烦。

本文提出的基于图像的文本重排版技术,除了大幅提高移动设备的阅读效果外,还可以在重排版后向图像中加入注入数字水印等版权保护措施,为电子出版商在移动设备上的数字出版提供一种可靠的防盗版技术保证。

参考文献:

[1]张娜. 简牍图像增强与分割的研究[D]成都理工大学, 2007.

[2]孙晶. 图像局部不变特征提取技术研究及其应用[D]大连理工大学, 2009.

[3]王晓峰. 水平集方法及其在图像分割中的应用研究[D]中国科学技术大学, 2009 .

作者简介:

邓连瑾(1981-),女,天津市人,硕士,天津渤海职业技术学院讲师,主要从事人工智能、图形图像等研究。

尤德祥(1982-),男,硕士,江苏省扬州市人,铁道第三勘察设计院集团有限公司信息中心工程师,主要从事图形图像研究与开发工作。