基于Web环境下藏文信息的处理技术

2018-01-12 18:18平措
神州·下旬刊 2017年11期
关键词:处理技术

平措

摘要:伴随着社会信息化的发展,网络技术不断普及,越来越多的人们开始利用互联网络开始了解世界。但是对于少数民族来说,尤其是藏族同胞而言,通过藏文上网非常不方便。所以为了进一步促进藏区经济的发展,提升藏区与内地之间的信息互动和交流,必须要针对网页环境下藏文信息技术的处理进行全面的升级研究,从而有效的提高藏族同胞上网效率。本文通过对于网页浏览中藏文字体信息的显示进行全面的分析,并且基于微软浏览器来对字体底层基础设施进行完善,从而实现藏文信息显示。

关键词:web环境;藏文信息;处理技术

引言:

伴随着社会的发展越来越趋向于网络化、信息化,尤其是各种社会热点事件都能够通过网络信息进行及时传播,网络信息的传播能够为信息的传播极大的便利。网络在传递信息的过程中能够突破时间、地点、环境等方面的限制,而且成本非常低,所以这些优势都能够促进信息的快速发展,并且达到传动媒体所无法达到的快速和时效性。通过对于藏文技术进行有效的研究,从而为藏文信息的活动进行有效的快速传播。

一、原有web环境下藏文信息处理技术的不足

(一)字体图像化

藏文信息在传统的web环境下信息处理都是直接根据超链接的方式将文字信息转化为图像信息进行插入的。这样的方式尽管不会导致文本信息与图像信息造成区别,但是如果文字信息需要修改,那么就必须要调整图像信息,从而使得修改保持一致。但是这样就造成了web环境下网页制作非常的复杂,而且必须要利用专业的图文信息转换软件才能够实现,所以在制作的过程中无法实现自动化,必须依靠大量的人工进行处理,所以传统的字体图像化操作根本无法满足自动化处理的需求。而且,除了无法进行自动化制作之外,字体图像化还有很多方面的不足。比如,如果文字信息转化为图像信息之后,那么就会造成信息检索出现问题,很多重要的信息、网页标题、关键字等被转化为网页之后就会造成信息的损失。其次,如果字体信息转化为图像信息,那么就会造成网络传输的数据就会增多,从而导致网页传输速度变慢。如果IE浏览器的图像显示功能被关闭,那么页面就无法看到字体转化的图像。也就无法明页面信息,同时藏文与汉文、英文不能进行混排,给页面编辑带来很大的难题。

(二)字体下载技术

通过将所需的藏文字体上传到服务器中,并且在web页面描述信息增加下载脚本,从而在页面执行下载脚本的过程中自动从服务器上下载字体库。但是,从目前来看,字库本身数据量过于庞大,不仅增加了网络传输量,所以字体下载安装给服务器带来的压力可想而知,并且在安装字体的过程中,由于操作非常专业,对于一般用户来说也非常的困难。

(三)Web Font技術

Webfont技术在网络中能够动态显示藏文,但是必须包括两个组件,即记录器组件和播放器组件。记录器组件内置Bitstream WebFont字体库的制作工具,从而保证将藏文信息进行存储,但是因为Web Font字体库仅仅适用于字体显示,所以对于字体信息的压缩比较高,精度比较低。在这样的情况下,可以通过Bitstream WebFont内置工具来进行解决,但是在实际web环境运行的过程中也存在不足之处。比如,Bitstream WebFont内置工具的字库与信息是分开的,所以字体库的数据量非常的庞大。而且在制作PFR文件的过程中为了增加压缩效率,必然会损失字体精度,所以字型现实效果并不理想。可以说,Bitstream WebFont技术也无法充分的满足web环境下藏文信息的处理。

二、web环境下藏文信息处理技术的处理方案

(一)字体对象和信息描述 在web环境下,通过对于微软操作系统针对性的推出了嵌入字体技术。通过在微软操作系统中的浏览器技术上,根据ActiveX Control扩展特性和Windows系统来对True Type字体进行重设,从而有效的保证浏览器中藏文字体的有效显示。

(二)字体信息统计

在针对藏文字体信息统计的过程中,可以利用Web Embedding Fonts Tool工具进行分析与处理,尤其是针对包含藏文子的网页或者网站能够进行分析归纳,从而针对字体信息进行分类整理,有效的形成统计结果。而且在生成EOT文件统计结果之后,能够有效的压缩页面文字,从而帮助用户建立临时字体信息,有效的提高页面字体库的处理效率。

(三)字体嵌入技术

通过在藏文字体中的web页面进行展示,能够有效的避免字体图像化存在的技术缺陷,但是这样的方式必须要求True Type技术适配,否则无法嵌入到网页中生成相对应的EOT检索结果。通过这一方案,能够建立藏文字库,并且在互联网中发布大量的信息,提高藏文信息的传播质量,降低数据传输量,从而实现藏文信息的快速传播。

藏文信息在web环境下因为信息复杂,所以在描述的过程中必须要保证对象技术更加的准确、全面,从而有效的体现出藏文信息的页面版式特点,更好的收集藏文复杂的特征,形成数据模板。

结论:

目前的网络化信息化的时代,谁更快掌握信息资源,谁就拥有话语权。根据这样的现实要求,针对藏文信息的web网络应用平台开发也称为必然的发展趋势。但是由于藏文字符集并不是系统字符集,所以在web环境下的交互功能要远低于其他的桌面应用,而且web环境页面受到的限制非常多,尤其是藏族同胞在利用移动设备等方式浏览藏文网页的过程中,再输入的时候必须要找到对应的藏族字体以及藏族输入法。

参考文献:

[1]洛松求培,安见才让.基于文本密度的藏文网页正文提取方法[J].计算机时代,2017,(08):46-47+51.

[2]郭晓军,何磊,王亮,黄操,赵晓晨,等.藏文Web网页的信息隐藏研究[J].实验室研究与探索,2016,35(08):143-147.endprint

猜你喜欢
处理技术
市政道路施工中软土地基处理技术及其应用
公路施工中软土路基处理技术探究
农村生活污水处理技术进展研究
浅议大数据的产生与发展现状
简析常用园林生态水处理技术
浅析城市生活污水处理技术现状及发展趋势
Java千万级别数据处理与优化
浅谈云计算环境下的大规模图数据处理技术
我国农村生活垃圾处理现状及其发展趋势