电子商务时期中文字典数据库生成设计探讨

2016-04-26 10:23杨睿娜
科技视界 2016年9期
关键词:电子商务数据库

杨睿娜

【摘 要】在当前日趋发达的电子商务环境下,数据分析技术迅速发展,汉字数据库体系结构分析直接关系着中文电子字典数据库生成情况。然而在实际操作中往往由于数据库信息量比较大,数据分析结构复杂等因素使工作效率大幅降低。想要解决这一问题,必须实现中文字典数据库生成设计模式。本文通过中文字典数据库系统设计、数据库生成思路、GB2312字库全集的生成、数据库维护设计、数据库查询模块设计、字典表自定义数据录入模块设计等几个方面深入探讨电子商务时期中文字典数据库的生成方式及提高系统处理效率问题。

【关键词】电子商务;中文字典;数据库;设计探讨

1 中文字典数据库系统设计

中文字典数据库系统采用的是典型的Mediated系统集成结构。数据集成系统一般主要通过中介模式将各个部分的数据源的数据集成起来,而整个系统的数据仍然存储在各个局部数据源中,通过包装器对数据进行转换。用户在利用数据库进行数据查询的过程中能根据局部数据源模式进行一系列的查询,引入本体层以后,中介器将对用户的查询进行分析,提取有效信息进行查询之后将查询结果反馈到中介器中重新组合查询,并对每个数据库进行结果数据分析,将符合数据可使用要求的信息反馈出现,解决数据源数据更新问题,从而降低系统工作效率。

2 电子商务时期中文字典数据库的生成思路

2.1 数据库生成思路

在电子商务时代,电子字典数据库生成以后,必须将其汇总到总数据库中进行统一的分析。目前,我国数据库技术已经相当成熟,下一步的主要进度是将生成的数据库进行进一步的分析和研究,并重视数据库本身的发展。由于汉字的复杂性,需要大量的手动操作技术,而自动生成的部分数据,可能会使系统建立生成更加具有效率。一般情况下,在电子词典中汉字要素包含:简体字、ID、拼音、声调、内码、偏旁、笔划、注释以及拼音等,而在电子字典数据库的开发中,要注意Windows程序开发难度分析,因为操作系统的提供的应用程序接口直接关系着程序开发的难易程度。

2.2 GB2312字库全集的生成

GB2312编码是我国汉字信息专用编码,收录的汉字信息比较多,比如,字母、简体化汉字等图形字符,因此,中文字典的汉字收集数量较庞大,最多可达到6763个汉字收集数。中文字典字库中的所有汉字均按照区位分步法进行分析,可以将它们分为A1-FF区进而位,然后生成中文字典字库文件。

3 电子商务时期中文字典数据库生成设计分析

3.1 数据库维护设计

在电子商务环境发展下,中文字典的基础数据库形式为SMART,软件的核心构成部位即是该软件中的一个重要字典。在其结构中能够看出车站代码和电报略码均具有唯一性,能够用于记录数据,如果将电报简码作为主键处理,根据不同的需求,车站名称和站名简称两个字段用于显示和报表;根据输入方式的不同,设置不同的输入码处理方式,并且将拼音略码和电报略码的用于标明字典或其他字典关系,车站等级主要用于标记车站所述范围,起始有效期和终止有效期主要用于数据有局限性的字典。处理这些关键技术以外,为了提高字典访问下来,还要按照站名略码及车站名称建立多个索引。字典的维护与一个普通表的形式没有太大的区别,但是SMRAT系统中这种字典一般数据数据字典,必须有专用软件进行专门的维护和管理。另外,还要注意基础字典本身在建立过程中汉字的输入只能在Windows操作系统提供的中文输入法中进行。

3.2 数据库查询模块设计

在电子商务数据分析环境下,数据字典存储在服务器中,能够在前台应用中采用嵌入式SQL语句进行数据查询,这种数据查询功能的实现一般在存储过程中实现。在数据库生成系统实际应用中采用数据缓冲技术实现数据查询。此技术实现的方法首先是在本地设置一个高速数据缓冲区,进行数据检索的过程中首先判定数据是否在缓冲区,然后根据具体情况在缓冲区实施数据检索。这种检索方法能够有效减少服务器下端数据数量,提高工作效率。同时能够减少与服务器的交互次数,改善服务器性能。

3.3 字典表自定义数据录入模块设计

数据录入模块的主要设计思路是根据后台数据维护程序利用字典表进行数据录入程序设计思路的构想,设计实现步骤如下:首先,编写数据字典查询所用的存储过程代码,并在数据库中建立该存储过程;其次,在窗口设计窗组件中用于显示查询结构集,能够直接选用上面的存储过程作为数据源,并指定用户输入码为被动参数,然后在应用程序界面设置一个名为Sle-station-name的单行编辑器组件用于显示站名,而后再设计一个名为sle shortcode单行编辑器组件用于输入站名略码;而后为事件编写脚本:dw_dictiotmry retrieve(sle shortcode text);最后,利用自定义的输入码进行字段输入分析。

4 结术语

中文字典在设计的过程中每个属性都需要手工识别、计算和生成到汉子数据库中,给系统带来较大的麻烦。而进行较好的数据库生成设计能够解决数据库生成困难等问题,提高工作效率。本文基于电子商务环境分析中文字典数据库生成设计,采用数据库生成算法结合其实现方式,得出的中文字典数据库生成设计步骤实施证明这种方法能够将系统处理效率可达到50%以上。

【参考文献】

[1]杜根远,李瑞民,苗放.中文电子字典数据库生成算法研究[J].计算机工程与设计,2009,17:4134-4137.

[2]张弋.PHP站内中文搜索技术的研究与实现[D].上海交通大学,2009.

[3]江山,汪新庆.Visual C#调用DAO向Access数据库写入字段标题[J].电脑编程技巧与维护,2010,11:44-45+82.

[4]莫祖英,马费成.数据库信息资源内容质量用户满意度模型及实证研究[J].中国图书馆学报,2013,02:85-97.

[5]孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,12:1822-1836. [6]张黎明.大宗数据中数据优化抽取方法的研究与应用[D].东华大学,2008.

[7]丘志文.基于认知机理的汉字智能造字之汉字基元研究[D].华南理工大学,2008.

[8]罗春丽.录井数据字典管理系统的设计与实现[D].大连海事大学,2010.

[9]崔冬槐.管理信息系统自动生成器的设计与实现[D].哈尔滨工程大学,2002.

[10]薛晓敏,王汉青,薛延学.数据字典的设计及应用[J].电脑编程技巧与维护,1995,12:41-43+57.

[责任编辑:王楠]

猜你喜欢
电子商务数据库
2025年我国农村电子商务交易额达到2.8万亿元
《电子商务法》如何助力直销
电子商务
关于加快制定电子商务法的议案
电子商务人的核心能力
期刊订阅电子商务平台