基于云计算平台的政务大数据信息资源共享模型构建研究

2024-01-27 16:44李志文
电脑知识与技术 2023年36期
关键词:信息资源共享

李志文

摘要:本研究旨在基于云计算平台构建一种高效的政务大数据信息资源共享模型,以满足日益增长的信息共享需求。在这个模型中,考虑到數据资源的分块传输、共享任务调度、性能优化等关键要素,进行了一系列实验来评估模型的性能。实验结果表明,本文提出的共享模型相较于常见的资源共享模型在吞吐量和抗噪声能力方面表现出明显的优势,适用于政务大数据信息资源的高效共享。

关键词:云计算平台;政务大数据;信息资源共享;共享任务调度

中图分类号:TP393      文献标识码:A

文章编号:1009-3044(2023)36-0056-03

开放科学(资源服务)标识码(OSID)

信息技术的快速发展令政府部门产生了大量的政务大数据信息资源,这些数据资源包含了有关公共服务、政策决策和社会管理等各个领域的重要信息[1]。政府大数据信息资源的积累为政府工作提供了有力支持,也为社会发展和公众生活提供了更多便利。然而,这些宝贵的数据资源通常分散在不同的部门和系统中,难以有效整合和共享。因此,政府大数据信息资源的共享问题已经成为信息化建设中的一项重要挑战[2]。政务大数据信息资源共享具有广泛的应用前景,它可以帮助政府更好地理解社会现象,制定更智能的政策,提供更优质的公共服务,同时也能促进社会创新和经济发展。然而,政府大数据信息资源的共享不仅涉及数据的安全和隐私问题,还需要解决数据资源分散、格式不一、存储方式多样等问题。因此,为了实现政府大数据信息资源的高效共享,需要一种可行的共享模型和相应的技术支持。

1 云计算平台下的资源共享模型概述

1.1 云计算平台的基本特点

云计算平台的核心特点包括:1)弹性伸缩性:云计算平台允许根据需求动态分配计算和存储资源,使政府部门能够灵活地应对不同工作负载和数据规模的需求;2)资源集中管理:所有计算和存储资源都集中在云计算数据中心,由云服务提供商负责管理和维护,政府部门无需负责硬件设备的采购和维护;3)自服务性:云计算平台为政府部门提供了自助服务的能力,用户可以根据需要自行申请和配置资源,无需等待烦琐的审批流程[3]。

1.2 云计算下的资源共享模型设计

在云计算平台下,政务大数据信息资源的共享模型应包括以下关键要素:1)数据资源分块和传输:数据资源应该根据需求被分成适当大小的块,并通过高速网络传输到云计算平台的虚拟节点;2)共享任务调度方法:为了有效地分配共享任务,需要设计合理的调度方法,考虑任务的优先级、时间开销等因素,以确保资源的高效利用;3)性能优化策略:为了提高模型的性能,应考虑优化策略;4)模型构建流程:模型的构建过程需要明确的设计和实施流程,包括资源块的划分、数据传输、任务调度和性能优化等步骤[4]。

2 模型设计

政务大数据信息资源的共享模型需要有效地将大量数据资源分块并传输到云计算平台,以实现高效的共享。

2.1 数据资源分块概述

数据资源分块的目标是将政务大数据划分为适当大小的块,以便更好地管理和传输[5]。以下是数据资源分块的关键步骤和考虑因素:

1)块大小的确定:根据数据的性质和传输性能,确定适当的块大小。例如,对于文本数据,可以以文件、段落或句子为单位分块;对于图像或视频数据,可以以帧或分辨率为单位分块。数据块的大小的确定要考虑能否充分利用云计算平台的资源,避免太小的块导致传输开销增加,也避免太大的块导致传输性能瓶颈。

2)数据块标识:每个数据块应该具有唯一的标识符,以便在传输和存储过程中进行跟踪和管理。这可以是唯一的数字、哈希值或其他形式的标识。

3)数据块完整性:每个数据块应包含足够的信息以确保数据的完整性和可恢复性。可以使用冗余信息或校验和来检测和纠正传输中的错误。

2.2 数据块分块

首先对政务大数据信息资源数据进行分块,并对数据块进行块标识和具体定义。其中,对政务大数据信息资源数据进行数据分块的结果如图1所示。

2.3 共享任务调度方法

在完成政务大数据信息资源的数据块分类和标识之后,进一步设计共享任务的调度方法,通过任务需求分析、资源分配与管理、数据块访问控制等关键步骤,以及监控、故障处理和性能优化等策略,实现高效的政务数据资源共享。该机理通过动态任务队列管理和任务调度策略来满足不同任务的优先级和资源需求,同时通过数据块缓存与预取、自动伸缩和报告审计等措施,确保数据安全、合规和高性能,从而有效支持政府机构在云计算环境下的数据共享需求。共享任务调度具体流程如图2所示。

2.4 性能优化策略

在完成共享任务调度方法的设计后,进一步选择以资源利用最大化为目标函数,进行政务大数据信息资源共享模型的性能优化。以资源利用最大化为优化目标能够充分利用云计算平台的资源,提高资源的利用效率,同时确保政务大数据信息资源共享模型的高性能。

以下是基于政务大数据信息资源的目标函数构建:

[Maximize U]                                        (1)

[U=α·1Ni=1N(1-RiCPUj-MiRAMj-SiStoragej)]        (2)

其中,CPUj表示第j台计算节点的CPU利用率,CPUj ϵ[0, 1] 之间;RAMj表示第j台计算节点的内存利用率,RAMjϵ [0, 1];Storagej表示第j台计算节点的存储利用率,Storagejϵ [0, 1];Ti表示第j个任务的执行时间,以秒为单位;Ri表示第i个任务所需的 CPU 资源;Mi表示第i个任务所需的内存资源;Si表示第i个任务所需的存储资源;N表示任务的总数量;ɑ表示资源利用的权重。各目标函数考虑了每个任务所需的 CPU、内存和存储资源,以及每台计算节点的可用资源。权重用于调整资源利用的重要性。

对于每台计算节点j,需要确保其 CPU、内存和存储资源不会超过其容量:

[Ri≤CPUj, Mi≤RAMj, Si≤Storagej, ?i,j]       (3)

确保任务的执行时间Ti大于等于零:

[Ti≥0, ∀i]                       (4)

任务i的资源需求必须满足其执行所需的 CPU、内存和存储资源:

[Ri≤CPUj, Mi≤RAMj, Si≤Storagej, ∀i,j]        (5)

确保每个任务i只分配给一个计算节点j进行执行:

[jxij=1, ∀i]                                    (6)

确保计算节点上的任务数量不超过其容量:

[iRi×xij≤CPUjiMi×xij≤RAMj ∀jiSi×xij≤Storagej]                      (7)

确保任务分配变量xij为二进制变量(任务要么被分配,要么不被分配):

[xij∈{0,1}, ∀i,j]                           (8)

2.5 烟花算法优化策略

烟花算法具备出色的全局搜索能力和适用于多目标问题的特性,能够有效地在复杂的资源分配和任务调度问题中找到均衡的解决方案,所以使用烟花算法求解基于云计算平台的政务大数据信息资源共享模型的性能优化策略,以资源利用最大化为目标函数,最大化资源的综合利用,提高政府机构的资源效率和数据共享服务性能。

适应度值函数是在优化问题中用于衡量解的质量的关键,是烟花算法的重要部分,用于对解进行排序和选择,能够反映解的性能,其根据问题需求的不同而变化,适应度值越大越好,可以通过适当的权重和归一化来调整,以满足问题的优化方向和范围要求。本算法使用优化目标函数作为实用度值函数,其表达式如下:

[Fitness(x)=U=α1Ni=1N(1-RiCPUj-MiRAMj-SiStoragej)]  (9)

Step1:初始化:随机生成一组初始烟花,设置x=100,每个烟花表示一种资源分配和任务调度方案,确保每个解的资源分配和任务调度满足约束条件。

Step2:目标函数评估:对于每个烟花x,将x代入适应度值函数计算其资源利用度U,根据目标函数计算其适应度值,并根据适应度值对烟花进行排序,形成前沿集合。

Step3:迭代优化:重复以下步骤,直到满足停止条件,即训练过程中适应度值趋于收敛。

烟花的发射和爆炸:对于每个烟花,根据其适应度值和前沿集合中的其他解,计算其发射方向和距离;发射烟花,生成新的解,并计算其适应度值;如果新的解更优,替换原始解。

Step4:输出最优解:根据最终的前沿集合,选择具有最高资源利用度U的解作为最优解,作为资源分配和任务调度的最佳策略。

Step5:收敛和停止:结束迭代,输出最优解。

3 实验方法和评估

3.1 实验设置和模拟环境介绍

操作系统:64位Windows 10操作系统;使用PyCharm调试和运行Python代码;Python 3.9.7版本,用于实现算法和模拟环境;使用TensorFlow 2.6.0作为深度学习框架搭建基于云计算的政务大数据信息资源共享模型,包括计算节点、任务队列和资源需求等;任务生成:随机生成不同类型和大小的任务,模拟政务大数据信息资源共享模型中的任务需求。

3.2 共享任务分配性能实验

根据前面对资源利用率最大化目标函数的构建和求解,以资源利用率、响应时间和任务完成率作为性能优化的评价指标。其中,资源利用率是衡量计算节点的 CPU、内存和存储资源的利用程度。这个指标应该显著提高,以确保资源得到充分利用;响应时间:衡量任务完成所需的时间,可以是任务队列中任务的平均响应时间。目标是降低响应时间,以提高任务执行的效率。

1)资源利用率

平均CPU利用率为77.5%,内存利用率为67.5%,存储利用率为57.5%。这表明系统的资源利用率相对较高,但仍有改进的空间,尤其是存储资源的利用率较低。

2)响应时间

将系统信息处理分为四个不同类型的任务,分析其响应时间。其中,任务1代表政府机构或相关部门提交的一种常规性、较简单的任务,包括数据查询、报告生成或其他类似的操作;任务2代表政府机构提交的稍复杂一些的任务,包括数据分析、资源分配决策、政策建议等;任务3代表相对较简单但需要快速响应的任务,包括实时数据监控、事件响应等;任务4代表政府机构提交的较复杂、计算密集型或需要较长时间处理的任务。

从表2可以看出,任务的平均响应时间在22毫秒到35毫秒之间,表明系统的响应速度较快,任务能够及时完成。

4 结语

本文构建和优化了政务大数据信息资源共享模型,基于云计算平台,以满足政府机构在信息资源管理和共享方面的需求。通过对模型的构建和性能优化进行深入研究,得出以下结论:

1)模型构建:本文构建了一个基于云计算平台的政务大数据信息资源共享模型。该模型包括计算节点、任务队列和资源需求等关键组成部分,能够有效地支持政府机构在信息资源管理方面的需求。

2)共享任务调度:提出了一种基于数据块的任务调度方法,充分考虑了数据块的特性和资源分配的优化。该方法能够在资源利用率和任务执行效率之间取得平衡,提高了资源的综合利用。

3)性能优化策略:采用了烟花算法作为优化策略,并针对资源利用最大化制定了目标函数。通过模拟实验,我们证明了该策略的有效性,显著提高了系统的资源利用率、任务响应速度。

最后通过实验验证,本文所提出的模型和优化策略在不同任务负载下表现出了良好的性能和稳定性。但本文研究仍存在进一步改进和拓展的空间。未来的工作可以关注算法参数的优化、更复杂场景下的性能评估以及安全性和隐私保护等方面,以进一步提升政务大数据信息资源共享模型的效能。

参考文献:

[1] 李翔.云计算平台下政务大数据信息资源共享模型构建[J].微型电脑应用,2023,39(6):137-140.

[2] 赵伟,侯聪聪,白晨.基于网络平台的科技信息资源共享博弈模型构建与验证[J].中国科技资源导刊,2022,54(6):12-19.

[3] 盛守一.基于区块链技术的供应链信息资源共享模型构建研究[J].情报科学,2021,39(7):162-168.

[4] 卞咸杰.大数据时代档案信息资源共享平台数据挖掘模型的研究与实现[J].档案管理,2020(4):21-24.

[5] 张诗军,蔡文海,王海吉.基于信息资源规划的企业级共享数据模型构建方法[J].计算机应用与软件,2010,27(11):154-156.

【通联编辑:张薇】

猜你喜欢
信息资源共享
信息资源共享与知识产权保护的关系及其协调发展
基于IC理念的档案信息资源共享
高校图书馆文献信息资源共享探析
以信息资源共享为基础的高校档案管理模式探究
浅谈我国高校图书馆信息资源的共享现状及对策
MOOC环境下广西高校图书馆信息资源共享策略研究
图书馆学领域信息资源共享研究进展分析(2011—2015年)