基于马尔可夫链的应用系统可用性预测

2023-07-14 18:10张玉爽李佳珍张婷等
计算机应用文摘 2023年12期
关键词:应用系统故障处理

张玉爽 李佳珍 张婷等

摘要:随着企业应用系统与业务的不断融合,企业应用系统的可用与否直接影响日常办公和科研生产,因此保障其持续可用有着重要的意义。本文通过研究马尔可夫链,提出基于马尔可夫链的应用系统可用性预测模型.根据历史统计数据,对下一阶段应用系统可用性进行预测,根据预测结果对可能出现的故障进行提前处理,从而提高系统稳定性。通过将该预测模型在北京计算机技术及应用研究所中进行实际应用,应用系统平稳运行时间延长,提升了用戶体验。

关键词:马尔可夫链;应用系统;可用性预测;故障处理

中图法分类号:TP316 文献标识码:A

1 引言

随着企业不断发展,应用系统逐渐增多,系统规模不断扩大,企业内的日常办公和生产几乎全部依托于应用系统,因此应用系统的稳定性将直接影响办公效率和生产进度。由于应用系统故障发生的时间不确定,发生故障时无法及时察觉,因此传统的信息系统故障处理往往是故障发生后再进行处理[1] ,故障排除周期长,造成的影响较大,导致企业内用户对企业信息化及日常运维满意度较低。基于此,企业急需一套应用系统可用性预测方法,可以预测未来系统可用性的状态,根据可用性状态提前处理可能发生的故障而延长系统的稳定运行时间[2] ,从而达到提高企业高效运转的目的。本文通过研究马尔可夫链模型,将其用于应用系统可用性预测,为应用系统可用性预测提出了一种新的解决思路。

2 马尔可夫链介绍

马尔可夫链是概率论和数理统计中具有马尔可夫性质且存在于离散的指数集和状态空间内的随机过程。马尔可夫链研究的是系统的各个状态及各个状态之间的相互变化,系统的下一状态仅和当前状态及状态转移概率有关,而与历史状态无关,即具有无后效性[3] 。马尔可夫链可以根据当前状态预测在将来某个时间点各个状态的分布情况,进而为决策提供依据。马尔可夫链模型在光伏电站可靠性评估[4] 、降雨量预测[5] 、工业系统中轴承的故障预测[6] 等领域均有广泛应用,是一种非常有用的数据工具。马尔可夫链模型通常由3 个元素组成,即〈S,π,A〉。

其中,S 表示模型中的状态,状态数量用N 表示,则:S ={s1,s2,…,sN } (1)

S 与N 的值根据具体的实际问题进行设置,且N个状态间存在一定的联系。

5 结束语

企业应用系统的可用性影响企业的日常办公和科研生产,因此如何预测系统可用性状态并提前采取措施,以保障应用系统持续平稳运行是企业重点关注的工作。本文应用马尔可夫链模型对应用系统可用性状态进行预测,取得了较好的效果,为后续应用系统可用性预测提供了新的思考方式。但预测模型需要以大量的统计数据为支撑,本文的统计数据有限,且应用系统的可用性随着bug 的修复会逐渐趋于稳定,因此状态转移矩阵会根据实际情况有一定变化,针对状态转移矩阵的计算可以进行进一步优化。

参考文献:

[1] ZHAO Y X. On preventive maintenance policy of a criticalreliability level for system subject to degradation [ J ].Reliability Engineering & System Safety,2003,79(3):301?308.

[2] 孙博,康锐,谢劲松.故障预测与健康管理系统研究和应用现状综述[J].系统工程与电子技术,2007,29(10):1762?1767.

[3] 朱晓荣,王羽凝,金绘民,等.基于马尔科夫链蒙特卡洛方法的光伏电站可靠性评估[J].高电压技术,2017,43(3):1034?1042.

[4] 于慧,孙宝盛,李亚楠,等.应用灰色模糊马尔科夫链预测海河水质变化趋势[J].中国环境科学,2014,34(3):810?816.

[5] SOUALHI A,CLERC G,BADAOUI M El. Hidden MarkovModels for the Prediction of Impending Faults [ J]. IEEETrans. Industrial Electronics,2016,63(5):3271?3281.

[6] 秦亚茹,侯志霞,吕瑞强,等.基于马尔科夫链模型的脉动装配线运行状态预测[J].航空制造技术,2017(5):5.

作者简介:张玉爽(1993—),硕士,工程师,研究方向:企业信息化建设。

猜你喜欢
应用系统故障处理
企业计算机应用系统可靠性测试技术探讨
高校网络维护与故障处理探析
钢铁冶炼机械设备的故障诊断及处理分析
VB应用技术下电教管理系统
高职学院信息化建设中面临的问题和思考
基于微信公众平台的应用系统开发模式研究
企业云平台建设研究
大型化工装置仪表自控系统的故障处理研究
基于计算机网络故障处理及网络维护方法研究