耙吸挖泥船数据传输过程中产生的丢失和延迟问题的处理方法

2020-06-03 17:23王蔚关放
科技视界 2020年13期

王蔚 关放

摘 要耙吸挖泥船的自动化程度与日俱增,需要分析处理的采集数据也较为繁多,如果数据在传输过程中出现丢失和延迟的问题,会对后续的分析和预测建模产生较大的影响。本文针对这一问题,讨论各种可行的解决方法。

关键词数据丢失;数据延迟;延迟校准

0 引言

耙吸挖泥船在施工作业时会产生大量的数据,在集中传输这些数据时,会由于部分数据丢失或者传输延迟,导致数据不可用的问题,造成数据分析困难,预测建模不准确。对于数据丢失问题,本文将阐述利用“去除”和“补充”两大方法的优劣及应用场景;而对于数据延迟,本文将着重分析如何对数据延迟进行校准并同步。

1 数据丢失的处理方法

1.1 去除法

去除法是最原始的方法,也是较为有效的方法之一。此方法是将丢失的数据整个去除,该方法操作简便,处理便捷,效果明显。耙吸挖泥船在施工作业时,采集并记录的数据非常庞大,小到吃水传感器的数据,大到主机、推进器的数据,实际在某时刻丢失的数据占整个数据的量非常之小,采用去除法对数据库的整体性影响较小,对后续数据分析和预测建模几乎不会产生很大的干扰。但是,这种方法也存在其局限性,如果在耙吸挖泥船施工作业中,某一传感器由于损坏或者传输线路不畅,导致丢失数据过多,在整个数据库占比较大时,采用去除法就会存在很大的缺陷,这会导致数据的整体性遭到破坏,分析的价值大大降低,并导致数据分析的结果不能反映真实的情况,数据对后续的预测建模没有了参考价值。

1.2 补充法

补充法是利用给定的值去补充丢失的数据,使得数据库逐步完善,达到可以分析利用的程度。通常情况下,该方法通过统计学相关知识,根据前后数据或者历史数据,为当前的丢失的数据补充一个合理的数值。具体分为以下几种方法:

1.2.1 手动输入法

耙吸挖泥船在施工作业时,有经验的操作人员,在分析多个疏浚作业过程的数据后,对丢失的个别数据,可以通过经验判断出比较准确的数值。这样由人工输入的数据一般比较合理,产生的数据曲线也比较平滑。然而,正常情况下,该方法会占用大量的处理时间,当数据丢失较多,或者人工经验相对欠缺时,该方法就不是那么适用了。

1.2.2 均值估计法

耙吸挖泥船在施工作业时的传输数据大多数都属于数值型的数据,非数值型的数据均值估计法是不能适用的。均值估计法一般有两种方法,一种是将采集到的所有数据进行平均,这种方法比较简单直接,处理方便且速度快。第二种方法是条件平均,参与平均计算的数据不是从整个数据库选取,而是按照相似数据进行平均操作,这种方法在实际操作中也是简单而且行之有效的。这两种方法本质上是一样的,都是通过对数值取平均值,从而推断实际的数值,尽管两者所采集的数据有所不同。

1.2.3 回归分析法

采集过往耙吸挖泥船施工作业时的数据,然后根据这些数据,建立回归模型,当某个传感器的数据缺失时,将其他数据放入回归模型,从而计算出该丢失数据的值。采用这种方法,预测数据的精确性很大程度上依賴所选取得回归模型的准确性,所预测的数据会产生不必要的误差,而且这种误差往往很难避免。

1.2.4 统计模型法

基于统计学知识,可以将丢失的数据看作是具有随机性的数据,通过采集到的大量数据,可以确定出数据参数分布的统计模型,并且假设模型的准确性,通过该统计模型去确认丢失数据的数值。采用该方法需要最大化所采集数据的量,只有在大样本的条件下才能保证推断出的数据准确性。但这种方法很容易使得估计得数值能够达到局部最优,但没有达到全局最优,且收敛速度比较慢,计算会相对比较复杂。

2 数据延迟的校准方法

由于耙吸挖泥船的密度计安装在泥泵的出口位置,与耙头处吸入泥浆的实时密度必然产生一定延迟,而控制耙头处的实时泥浆密度对于提高施工作业效率更有参考意义。下文针对耙吸挖泥船吸入泥浆密度延迟的问题,展开讨论,并作完整分析。

2.1 测量延迟

3 结语

本文介绍了耙吸挖泥船在传输数据时出现丢失时的解决方法,并给出了数据延迟的校准推导。经过上述方法处理后的数据可以较好地应用于后续的数据分析及建立预测模型。如今越来越倡导耙吸船的智能化,而智能化离不开大量的数据支撑,只有做好前期的数据积累,未来耙吸挖泥船的智能化步伐才能越走越快。

参考文献

[1]张燕.国内外大型耙吸挖泥船的关键技术发展研究分析[D].哈尔滨工程大学,2010.

[2]王柳艳,田雨,俞孟蕻.耙吸挖泥船耙头密度估计器研究与分析[J].中国港湾建设,2014(11):69-72.

[3]钱广亭.基于模型预测控制的耙吸挖泥船疏浚机理优化的研究[D].江苏科技大学,2012.

[4]张朔.数据驱动的耙吸式挖泥船疏浚作业模型及优化[D].上海交通大学,2011.