基于人工智能的水处理设备自动化监控与控制系统研究

2023-12-22 06:48赵青娥
装备制造技术 2023年10期
关键词:决策树水质分类

赵青娥

[益科德(上海)有限公司,上海200070]

0 引言

随着全球工业化和城市化进程的加速,水资源的质量和可用性成为各国都非常关注的问题[1]。在这样的背景下,水处理设备不仅仅是一种技术装置,更是确保水资源安全、满足人类生活和生产需求的关键环节。水处理设备的效率、准确性和稳定性直接影响到供水质量、环境保护和工业生产的持续性。

然而,随着技术的进步和需求的增长,传统的水处理设备监控和控制方法逐渐暴露出其局限性[2]。例如,这些传统方法可能不能及时检测和应对突发事件,也可能难以处理大量、复杂的数据。因此,为了更好地满足现代社会对水处理设备的高效、智能的需求,我们亟需寻找一种新的技术方案。

人工智能(AI)作为近年来的热门技术,已在许多领域显示出其巨大的潜力和价值。特别是机器学习和深度学习技术,通过模型训练和智能分析,能够处理和解析大量数据,为决策提供有力支持。考虑到这一点,将人工智能技术应用于水处理设备的自动化监控与控制系统[3],无疑是一个创新和前沿的研究方向。

本研究旨在探讨和验证人工智能在水处理设备自动化监控与控制中的应用价值。通过本研究,为水处理行业提供一种新的、高效的技术方案,以提高设备的运行效率,确保水质的稳定,为相关领域的研究者和工程师提供借鉴和参考。

1 水处理设备的种类与特性

水处理实验时,选择合适的水处理设备并了解其规格与参数是至关重要的。因此,本节将详细介绍实验中所使用的水处理设备的种类、工作原理及特性。通过了解这些设备的特性和参数,我们可以更好地理解它们在水处理实验中的作用,为后续实验提供准确的评估。

过滤器:过滤器是水处理设备中常见的一种,主要用于去除水中的悬浮物和颗粒物。监测水质中的颗粒物密度,过滤介质含量等,其工作原理是通过过滤介质(如砂、活性炭等)截留水中的杂质。过滤器的特性包括高过滤效率、大流量处理能力以及对颗粒物的有效去除。

离子交换器:离子交换器主要用于去除水中的离子,如硬度离子、酸性离子等。其工作原理是通过离子交换树脂中的离子与水中的离子进行交换,从而达到去除特定离子的目的。离子交换器的特性是能够高效地去除离子,但需要定期再生以恢复树脂的交换能力。

逆渗透设备:逆渗透设备是一种通过半透膜去除水中溶解物和离子的设备。监测其中的半透膜通过速度,通过的分子大小等。其工作原理是通过施加压力,使水分子通过半透膜,而溶解物和离子被截留在膜的一侧。逆渗透设备的特性是能够生产出高纯度的水,但能耗较高。

超滤设备:超滤设备通过超滤膜过滤水中的悬浮物和胶体物质。监测指标主要是水质中悬浮物质浓度指标和大分子物质的密度,工作原理是通过超滤膜的微孔结构截留水中的杂质。超滤设备的特性是能够处理大流量的水,并有效去除胶体物质。

2 基于人工智能的水处理设备自动化监控控制系统

2.1 问题建模与求解思路

实现水处理设备自动化监控控制系统,我们可以将其建模为一个分类问题。具体来说,我们可以将水处理设备的状态分为两类,例如“正常”“异常”,并使用支持向量机对其进行分类。进一步,根据所得到的水处理设备监控系统检测的设备运行状态信息以及水质检测信息,通过人工运行维护策略的历史记录信息,建立有监督的决策树学习,最后为提高系统的决策性能,使用Bagging 方法,通过N 个决策树的决策结果,实现对每一个水处理设备的控制策略的选择,从而实现一个自动化的水处理设备自动化监控控制系统,具体实现过程如图1 所示。

图1 水处理设备自动化监控控制系统示意图

首先,需要部署监测设备。这些设备包括传感器,它们被安装在水处理设备上,用于实时监测水质和设备状态。过滤器的压差,流量分别用pfilter,Sfilter表示。离子交换器的出水水质,流量用pH 传感器和流量传感器进行实时测量,表示为,se,逆渗透设备的监控信息用进水压力、产水流量和脱盐率表示为pre,s re,rNa。

其次,针对水质的监测,我们考虑使用的传感器包括:pH 值传感器用于监测水的酸碱度,浊度传感器用于监测水的清澈度,电导率传感器用于监测与水中的溶解盐分有关的电导率,温度传感器用于监测水温,而余氯传感器则用于监测水中的余氯含量。为了确保监测的准确性,我们还需要确定一些关键的监测指标,如pH 值、浊度、电导率、温度和余氯含量。分别用xph,xz,xp,xCl表示,作为水质监控系统的输入与监测指标。

针对上述所采集的信息,我们首先对设备的监测参数指标进行归一化,这里我们使用z-score 进行标准化,以消除数据量纲对实验结果的影响。

针对该系统,首先,对水处理设备进行建模,将该问题转化为一个分类问题,确定单个设备的运行状态正常或是异常。

其次,基于单个设备的运行信息(通过传感器信息获取到了设备运行状态下的实时监测指标),假设:对于设备A 监测指标共有n个,则输入向量可以表示为:

这是一个二分类问题,数据的标签可以基于人工进行标注,基于各个设备运行的历史信息对设备运行状态进行标注,从而获得用于模型训练的数据集,随后利用机器学习方法,对该数据进行建模,这里针对水处理设备的监控采用SVM 支持向量机进行分类。

SVM[3]的本质是求解以下凸二次规划问题,目标是在特征空间中找到一个超平面,将不同类别的样本分开。这个超平面的选择是通过最大化间隔来实现的。间隔是指超平面到最近的训练样本的距离,最大化间隔可以提高分类的鲁棒性。

其中,w是超平面的法向量,x是特征向量,b是超平面的截距。

在对该水处理系统进行控制时,需要对多个水处理设备进行控制,以获得最优的效益[4],这是一个多分类问题,分类的个数取决于水处理设备的种类个数,机器学习算法方面,选择使用随机森林作为分类算法。在模型训练完毕后,使用验证数据集对其进行验证,以确保其分类效果。部署到实际的监控系统中,实时接收传感器数据并进行分类,从而确定单个水处理设备的响应状态。

随机森林来源于决策树[5],其中的每颗决策树取决于p维的随机变量集X,随机变量Y代表响应,目的是为了寻找用于预测Y的预测函数f(X),其中预测函数由损失函数L(Y,f(X))表示,随机森林算法使用集成学习的方法,训练多个决策树,分类过程中通过结合器将多个估计器的结果整合作为最终决策结果输出,可以提升单个决策树的通用性和鲁棒性,具有更强的决策性能。

随机森林(图2)通过bagging 算法,假设训练数据集大小为N,每次从其中有放回地取出M个子数据,取K次,则可以根据这些数据集建立K个决策树,基于这些决策树的预测结果进行多数分类策略,得到最终的模型预测结果。

图2 随机森林算法基本过程

针对每一个决策树的建立,由于传感器的数据往往是连续值,因此采用可以处理连续属性的C4.5 算法,该算法使用最大信息增益比的原则进行决策树分支的选取,信息熵是一种信息度量方法,其算式为:

式中,D表示数据集D,pk表示类别xi出现的概率。

C4.5 算法中信息增益率表示为:

式中,Dv表示在第v特征分支下,划分出的数据集样本数目,这样就可以得到用于分类的决策树。基于K个决策树进行多数投票,即可实现随机森林算法,实现更加稳健的分类效果。

2.2 模型性能评估

设备异常检出率用于水处理设备的故障检出,由于在该场景中,会出现样本不均衡现象,所以这里对水处理设备的自动化监控指标用异常状态的召回率和精准率进行表示,召回率表示能否对水处理设备的异常状态实现检出,精确率表示日常运行中水处理设备是否会经常出现误报,综合考虑两者,使用F1-score 指标进行描述:

3 实验结果

针对某大型水处理厂的水处理,在前期调研中收集了该水处理厂各个水处理设备的运行状态、可获取参数以及水质的历史监测信息,并基于该工厂的运维记录实现标签的获取,减少人工进行标注的困难,针对四种水处理设备,分别监测第一节中所述指标,以30min 为时间步长获取历史的水处理设备所处的运行环境指标,共获取5836 个数据样本,约半年内的运行维护数据,每个样本可以为四种水处理设备的二分类提供数据支持,随后利用该运行信息,通过Python实现时间维度上的对齐,保证数据和设备运行状态的对齐。随后利用sklearn 工具箱实现两种机器学习算法,分别实现设备的运行状态监测以及水处理系统中的控制策略(这里的控制策略用预测采取措施的水处理设备与真实运维记录的水处理设备控制类型进行比较,相同则该类型的控制认为是有效的),训练集和测试集划分比例为4∶1。实验结果列于表1 和表2。

表1 水处理设备二分类监控实验结果

表2 水处理控制系统控制准确率

从表1 和表2 可以看出,基于机器学习的人工智能算法,可以较为有效地在水处理设备的运行状态检测和控制中采取较为准确的措施,这为自动化水处理厂设备的运行维护具有较为重要的意义,但是本文的结果也表明,在某些水处理设备,比如逆渗透设备的控制和状态检测中仍有一些不足,需要进一步研究其效果不佳的原因。

4 结语

通过实验验证基于机器学习的人工智能方法在水处理设备自动化监控与控制中的应用价值。该方法具有较好的监控结果,取得了较为良好的控制预期,期望通过本研究,为水处理行业提供一种新的、高效的技术方案,以提高设备的运行效率,确保水质的稳定,为相关领域的研究者和工程师提供借鉴和参考。

猜你喜欢
决策树水质分类
水质抽检岂容造假
分类算一算
一种针对不均衡数据集的SVM决策树算法
分类讨论求坐标
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
决策树和随机森林方法在管理决策中的应用
数据分析中的分类讨论
教你一招:数的分类
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用