基于数据驱动的车辆动力总成冷却系统密封性质量预测

2021-07-15 02:49杨爱平唐倩撒利军刘达
机械工程师 2021年7期
关键词:密封性冷却系统合格

杨爱平 ,唐倩 ,撒利军 ,刘达

(1.重庆大学 机械传动国家重点实验室,重庆 400044;2.长安汽车有限责任公司,重庆 400023)

0 引言

车辆在行驶过程中会产生大量热量,对于传统内燃机汽车,热量来自于动力总成中内燃机缸体内燃料的燃烧与零件的相对运动,而对于电驱动的新能源汽车,热量则来自于车辆内锂离子电池的产热[1]。这些热量若没有及时被带走,轻则造成车辆运行稳定性下降、燃油经济性降低,重则导致动力总成过热报废。现代车辆冷却系统多倾向于使用成熟的液冷散热,但液冷散热系统存在大量的冷却管路,需要保证其具有良好的密封性。在汽车的生产过程中,冷却系统的密封性检测是在冷却液加注之前进行的,具体方法是对冷却系统进行气体加压处理,通过一个保压过程进行密封性测试[2]。但这种方法工序复杂,并且测试要求的环境条件较高。随着大数据科学的快速发展及汽车生产中全流程信息采集系统的广泛应用,已经可以实现以低成本、大范围、增量累计的方式获取车辆生产过程中的有用信息[3],这为使用基于数据驱动的方法进行动力总成冷却系统密封性预测奠定了基础。相比于传统基于模型的方法,数据驱动的方法可以在没有系统先验知识与准确数学模型的基础上,通过生产与测试过程中产生的大量有用信息训练AI模型,使其具备解决某一特定问题的能力[4]。基于数据的预测方法已经取得了十分广泛的应用,胡杰等[5]基于车辆状态参数、环境信息对电动车行驶里程进行了预测,Lin Xie等[6]基于天然气、石油行业安全仪表的操作数据预测了仪表的故障率。在车辆生产过程中,获取生产数据是比较容易的,并且这些数据中往往蕴含了大量与冷却系统密封性有关的信息,因此使用基于数据的方法预测冷却系统密封性是较为合适的。本文通过数据驱动的方法对动力总成密封性测试结果进行预测,具体选择了二分类的逻辑回归判别模型。方案基于大量的生产过程工艺数据样本,训练逻辑回归模型,直至模型具备良好的输出精度,最终实现对密封性测试结果的预测,本方案的具体流程如图1所示。

图1 方案流程图

1 动力总成及其冷却系统

动力总成是车辆的核心部件,负责车辆动力的产生,决定了整车的动力性、经济性与可靠性[7]。对于传统内燃机车辆,动力总成包含发动机、变速器、进气系统、排气系统、冷却系统、供油系统、发动机悬挂等,而对于电驱动的新能源汽车,动力总成则包含整车动力驱动控制单元、电动机及其逆变器、变速器、冷却系统等。虽然传统汽车与新能源汽车动力总成在结构上存在较大的区别,但均存在冷却系统,冷却系统的运转情况将决定车辆行驶过程是否安全、稳定。传统内燃机汽车的冷却系统主要是为发动机缸体降温,而新能源汽车冷却系统则主要为电池系统降温。车辆冷却系统保证了动力总成在较高输出功率的同时,又具有良好的经济性与可靠性。

现代车辆动力总成主要采用闭式强制循环冷却系统[8],一般由冷却水泵、水热交换器、散热器、循环管路等部分组成,属于典型的液冷散热方式。此外,在纯电驱动汽车的冷却系统中,还会采用风冷、相变材料冷却、热管冷却等冷却方式,但由于液冷散热效率高,其仍然为车辆动力总成主要冷却方式。采用液体方式的冷却系统中,由于冷却管路中冷却液存在较大压力,因此普遍存在泄漏风险,是本文主要研究的问题。液冷系统冷却液泄漏会造成车辆散热效率下降,若冷却液滴落在动力总成中某些控制电路中,则会造成更为严重的损失。

为了使汽车在生产过程中能及时检测到冷却系统是否存在泄漏隐患,本文通过数据驱动的方式对冷却管路进行密封性预测,若预测模型判断某一动力总成冷却系统存在泄漏的风险,则将该动力总成下线检查,将安全隐患排除在产品交付之前。

2 数据驱动的预测模型

2.1 数据集的确定及预处理

数据驱动的预测模型依赖于大量的数据来训练模型,这些数据又分为训练集与测试集,统称为数据集。训练集为训练模型的样本数据,测试集为模型训练好后评价模型的样本数据,由于测试集没有参与模型训练,因此基于其的评价结果会更加客观。本文的数据集来源于动力总成制造过程中产生的生产数据,数据集中包含特征值与目标值,特征值为输入模型的数据,目标值为模型输出的数据,本文数据集中特征值为生产过程中冷却管路各个螺栓的拧紧数据,目标值为对应动力总成冷却系统管路密封性测试是否合格的布尔值,其中测试合格情况与布尔值的具体对应方式如表1所示,模型输入输出关系如图2所示。

图2 模型输入输出关系图

表1 泄漏测试结果布尔值对应表

对于已经采集好的数据,还需进行预处理,包含缺失值处理、归一化处理等。在使用机器学习等数据驱动的方法建模前,需要将训练数据集中异常的缺失值(如Null)进行处理,本文采用的缺失值处理的方法为平均值插补,具体策略为若某一样本的某一数据存在缺失且缺失数据量较少,则结合多个样本得到这一项的平均值,以平均值插补替换缺失值,若缺失数据量太多,则舍弃该样本。除平均值插补法外,还有固定值插补法、最邻近插补法,但由于这类方法对样本误差的影响较大[9],故没有采用。缺失值处理能使模型需求的每个输入值都存在,保证了模型稳定性。

归一化处理的目的是为了消除样本之间的量纲影响,并加快模型训练时的收敛速度,本文使用z分数(zscore)归一化方法,该方法使所有处理后的数据样本符合均值为0、标准差为1的标准正态分布,归一化处理的数据的计算公式为

式中:x为原始数据;x*为归一化处理的数据;μ是样本均值;σ是样本标准差。

2.2 基于逻辑回归的泄漏故障判别模型

逻辑回归(Logistic Regression)是一种广义的线性回归模型(Generalized linear model),是一种常用的统计学方法。回归一般指研究某一数学问题因变量与自变量之间的关系,而逻辑回归往往是使用了Sigmoid函数的回归模型。逻辑回归在机器学习中属于有监督学习,通过预测不同自变量发生某种情况的概率,从而求解某一分类或多分类问题的解,是一种经典的分类问题预测方法。由于本文研究的动力总成冷却系统密封性检测是否合格的问题属于二分类问题,故使用二分类的逻辑回归模型进行预测。

逻辑回归的输入函数h(X)为一线性函数,它将所有螺栓的拧紧数据包含进来,并使用权值系数将螺栓拧紧数据结合到一起,以便于后续的求解分析,输入函数的具体形式为

式中:w0、w1、……、wn为各个权值系数;x0、x1、……、xn为具体的螺栓拧紧数据;b0、b1、……、bn为每一项的偏置系数;W为权值系数集合;X为各螺栓拧紧数据集合。

在定义好逻辑回归输入函数后,引入Sigmoid函数,其值域为[0,1]。Sigmoid函数的具体数学形式见式(3),对应的函数图像如图3所示。

图3 Sigmoid函数图像

由于本文需要预测的目标为动力总成冷却系统泄漏检测是否合格,具体的检测结果只有合格与不合格之分,前文已经将测试结果与布尔值相对应,接下来应该使其与条件概率联系起来,使模型输出测试合格与不合格条件下的概率值。为获得二项逻辑回归的条件概率模型,需将逻辑回归输入函数h(X)代入Sigmoid函数σ(i)中,使函数h(X)的输出映射到值域为[0,1]的区间中,式(4)、式(5)分别为泄漏测试合格(Y=1)与泄漏测试不合格(Y=0)条件下的条件概率分布函数。

在获得条件概率分布函数后,需要将预测得到的条件概率划分为具体的正例与反例以实现二分类,因此需要设定一个阈值s来区分正反例。本文设置的阈值s=0.5,当P(Y=1|X)>0.5时,划分为正例,模型预测结果为动力总成冷却系统密封性检测合格,当P(Y=1|X)<0.5(即P(Y=0|X)>0.5)时,模型预测结果为动力总成冷却系统密封性检测不合格。

2.3 混淆矩阵

由于本文研究的是分类问题,因此通常使用混淆矩阵来评价模型预测能力。混淆矩阵是一种表示精度评价的标准格式,也称为误差矩阵,当问题被分为n类时,往往由n行n列的矩阵构成,二分类的混淆矩阵形式如表2所示。混淆矩阵中,TP(True Postive)表示真实结果与预测结果均为合格的样本数;TN(True Negative)表示真实结果与预测结果均不合格的样本数;FP(False Positive)属于统计学第一类错误,表示将实际不合格的产品预测成合格产品;FN(False Negative)属于统计学第二类错误,表示将实际合格的产品预测成不合格产品[10]。除混淆矩阵外,还有准确率(Accuracy)、精确率(Precision)、正类正确率(True Positive Rate,TPR)、负类正确率(True Negative Rate,TNR)等评价指标,其计算公式如表3所示。

表2 二分类的混淆矩阵形式

表3 评价指标计算公式

3 实验与分析

本文使用从某车企生产现场采集的218组动力总成历史生产装配数据用作训练模型,每组数据为一台动力总成的与密封性有关的螺栓拧紧力与拧紧转矩及最终密封性测试结果。实验平台配置为处理器i5-9400f(2.90 GHz),内 存 为16 GB,显 卡 为NVIDIA GTX1660。实验使用Python编程语言并基于Pytorch机器学习库构建了逻辑回归模型。

首先将数据集进行缺失值处理与归一化处理,保证数据完整且利于模型求解收敛。以7:3的比例将数据集划分为训练集与测试集,分别设置逻辑回归模型超参数:学习率为0.01,分类阈值为0.5,正则化力度为0.01,迭代次数设置为200次,求解优化器选择随机梯度下 降(stochastic gradient descent,SGD)。进行求解运算,得到200次迭代过程中训练集与测试集准确率变化曲线如图4、图5所示。

由图4与图5可知,测试集的准确率随训练次数的增加而增加,且与训练集准确率增长趋势较为一致,说明本文所选的螺栓拧紧数据与密封性之间存在较大的关联性,间接证明了方法的有效性。在训练次数到达100次时,模型开始学习到有价值信息并且开始收敛,在第100次到150次迭代过程中,训练集与测试集准确率上升较快,150次迭代以后,训练集准确率上升缓慢,测试集准确率不再明显上升并开始在85%之间波动,表现出过拟合现象,故训练停止。表4展示了动力总成密封性测试的部分实际测试结果与预测结果。

图4 训练集准确率

图5 测试集准确率

从表4可以看出,逻辑回归模型对于动力总成密封性的预测拥有较高的准确率,除2号样本预测错误以外,其余样本均预测正确。由于训练集参加了模型的训练过程,测试集的预测结果才能客观体现模型的预测性能,为了验证模型对于测试集整体的预测能力,给出了测试集样本预测结果的混淆矩阵如表5所示,模型分类能力评价指标如表6所示。

表4 部分实际测试结果与预测结果

表6 模型分类能力评价指标%

从表5的混淆矩阵中可得,测试集共66个样本,只有7个样本预测错误,其中包括2个统计学第一类错误的样本,5个第二类错误样本,模型将预测错误的样本数控制在了较低的水平。由于本文最主要的目的是将密封性有问题的动力总成检测出来,因此负类正确率(TNR)指标尤为重要,模型基于测试集的负类正确率为88.23%,这表明10个问题样本中会有接近9个被检测出来。此外模型在其他指标上也表现出较高的性能,其中准确率(Accuracy)达到89.39%,精确率(Precision)为95.65%,正类正确率(TPR)为89.79%。以上数据表明,本文的逻辑回归模型具有较高的预测能力,侧面验证了本方案的有效性。

表5 预测结果与真实结果的混淆矩阵

4 结语

本文基于数据驱动的逻辑回归算法建立了对动力总成冷却系统密封性质量的分类判别模型。使用真实生产数据进行实验,得到的预测模型显示出较高的精度,其中最重要的TPR指标达到89.79%,表明不合格动力总成被检测出来的概率较大,满足了实际生产检测需求。通过使用本文的预测模型,可以及时将生产过程中有问题的动力总成下线检修,也可以对此后的人工密封性检测结果提供参考,具有一定的工程意义。

猜你喜欢
密封性冷却系统合格
套管头椭圆型金属密封面密封性分析
膜式燃气表机芯密封性检测装置及方法
新型中厚板快速冷却系统研发
发动机装配过程中火花塞孔密封性测试失效问题分析和解决
我是合格的小会计
DX-600发射机冷却系统维护
做合格党员
浇铸循环水冷却系统的应用
空间用氢镍电池密封性研究
句子的合格与不合格