统计学与图像技术结合在工业生产制造中的应用

2020-10-09 13:14李佐广
科技与创新 2020年19期
关键词:假设检验椭圆长度

李佐广

(中国人民大学,广东 深圳518000)

尺寸测量和零件分拣是工业制造中出现较多的环节,传统的人工方式的效率越来越不能满足尺寸测量和零件分拣的要求,自动化、智能化技术的发展能更好满足其需求。随着机器视觉技术的发展和不断成熟,人们用机器视觉技术来取代传统的人工,如用机器视觉对工件的各种尺寸进行测量,进行工件和零件的区域测量、工件和零件的长度测量、工件和零件的圆半径测量、工件和零件的弧线测量、工件和零件的角度测量等。将机器视觉和统计学结合用于分类及质量测量,使用统计方法分析测量的数据,对工业生产的质量进行合格性判断。将统计学与图像技术结合应用在工业制造中,能更有效提高工业生产制造效率,更有效地对产品质量进行管理。

1 基于视觉和统计学的工业自动化分拣

1.1 工业自动化分拣简介

在传统的工业生产制造过程中,机器可进行生产加工,同一台机器可能会生产出多个种类的零件,这些零件混合在一起,需对零件进行分类、打包。传统的分拣工作主要依靠人工,人工对生产的零件进行分拣,分拣的速度慢,也容易产生疲劳,容易导致出错,再加之人的工作时间受限制,分拣的速度跟不上。

随着工业的发展,人员成本提高,对生产效率的要求越来越高,传统的人工分拣越来越不满足生产的要求。自动化的分拣需求越来越迫切,产生了工业视觉的分拣技术,用先进的机器视觉技术结合机械臂来实现自动化分拣、高效率分拣,从而更好满足工业生产的多种类分拣需求。

基于视觉的分拣技术,主要通过视觉识别,并根据物体的颜色、形状、尺寸、位置等特征进行分类识别。将位置、类别、大小等其他属性发送给机械臂或传送装置,机械臂或传送装置来完成抓取、配准等作业。基于视觉的自动化分拣系统与传统的人工分拣相比,具有更多的优势,如分拣的速度更快,分拣的准确度更高,可以24 h 不间断工作,工作稳定,更加智能化、无人化、自动化。随着工业4.0 的发展,分拣要求也将越来越高,将逐步实现无人化生产模式。

1.2 光源

光源主要用来保障图像的质量,加强图像的特征,方便图像处理,得到更稳定的结果。在工业应用中,光源起着非常重要的作用。没有合适的光源,图像的成像质量就不太高,如过暗、过曝、图像亮度不均匀。通过合理的设计和安装光源,还可以更明显区分图像的目标内容和背景内容,更容易地对目标和前景进行分割。工业机器视觉应用中,常用到以下几种光源:点光源、线形光源、环形光源、背光源、条形光源、同轴光源。

1.3 图像采集

图像采集是图像经过采样、量化以后转换为数字图像并输入、存储到帧存储器。图像采集在数字图像处理、图像识别中有着广泛的应用,如日常生活中手机拍照、可视电话,生物医学领域、航空航天领域。图像采集是非常关键的一个步骤,采集的速度、分辨率、质量等直接影响着产品的整体效果。

1.4 物体位置定位

生产零件过程中,可以通过事先设定ROI 范围,进行粗略的位置定位,零件大概率出现在这些ROI 区域里。比如一台设备同时生产4个种类零件,所以采集1 张图像,会在4个位置出现不同的零件,可以在图像中设置4个ROI 区域。通过设置ROI,可以初步定位到物体出现的范围,这样可以排除其他区域的干扰。

在区域外的地方可以不进行图像的特征处理,在区域内的地方进行图像特征处理。设置ROI,也可以提升图像处理速度、性能,可以减少很多图像处理过程。一般在设置ROI时,会产生一个MASK 标记图像,ROI 区域内标记为255,ROI 之外标记为0。在进行图像特征提取过程中,对应MASK标记图像的像素为0 的不进行处理,为255 的进行处理。

1.5 颜色转换

工业应用中,颜色特征是比较稳定的,可以在HSV 颜色空间进行颜色处理。处理彩色图像时,需要选择合适的颜色模型,HSV 模型常用于颜色处理。采集到的图像通常是RGB、YUV 空间的图像,需要将RGB 或YUV 转换为HSVA颜色模型。HSV 模型主要由色调H、饱和度S、亮度V组成。H的取值范围为0°~360°。S的取值范围是0~1.0,颜色越饱和则值越大。V的取值范围是0~255,越亮则值越大。

除了处理色彩图像外,还要经常处理灰度级别的图像,在灰度空间中对图像进行特征提取,比如梯度处理的canny边缘。sobel 处理,常用灰度图像作为输入。

1.6 图像边缘检测

边缘提取是图像特征提取的一种主要方法。对于形状识别和几何图形的识别都非常有用。常用的边缘提取方法有sobel、canny 方法。canny 边缘检测可以得到比较细的边缘,用来做形状识别、几何图形的识别,如提取直线边缘,进行直线的拟合,得到直线,可以用于测量长度;也可以对边缘像素进行统计分析,得到目标的边缘坐标信息,得到目标的外接矩形,可以转换为实际物理尺寸的大小。图像边缘检测常用于对灰度图像进行处理,处理后得到边缘图像。

1.7 连通区域提取

图像处理中,需要得到关注的目标,可以采用连通区域提取目标,连通区域主要是针对二值图像,连通区域通常使用常4 连通处理和8 连通处理。4 连通如图1 所示,p 是当前处理像素点,如果它的邻居上、下、左、右4个x 邻居像素中某个邻居像素值和p 一样,则认为该邻居和p 是连通的,如果都不与p 值相同,则认为p 是孤立点,没有像素和它连通。

图1 p 的4 邻域

8 连通如图2 所示,如果它的邻居左上、上、右上、右、右下、下、左下、左8个x 邻居像素值中某邻居像素值和p一样,则认为该邻居和p 是连通的,如果都不与p 值相同,则认为p 是孤立点,没有像素和它连通。

连通区域标记算法,其基本思想是基于种子生长的方式,从一个种子生长点开始,将与该生长点性质相似的邻域像素与生长点进行合并,并给该种子点位置标记,表示该种子点已经用过,新加入的点可以作为新的种子点生长,重复上面过程直到不能生长为止,这样就得到了一个连通的目标像素组合。

图2 p的8 邻域

1.8 尺寸测量

在工业自动化生产制造行业中,尺寸测量是一个比较常见的需求,可以采用机器视觉测量技术来代替人工进行测量,获得工件的各种尺寸参数,例如用机器视觉来测量工件的长度、工件的角度、圆形工件的半径长度等。

1.8.1 圆形零件半径尺寸测量

由于圆形零件成像后,表现为椭圆的形式,对图像进行canny 边缘特征提取后,采用连通区域提取的方法,获得椭圆的边界像素,边界像素是离散的像素点,记为(xi,yi),对椭圆边界像素进行椭圆拟合,椭圆拟合采用最小二乘椭圆拟合方法,计算离散点到拟合椭圆的距离平方和,并使得该距离平方和为最小,可以获得椭圆长轴、短轴、中心坐标及偏转角度,从而得到圆形零件的尺寸。

设平面任意位置椭圆方程为:x2+Axy+By2+Cx+Dy+E=0,设Pi(xi,yi)(i=1,2,…,N)为椭圆边界像素上的N(N≥100)个像素点,根据最小二乘原理,设定拟合的目标函数为:

为了使F为最小值,需要满足:

由此可以得方程:

解方程可以得到A、B、C、D、E的值。

根据椭圆的几何知识,可以计算出椭圆的五个参数,即位置参数(θ,x0,y0)以及形状参数(a,b):

1.8.2 线段长度的测量

通过图像边缘像素的特征提取后,进行直线拟合,确认为直线,并得到直线的两个端点像素坐标,进而由两点的坐标可以得到对应线段的像素长度。

1.9 图像尺寸转换为实际物理尺寸

1.9.1 相机标定

像素长度与物理长度的比值人们习惯叫K值,单位是mm/pixel,用于做单位转换;项目应用上常用标定的方式得到K值。用规则的标定板进行标定:如黑白棋盘格、圆形棋盘格,相机取像后求出棋盘格或圆形半径的像素长度A,再用实际的棋盘格或圆形半径长度B,计算可得出K=A/B。

1.9.2 像素长度转换为物理长度

对于圆形器件,成像的图像中可以作为椭圆处理,测量圆形器件的尺寸,需要将最小二乘法椭圆拟合的像素半径a,b转换成实际的物理尺寸。对于线段长度的测量,需要测量2点像素的长度,并转换成实际的物理尺寸。

1.10 目标分类

提取出图像的颜色、大小、形状特征后,组合成一组特征向量。采用统计学方法随机森林对提取的特征向量进行分类。

对特征向量进行分类的随机森林由决策树构成,它的基本单元是决策树,如图3 所示。

图3 决策树

随机森林是一种算法,该算法通过集成学习的思想将多棵决策树集成到一起。每棵决策树都是一个小的分类器,对于一个输入样本,每棵决策树都会有一个分类结果,N棵树构成N个分类结果,随机森林集成了所有分类分类器投票的结果,将投票次数最多的类别作为最终的输出。

随机森林是一种简单的Bagging 思想,最后分类取决于多棵树(弱分类器)的投票表决,随机森林模型如图4 所示。

图4 随机森林模型

随机森林树学习算法:可以根据下面的算法来构造每棵树。

随机森林构建,要求数据的随机性选取,以及待选特征的随机性选取。训练样本的个数用N来表示,特征数目用M来表示。进行有放回地抽样。输入特征数目m,m应该远小于M,这个是从M个特征中随机选取的m个特征子集,用来构建一棵子树,而选中的m个特征中相对是最优的。从N个训练样本中以有放回抽样的方式抽取样本,构成一个训练集,然后用未抽取到的样本来做预测,并评估它的误差。重复上面的方式,可以构建多棵决策树。

随机森林的优点:①随机森林实现起来相对比较简单;②随机森林相对来说在准确率方面比较高;③通过引入随机性,这样不容易过拟合;④通过引入随机性,这样具有比较好的抗噪声能力;⑤随机森林容易实现并行化,并且训练速度快;⑥随机森林能处理很高维度的数据,可以不用做特征选择;⑦随机森林可以判断特征的重要程度。

随机森林的缺点:①当随机森林有很多决策树时,需要较大的训练空间和较长的时间;②随机森林模型像是一个黑盒模型,还有许多难以解释的地方;③随机森林在某些噪声较大的分类或回归问题上会过拟合。

随机森林在很多地方可以应用:对离散值进行分类,对连续值进行回归,无监督学习进行聚类,异常点进行检测。

1.11 分拣

基于视觉的分拣技术,主要通过视觉识别。根据物体的颜色、形状、尺寸、位置等特征进行分类识别。将位置、类别、大小等其他属性发送给机械臂或传送装置,机械臂或传送装置来完成抓取、配准等作业。

2 假设检验

统计推断的构成成分之一是假设检验,假设检验是利用样本对总体进行某种推断,在假设检验过程中,先对u的值提出一个假设,接下来利用样本信息来检验这个假设是否成立。

原假设的表达式一般如下:H0=u0或H0∶u-u0=0

假设检验以H0表示原假设,也称为零假设。假设检测以H1表示备择假设,u0则表示感兴趣的数值,原假设和备择假设是互斥的,如果肯定原假设,则表示放弃备择假设。

假设检验有两类错误,其中一种错误是α错误,也叫弃真错误,另一种错误是β错误,也叫取伪错误。α错误是原假设H0为真时却将它拒绝了,犯这种类型的错误的概率用α表示,β错误是原假设为伪时却没将它拒绝,犯这种类型的错误的概率用β表示。

2.1 假设检验的基本原理及步骤

首先需要提出什么是原假设和以及什么是备择假设,然后确定显著性水平标准,确定检验方法,构造检验统计量,对检验统计量进行选择,主要是可以对大样本量时,以及符合正态分布时,当标准差σ已知,应当选用Z 统计量;小样本量时,当标准差未知σ时,应选用T 统计量。以往的经量都近似服从正态分布,例如,机械零件的加工长度、厚度等都可以用正态分布来描述其变验,大量随机变化规律。

2.2 作出检验决策

最后,作出检验决策,对比统计量的值与临界值,假如该样本统计量的取值超过了预设的临界值,说明原假设落入到了拒绝域中,此时就可以拒绝原假设,否认则就可以接受原假设。

3 在工业产品质量检测中检验需要注意

在抽样研究中,研究设计、搜集数据和统计分析是一个整体。应用检验方法必需符合其适用条件。

作假设检验应注意样本容量是否合理,样本量的大小是选择检验统计量的重要指标,在大样本量下,一般使用z统计量。当n比较小的时候,t分布于z分布差异比较大,当样本量n>30 时,t分布和z分布就非常接近了。正确选择检验统计量,常用的统计量有z统计量、t统计量以及x2统计量。z统计量和t统计量主要用于比例和均值的检验,x2统计量主要用于方差的检验。正确理解假设检验的结论。

作假设检验时,可以对总体参数的区间估计进行结合。某机器生产的某一圆形零件,行业标准要求其半径长度0.477 cm,从生产的零件中随机抽30个,通过本文的图像测量技术,测量其平均长度为0.475 cm,样本标准差s为0.00842 cm,测量的长度服从正态分布,检测生产的圆形零件半径长度是否符合标准要求。

先提出原假设H0∶u=0.477;备择假设H1∶u≠0.447。计算统计量-1.301。给出显著性水平α=0.05,查表得到统计推断所以接受原假设,长度符合标准要求。

假设检验还可以用于检测其他测量属性是否符合标准要求、检测生产的工件颜色的一致性是否符合标准要求、生产的质量是否符合标准要求、分类的准确率是否符合标准要求。

随着生产制造效率的需求不断提高,以及对生产质量的需求不断提高,假设检验理论在质量检测管理中的应用越来越多,重要性不断提高,用于质量检验与控制的各个方面。

猜你喜欢
假设检验椭圆长度
例谈椭圆的定义及其应用
绳子的长度怎么算
假设检验结果的对立性分析
巧用点在椭圆内解题
爱的长度
统计推断的研究
长度单位
椭圆的三类切点弦的包络
凤爪重量质量管理报告
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法