确定混合料取样样本容量的模型与方法

2018-08-28 07:49刘聂玚子胡小金
筑路机械与施工机械化 2018年6期
关键词:样本容量置信度正态分布

刘聂玚子,周 雄,胡小金

(1.长安大学 公路学院,陕西 西安 710064;2.陕西路桥集团路面工程有限公司,陕西 西安 710054)

0 引 言

搅拌器的功能是按设计的生产配合比将粗集料、细集料、结合料与填料等拌合成均匀的混合料[1]。研究资料表明,混合料的拌合均匀性不仅依赖于搅拌器的结构参数、运动参数,在很大程度上更取决于工艺参数[2]。刘洪海等研究了拌合过程中集料和矿粉等材料的投料顺序与拌合时间对成品混合料的影响,通过建立搅拌模型分析了集料颗粒在搅拌器作用下的滚动规律,得出了拌合均匀性与颗粒滚动圈数之间的关系表达式[3];并通过对搅拌器工作原理和材料的运动学分析,建立了拌合均匀性与连续式搅拌器的结构参数、使用参数之间的关系模型,得出满足生产质量要求的搅拌器有效长宽比[4]。

为了能够通过试验准确地判断不同工艺和方法对混合料拌合均匀性产生的效果,试验过程中检测数据的可靠性越来越受到重视,其中的一项重要内容是基于统计分析技术的样本容量确定[5-8]。样本容量大小关系到检测精度、试验效率和试验成本,需要依据试验目的、误差要求、经费情况及可操作性等因素综合确定[9-10]。一般而言,样本容量越大,对总体的代表性越强,抽样误差越小,可以获得较高的精度和可靠度;反之,则难以保证代表性,导致抽样误差过大。而且,抽样成本会随着样本容量增加线性递增,抽样误差的减小速度却以样本数的平方根递减[11]。因此,基于统计学原理确定检测数据样本容量大小应考虑的主要因素如下[12-13]。

(1)精度要求。允许误差大小与样本容量成负相关,精度要求高、允许误差小时,需要的样本容量大。

(2)研究对象的变化程度。研究对象的变化程度用方差表示,在相同精度要求下,总体方差越大样本容量也越大。

(3)置信度要求。置信度为统计学中的概率保证率,置信度要求越高,需要的样本容量也越大,通常推荐置信度取95%。

(4)总体大小。研究对象的总体越大,取样的样本容量也应越大,但两者之间并非线性关系,具有一定的对数特征。

由以上分析可见,影响样本容量的因素较多,本文旨在探讨保证检测精度的前提下如何提高效率、降低成本,并建立区间估计精度与样本容量之间的关系模型,提出基于统计分析技术的样本容量确定方法。

1 确定样本容量的基本方法

1.1 基本概念

设总体为X,x1、x2、…、xn为一个由总体中随机抽取的容量为n的样本。建立统计量Z1、Z2(Z1≤Z2)和显著性水平α;对于待估参数Z,若P(Z1<Z<Z2)=1-α成立,则(Z1,Z2)为参数Z在1-α置信水平下的置信区间。Z1与Z2的区间长度称为区间估计精度,可用2Δ表示,则Δ=(Z1-Z2)/2。

1.2 建立区间估计表达式

依据区间估计理论,可以将区间估计分为总体方差已知和总体方差未知2种情况进行讨论。对于总体方差已知的情况,在总体服从正态分布时,总体平均值的区间估计如下:由于总体服从正态分布X~N(μ,σ2),从总体中简单随机抽出的样本(x1,x2,…,xn)也服从正态分布,令为μ的无偏估计,则统计量根据显著性水平α,由标准正态分布表查得双侧临界值Zα/2,于是可得置信区间和区间估计精度,即

对于总体方差未知的情况,若总体服从正态分布,由总体中简单随机抽出的样本也服从正态分布,用样本方差s2估计总体方差σ2,此时统计量T=根据显著性水平α,由t分布表查得双侧临界值t1-α/2(n-1),于是可得置信区间和区间估计精度,即

对于非正态总体的情况,若随机取得的样本较小,则样本均值的抽样分布特点也是非正态的,无法按上面的公式进行区间估计;若随机取得的样本较大,根据中心极限定理,样本均值的分布趋于正态分布,可以用上式进行区间估计。

2 样本容量的确定方法

查标准正态分布表,可得不同样本容量下的Zα/2值,应用MATLAB软件可得到n与区间估计精度的关系曲线,如图1所示。

由图1中曲线的走势可以看出:在n≤3时,曲线很陡,变化速度很快;在3<n≤5时,曲线由陡逐渐变缓;当5<n≤10时,曲线变化速度变得平缓;当n>10时,曲线的变化已很小。由以上曲线的走势可以得出结论:如果对测量取样误差未作具体规定,可采用简单随机取样的方法得到3~5个试样(不应

由式(1)~(4)可知,无论正态分布总体的标准差是已知还是未知,其区间估计精度都与样本容量有关,增加样本容量可以减小估计误差,提高估计精度,其影响与容量数的平方根成反比。由式(2)可推得总体方差已知时一定置信水平下满足区间估计精度的样本容量表达式。少于3个,不宜大于5个),取其均值去估计总体平均值,该方法效率高且误差小;当对取样规定了区间估计精度时,可根据式(5)计算满足精度要求的样本容量。在工程实际中,总体方差往往未知,因此在一定的置信度水平下,满足区间估计精度的样本容量表达式为

图1 样本容量与区间估计精度之间的关系

式(6)中的临界值与n有关,随着n增大,临界值在减小。由t分布临界值表可知,在置信度为95%时,当n>25,t的临界值均为2;当n<25时,可根据s和Δ应用“试差法”确定样本容量。具体方法为:由式(6)计算得到样本容量n值,并以此n值查t分布临界值t1-α/2(n-1),将新临界值代入式(6)中得到新n值,如此往复,直到式中两边的n值相差较小时确定n值,即最小样本容量。也可用简便的方法确定n值,由Z1-α/2代替公式中的t1-α/2(n-1)计算得到n,当采用90%置信水平(Z0.95=1.645)时,将计算得到的n加2;当采用95%置信水平(Z0.975=1.96)时,将计算得到的n加2或3,四舍五入后取整可得最小样本容量。

3 确定最小样本容量的试验研究

水泥稳定混合料生产过程中,采用EDTA滴定法检测水泥剂量,并以滴定结果指导搅拌设备的调试和生产,判断混合料的拌合均匀性。由于受到许多偶然因素的影响,这些参数都是随机变量,取样数量的多少关系到检测精度、试验效率和试验成本。取样越多,对总体的代表性越强,可以获得较高的精度和可靠度,但试验效率降低,试验成本增加;反之,则代表性较差,导致误差过大。抽样检验时,为了满足一定的误差要求,需要确定样本容量大小。目前工程部门多采用取2个试样平行试验的方法进行,但是这种方法并未充分考虑样本分布特征。根据本文理论分析,较好的方法是依据数理统计原理,采用试验的方法确定满足试验精度要求的取样最小样本数量[14]。

根据上述方法,在实体工程进行水稳混合料的水泥EDTA滴定试验,对试验结果进行分析计算。

3.1 试验用材料

粗细集料为吉奎石料厂生产的碎石,表观密度为2.967g·cm-3,压碎值为11%;水泥为英金河水泥厂生产的P·O32.5缓凝普通硅酸盐水泥,初凝时间为245min,终凝时间为410min,安定性等各项指标符合标准要求。

3.2 绘制标定曲线

在最佳含水量6%下,分别制备水泥剂量为2%、4%、6%的混合料,级配如图2和表1所示,采用EDTA滴定法,确定EDTA消耗量,试验结果见表2。

图2 混合料级配

以水泥剂量为横坐标,相应的EDTA消耗量为纵坐标,绘制标定曲线,见图3。

3.3 试验结果及分析

水泥稳定土搅拌设备的水泥剂量设定值为4.0%,为了获得试验分布标准差,简单随机取样15份进行滴定,结果如表3所示。由表3可得S=0.14%,X-=3.96%,若允许滴定误差为0.20%,则在95%置信度下,最小样本容量为式(5)计算结果加2,即n≈4;若允许滴定误差为0.25%,则在95%置信度下,经计算最小样本容量取3;若滴定允许误差未规定,则取样数量不宜低于3个,求其均值作为试验结果,则试验误差小、效率高、成本低。

表1 试验所用级配及范围要求

表2 水泥剂量与EDTA消耗量

图3 标定曲线

表3 水泥稳定土搅拌设备生产混合料的水泥计量滴定结果

4 结 语

为了能够准确判断混合料的水泥剂量,试验过程中需要基于统计分析技术确定样本容量。在保证试验精度的前提下,提高试验效率,降低试验成本。通过对总体方差已知、总体方差未知2种情况下总体正态分布和总体非正态分布的研究,建立了区间估计精度与样本容量之间的关系模型,并提出确定样本容量的方法。

采用简单随机抽样进行参数检测时,无论总体标准差已知还是未知,区间估计精度都与样本容量的平方根成反比。可以根据显著性水平和估计精度要求确定样本容量,避免样本过多导致成本增加或样本过少降低估计精度;显著性水平和估计精度要求越高,样本容量越大;对于未规定估计精度要求的试验,样本容量宜取3~5个,不应少于3个,取平均值作为试验结果可提高试验精度、减小试验误差、降低试验成本。

本文基于区间估计精度与样本容量之间的关系模型,主要进行了水泥稳定土搅拌设备的水泥剂量滴定试验研究,对于其他类似试验,由于试验要求、试验条件、试验仪器及试验方法等因素存在差异,其样本容量有待进一步研究。

猜你喜欢
样本容量置信度正态分布
硼铝复合材料硼含量置信度临界安全分析研究
正负关联规则两级置信度阈值设置方法
基于对数正态分布的出行时长可靠性计算
正态分布题型剖析
χ2分布、t 分布、F 分布与正态分布间的关系
置信度条件下轴承寿命的可靠度分析
广义高斯分布参数估值与样本容量关系
多种检测目标下样本容量设计的比较
两类错误条件下方差检验中样本容量的确定
多假设用于同一结论时综合置信度计算的新方法✴