葡萄酒评价的数学模型

2019-05-30 06:15
关键词:酿酒葡萄酒葡萄

马 烁

(荆州理工职业学院,湖北 荆州 434000)

1 问题的提出

随着人民生活水平的不断提高,葡萄酒已经逐步成为人们生活中的一部分,葡萄酒多样多变的口感,令人深陷其中.不同的人对同一种葡萄酒质量的评价不同,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.(具体题目参见2012全国大学生数学建模竞赛A题).

需要建立数学模型讨论下列问题:

1) 分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2) 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.

3) 分析酿酒葡萄与葡萄酒的理化指标之间的联系.

4) 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

2 模型假设

1)假设葡萄酒的质量只与酿酒葡萄的理化指标有关,而与外界其他因素无关.

2)假设题目中的数据能够真实反映各项的指标.

3)假设题目中所给的几项理论指标能够很好地评价葡萄酒的好坏.

3 模型建立及求解

3.1 问题一的模型建立与求解

设有来自正态总体X和Y的样本X1,X2,…,Xn和Y1,Y2,…,Yn,它们的容量相等.定义

Zi=Xi-Yi(i=1,2,…,n)

通过上面的方法对第一组10个品酒员对所有红葡萄酒样的总评分(总评分是指某个品酒员对某个酒样品的分类指标评分打分求和)和第二组的所有总评分进行显著性检验,由α=0.05及df=269,查t分布表中dfmax=45,t0.05(45)=1.679 4,由于这个t值有相同的α时,随着自由度的增加而减小.而|t|=4.085 0>1.679 4>t0.05(269),所以拒绝原假设,这就说明两组评酒员的评价结果有显著性差异.用同样的方法对白葡萄酒样进行分析得到的|t|=3.228 9>1.679 4>t0.05(279),也说明两组品酒员的评价结果有显著性差异.

分别求出标准差最小值属于第一组的个数an、第二组的个数bn

其中S1表示第一组的标准差集合,S2表示第二组的标准差的集合.

若an对应的求和值大于bm对应的求和值,则第一组的评价结果更可信;反之第二组的评价结果更可信.以下是第一组和第二组红葡萄酒品尝总评分的标准差数据列表.

表1 红葡萄酒样品的标准差

由于表1有27个酒样品中就有20个酒样品的标准差是第二组小于第一组,所以通过两组标准差的比较从总体上可以说第二组的评分稳定性要比第一组好很多,即第二组的评价结果更可信.

用同样的方法对白葡萄酒品尝评分标准差进行比较,同样可以得出第二组对白葡萄酒的评分比第一组的更可信.综上两种葡萄酒品酒员评分的结果表明第二组的结果更可信.

3.2 问题二模型的建立与求解

3.2.1 利用主成分分析[2]减少酿酒葡萄的理化指标

3.2.1.1 对原始数据进行处理

3.2.1.2 计算相关系数矩阵R

式中rij=1,rij=rji,rij是第i个评价与第j个指标的相关系数.

3.2.1.3 计算特征值和特征向量[3]

计算相关系数矩阵R的特征值λ1≥λ2≥…≥λm≥0,由特征向量组成m个新的指标变量.

式中y1是第1主成分,y2是第2主成分,…,ym是第m主成分.

3.2.1.4 选择p(p≤m)个主成分,计算综合评价

1)计算特征值λj(j=1,2,…,m)的信息贡献率和累积贡献率.

表2 主成分的贡献率表

由表2可看出主成分的贡献率是逐渐减小的,累积贡献率的增长幅度也是逐渐减小的.根据前8个主成分的特征值大于1,我们取前8个主成分作为综合理化指标来评价酿酒葡萄的好坏.

2)计算综合得分

其中bi为第j个主成分的信息贡献率,根据综合得分值就可进行评价.

上面的过程用MATLAB计算得到的结果共有27个样品,这里只给出3个样品,见表3.

表3 综合评价表

表3给出了3个酿酒葡萄样品质量的综合评价,也可看出主成分分析法将酿酒葡萄的理化指标综合成8个评价指标,且给出了这8个指标对葡萄的好坏的评价的一个综合得分,综合得分越高说明葡萄的质量越好.

3.2.2 酿酒葡萄的分级

用主成分分析法求得的葡萄样品综合得分的数据进行标准化处理:

其中zmax是综合评分中的最大值,zmin是综合评分中的最小值.

由于酿酒葡萄的理化指标与葡萄酒的质量对酿酒葡萄的好坏评价的重要性并不确定,所以我们假设两者对评定酿酒葡萄等级的作用相等,即可以用两者的和作为评价葡萄好坏的总评价得分:h=cj+cj′,其中cj′表示葡萄综合得分的处理后的值,cj表示评价葡萄酒质量的总分经标准化处理的值.由cj'∈[0,1],cj∈[0,1],得到h∈[0,2] .于是酿酒葡萄的好坏可划分为4个等级,即4个评分范围:四级[0,0.5),三级[0.5,1),二级[1,1.5),一级[1.5,2] .分级的结果如表4.

表4 葡萄样品等级归类

3.3 问题三的模型建立与求解

3.3.1 选取酿酒葡萄和葡萄酒的理化指标

首先在葡萄酒的理化指标中选取9个一级指标,再在酿酒葡萄的理化指标中找出相应的9个指标.与问题2类似用主成分分析法减少理化指标,得到葡萄酒的m个主要成分作为综合指标记为a1,a2,…,am;得到酿酒葡萄的3个综合指标记为b1,b2,…,bl.附件中共有27个样品,下面给出前3个样品对应的红葡萄酒的3个综合指标和酿酒葡萄的3个指标的数据,如表5.

表5 葡萄酒和酿酒葡萄的主成分

白葡萄的综合理化指标和葡萄酒的综合理化指标的数据见表6.

表6 白葡萄酒和酿酒葡萄的主成分

3.3.2 酿酒葡萄与葡萄酒之间的联系

从关联矩阵R可以看出:

1)r11=0.953 1最大,表明酿酒葡萄3个综合理化指标中的第一主成分b1与葡萄酒3个综合理化指标中的第一主成分a1的联系最大.

2)第2行中r23=0.886 7最大,表明酿酒葡萄综合理化指标中的第三主成分b3与葡萄酒综合理化指标中第二主成分的联系最大.

3.3.3 白葡萄与白葡萄酒之间的联系

计算白酿酒葡萄综合指标对葡萄酒综合指标的关联度(ρ=0.5)从而得到关联矩阵为

从关联矩阵R可以看出:

1)r23=0.926 5最大,表明酿酒葡萄综合理化指标的第三主成分b3对葡萄酒的综合理化指标的第二主成分的影响最大,及联系最密切.

2)第4行的元素几乎最小,表明酿酒葡萄综合理化指标与葡萄酒的综合理化指标的第四主成分的关系最小,即联系相对较小.

3.4 问题四的模型建立与求解

3.4.1 分析酿酒葡萄和葡萄的理化指标对葡萄酒质量的影响

酿酒葡萄的理化指标对葡萄酒质量的影响可以用问题2中求出的9个酿酒葡萄的综合理化指标与葡萄酒质量进行相关性分析,酿酒葡萄的综合理化指标中与葡萄酒质量相关性显著的越多就说明酿酒葡萄的理化指标对葡萄酒质量的影响越大.

根据问题1可知将所有评酒员对某样品的总评分平均后的最后得分就能确定葡萄酒的质量.由于酿酒葡萄的理化指标太多且每一项指标的影响程度不同,应该把一些相关性较大的指标用主成分分析法归为一类,这样就减少了酿酒葡萄的理化指标,简化酿酒葡萄理化指标对葡萄酒质量影响的过程,故分析酿酒葡萄对葡萄酒质量的影响的理化指标应该是一些综合的理化指标.

我们设葡萄酒质量是一个变量y,酿酒葡萄的综合理化指标为多个变量x1,x2,…,xn,用相关性分析得出的相关系数确定变量xi(i=1,2,…,n)与变量y之间的关系密切程度.下面是用SPSS软件[4]计算出的相关系数见表7.

表7 红葡萄酒的理化指标与葡萄酒质量的相关系数

表7说明红葡萄酒的理化指标与葡萄酒质量都是相关的,且相关系数大于或接近0.5的值较多,且相关的显著程度也较高,这说明红葡萄酒的理化指标对葡萄酒质量的影响很大.表中只有L*(D65)这一个理化指标与葡萄酒的质量呈负相关.同理可得出白葡萄和白葡萄酒的理化指标与葡萄酒质量的相关系数,这里不再列出.

3.4.2 论证能否用葡萄和葡萄酒的理论指标评价葡萄酒的质量

首先对附件3(具体参见2012全国大学生数学建模竞赛A题)中的葡萄酒的各种成分进行主成分分析得到一些综合成分,然后选取附件1中第二组品酒评分,在三个判别葡萄酒质量的指标中选取香味分析,对这个指标中的单个因素求和得到这个指标的总分,即求一个样品中某个评酒员评酒的一个指标的总分.再求出10个评酒员对这个指标的评分的平均值.我们选取这个指标作为葡萄酒的质量与葡萄酒的各个主成分进行相关性分析,得到的相关系数就是气味分析对葡萄酒质量的影响程度的一个度量.下面是通过SPSS软件[4]求得的气味分析指标与红葡萄和红葡萄酒之间的相关系数见表8.

表8 气味指标与红葡萄酒中综合成分的相关系数

表8中的相关系数都是不等于0的,且有三个主成分与气味指标是有显著性关系的.这说明气味指标对葡萄酒的质量也是有一定影响的.有上面的表格中气味指标与葡萄酒综合成分的相关系数说明气味分析对葡萄酒质量也是有影响的,从而从反面论证了附件2(具体参见2012全国大学生数学建模竞赛A题)中所给葡萄和葡萄酒的理论指标不能评价葡萄酒的质量,它只能在一定程度上影响葡萄酒的质量.

猜你喜欢
酿酒葡萄酒葡萄
上半年酿酒产业产、销、利均增长
为什么酵母菌既能做面包也能酿酒?
更 正
当葡萄成熟时
葡萄酒的产区品牌
葡萄酒的产区品牌(下)
法国葡萄酒何以誉满天下
砸酒瓶
酿酒忘米