多元统计分析在数学建模中的应用

2021-01-12 03:55陈蕾蕾
无线互联科技 2020年24期
关键词:协方差插值建模

陈蕾蕾

(西北民族大学 数学与计算机科学学院,甘肃 兰州 730000)

1 数学建模教学中的现状

由于目前高校在数学建模教学过程中[1],仍普遍存在教学方式古板、单一、纯理论的现象,学生们单单掌握理论还不够,需要创新教学方式,理论知识的实践化更适应社会科学技术的变化。知识储存不足,学生在课堂上无法接触到更多的知识,这使得学生的自学能力变得尤其重要。学生缺乏应用能力,将数学建模融入教学中,将理论知识和实际生活中的问题有机结合,在两者之间构造了一座桥梁,激发学生的兴趣,学生自发的学习扩展,引导培养学生的探讨应用能力。在各类数学建模竞赛中,可以锻炼和发展学生的数学建模能力。

2 多元数据的认识

在对现实中的社会、经济、生产等现象的认识及解读时,由于现象的发生不仅仅被一种指标所控制,大多数的各类现象具有多维特征。所以经常需要用多个指标进行描述、测量和分析现象的特征和状态。

理论上,多个变量分开,一次研究一个变量或者两两进行研究之间的关系,虽然简单,但它的缺点也很明显,没有考虑到变量之间的相互关系,分开研究会导致变量之间的相互关系在处理一开始就丢失了,会对最终模型的精度影响极大。因此,采取多个变量合在一起研究的方法,多元统计分析方法就十分有效,揭示了变量之间的内在相互关系,经过检验,这种分析结果通常有效,也比较典型。

多元数据的处理[2]也是构建模型的关键,它极大可能影响数学建模的结果和精度,也是引起误差的重要原因之一。数据处理常见的有数据的初步处理,即对数据进行排序,按类汇总,计算频数、方差、标准差等,甚至可以利用SPSS对数据绘制散点图、曲线图、折线图、直方图、双轴图、面积图等,观察数据的发展趋势;在竞赛中还经常用的方法有插值和拟合的思想,插值思想一般可分为拉格朗日插值、分段插值、样条插值等,不同的插值方式,得到的插值数据以及曲线的光滑程度是不一样的,如何选择就是关键。而拟合一般可以分为线性拟合、多项式拟合和曲线拟合。而在SPSS操作中,可以选用关于多种拟合参数的模型,来实现拟合度对比,以便寻找到最优拟合参数曲线模型。

3 多元统计分析模型的大致流程

(1)提出问题和确定目标。由于实际问题的错综复杂,变量数量之多、变量之间的关系复杂,因而需要在复杂的数量关系中确定问题的目标。

(2)选取和设置指标。需要查阅文献,需要相关理论的支持,指标体系的选取一定程度上决定模型的精度。指标的选取还是基于统计数据的数学特性,对数据进行描述,基于推论,运用分析策略构建模型。

(3)搜集、整理、处理统计数据。多元统计分析模型的建立是在指标变量的样本统计数据,选取的指标数据质量决定了模型的作用。在整理、处理数据时,大致有剔除异常数据、对指标数据进行规格化、标准化等数据处理,以便后续模型的建立。数据处理时有一些常见的错误,由于缺乏对实际问题领域知识的理解,会出现大量的错误,辛普森悖论,以偏概全,抽样过程中,样本无法代表总体的真实情况。

(4)根据问题及数据的特征,选择合适的多元统计分析方法,构造理论模型。若研究多变量之间的关系,可采用因子分析、主成分分析、回归分析、典型相关分析等方法,若研究的是事物分类,则可选用聚类分析、判别分析等工具。

(5)利用SPSS等计算软件,对数据进行统计计算,参数估算模型。

(6)模型的检验与调试。对模型的检验是必不可少的,如果检验不达标,就需要对模型调试直至得到相对满意的模型。

(7)模型的应用。

4 SPSS在多元统计分析策略中的应用

SPSS在数学建模应用中发挥着重要的作用[3],尤其是在多元统计分析策略中的模型的构建、求解、检验,并且SPSS操作简单,容易上手。SPSS的数据编辑器、输出等界面,通过现有的菜单和对话框操作,图表类型的输出,操作者几乎可以完全自动的对自变量数据进行预处理、筛选、模型优化、检验等工作,使得在分析数据和建模的过程中,变得更为直观。

多元回归分析主要应用为预测、控制分析,寻找多变量之间的关系,在各个领域都能看到这种处理手段,构建多元回归模型时,首先要找到相关性强的变量,寻找变量通常采用逐步回归法,对其数据进行无量纲化,即数据的标准化,选入变量,修正参数以至达到要求,对变量采用F检验,决定该变量是否应该剔除;然后利用最小二乘法对参数进行估计时,定下假定,目的是最终的参数的表达是唯一的。多元回归模型的检验,只要是进行拟合优度检测、方差显著性检验、参数显著性检验;模型的预测或控制。

模型的优化,可以从自变量出发,变量之间的关系可能还存在多重共线性问题、异方差问题、自相关问题,确定发生的问题,对存在的问题进行分类的处理,由此提出了一些可以优化的模型建立思路。SPSS成非统计专业的学生就解决数据分析的数学建模竞赛问题的有力工具。

5 多元统计的相关分析方法

5.1 图表相关分析

简单来讲,就是对数据进行可视化处理,即绘制图标,可以是散点图或折线图等,绘制成图表后,数据的趋势和联系就可以由图可得,实际应用中散点图更为广泛,因为散点图去除了时间维度的影响。单一图表相关分析往往是缺乏说服力和可信度,所以需要对相关关系进行度量,因此需要使用协方差及协方差矩阵分析。

5.2 协方差及协方差矩阵分析

通过计算协方差和协方差矩阵,度量变量之间的相关性。协方差是衡量两个变量的总体误差,如果协方差为正值0,说明两个变量正相关,变化的趋势一致,如果协方差为负值,说明两个变量是负相关,若协方差为0,说明两个变量相互独立。涉及3个变量,即x,y,z,使用协方差矩阵计算,互相两两变量之间的协方差矩阵构成协方差矩阵。

5.3 相关系数分析

相关系数是反应变量之间密切程度的统计指标,以下是相关系数的计算关系:

其中:rxy是样本的相关系数,Sxy表示总体样本的协方差,Sx表示样本为X的标准差,Sy表示为样本为Y的标准差。

相关系数越靠近0相关性越弱,而越靠近1相关性越强。

6 数学建模思想融入高等教育

数学模型是基础到深入,粗略到高精度,不断优化的过程,这就需要不断学习和研究,提前将这种数据建模思想融入高等教学中,虽然是一个任重而道远的任务,但是可以在潜移默化中提高学生们的建模能力,思考问题的能力,锻炼了学生们的逻辑能力以及书写学术论文的能力,积累经验,激发学生的创新建模能力。

数学建模是一种解决实际问题的过程,头脑风暴,通过问题的数据、性质、机理,对实际问题的求解及优化的过程,亦是一种理论的实践化过程,对数据信息的处理过后,通过抽象假设、引进变量,通过数学理论知识表达实际问题、求解实际问题。针对理论与实践的一种思维的培养,在高等教育中,开设数学建模和模型赏析的课程对培养学生的各方面能力有极大的提升作用。

在日常教学过程中可以渗透建模的模型知识以及建模的方法,体会数学的强应用性,对数学建模乃至数学产生兴趣以及积极性,突出学生的主动性,掌握数学建模的思想和方法。

在高校可以鼓励参加数学建模竞赛,成立教师教学研究和指导团队,加强教学能力和宣传力度,提高学生的参与感,在竞赛中不仅锻炼了能力,还提升了研究学术上的能力。

7 结语

对于数学建模竞赛中大数据的赛题,基本上都能通过多元统计分析构建和求解模型,并得到进一步优化的模型。在高等教育中,也要将数学建模的思想应用在课堂教学上,激发学生们的创新能力,培养他们理论知识的实践能力,也提升高等教育的教学效果。

猜你喜欢
协方差插值建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
基于Sinc插值与相关谱的纵横波速度比扫描方法
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
二维随机变量边缘分布函数的教学探索
不确定系统改进的鲁棒协方差交叉融合稳态Kalman预报器
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
Blackman-Harris窗的插值FFT谐波分析与应用