变量相关性

2015-04-16 13:27
数学教学通讯·初中版 2015年3期
关键词:回归方程线性直线

本考点主要有两类问题:一是回归分析的问题;二是独立性检验的问题. 理科一般会在选择题、填空题中出现,文科也会在解答题中出现,难度中等.

(1)了解独立检验(只要求2?鄢2列联表)的基本思想、方法及其简单应用.

(2)了解回归分析的基本思想、方法及其简单应用.

①会作两个有关联变量的数据的散点图,利用散点图认识变量间的相关关系.

②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).

了解独立性检验和回归分析的基本思想、方法是解决两类问题的关键. 关于求线性回归方程,方法是最小二乘法,其步骤是:①计算 , ;②计算∑xiyi,∑x ;③计算 , ;④代入写出回归直线方程.其中求 , 时需要利用系数公式,此公式在高考中会直接给出,同学们不需要记忆.关于独立性检验,是求k2的值,通过比较临界值表来分析两个分类变量的相关程度,其中k2公式在高考中也会直接给出,同学们亦不需要记忆.这两类问题的解决还有一个关键就是数据处理与运算求解,途径合理、速度快捷、结果准确非常重要.

例1 某高中学校对高一年级学生在计算机上练习使用五笔输入法打字进行了统计研究,他们记录了学生练习的时间和最后考核每分钟打字的个数,从中抽取了五位学生的数据列表如下:

(1)从这5位学生中任选2人,记每分钟打字数分别为m,n,求事件“m,n均小于45”的概率;

(2)请根据乙、丙、丁三人的数据,求出y关于x的线性回归方程 = x+ ;

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问:(2)所得的线性回归方程是否可靠?

(参考公式:回归直线方程是 = x+ ,其中 = , = - )

破解思路 本题共三个问题,其中第一个问题考查随机事件的概率;第二、第三个问题考查回归分析的数学思想. 用最小二乘法求回归直线的方程时要根据步骤来完成,其中第一步、第二步是对第三步的一个分解计算. 解决此题虽然不需要很强的思维能力,但对运算能力的要求较高. 另外,如果没有告诉两个变量具有很强的线性相关性,求回归直线方程前,首先应进行相关性检验,若画散点图,则要观察散点是否大致分布在一条直线附近,然后求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. 或通过相关系数的绝对值与0.75的关系来判定两个变量的相关性的强弱.

答案详解 (1)m,n构成的基本事件(m,n)有:(43,45),(43,50),(43,46),(43,36),(45,50),(45,46),(45,36),(50,46),(50,36),(46,36),共10个. 其中“m,n均小于45”的有1个,即(43,36),所以事件“m,n均小于45”的概率为 .

(2)因为 =12, =47,所以 = = .

于是, =47- ×12=17.

故所求线性回归方程为 = x+17.

(3)由(2)知, = x+17,当x=10时,y=42;当x=8时,y=37. 与检验数据的误差均为1,满足题意. 故认为得到的线性回归方程是可靠的.

例2 春节期间,某市消费者报一记者走上街头,调查消费者对该市食品安全的满意情况,他随机询问了110名消费者,得到如下的列联表:

(1)采取分层抽样的方法,从这50名女性消费者中按对食品安全是否满意抽取一个容量为5的样本,问:样本中满意与不满意的女消费者各有多少名?

(2)从(1)中的5名女消费者样本中随机选取2名作深度访谈,求选到满意与不满意的女消费者各一名的概率;

(3)根据以上列联表,请问:有多大把握认为“该市消费者性别与对该市食品安全满意”有关?

注:k2= .

临界值表:

破解思路 本题第一问考查分层抽样,第二问考查随机事件的概率,第三问考查独立性检验的数学思想. 第三问的解决是根据k2公式求出k2的值,然后对照临界值表评价两个分类变量的相关程度.

答案详解 (1)根据分层抽样可得:样本中满意的女消费者为 ×5=3名,样本中不满意的女消费者为 ×5=2名.

(2)记样本中对食品安全满意的3名女消费者分别为a1,a2,a3,对食品安全不满意的2名女消费者分别为b1,b2. 从5名女消费者中随机选取2名,共有10个基本事件,分别为:(a1,a2),(a1,a3),(a1,b1),(a1,b2),(a2,a3),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2). 其中事件A“选到满意与不满意的女消费者各一名”包含了6个基本事件,分别为:(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2). 所以所求概率P(A)= = .

(3)假设H0:该市消费者性别与对食品安全满意无关,则k2应该很小. k2= = ≈7.486,由P(k2≥6.635)=0.010可知,有99%的把握认为:该市消费者性别与对食品安全满意有关.

1. 对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法不正确的是( )

A. 若求得的回归方程为 =0.9x-0.3,则变量y和x之间具有正相关

B. 若这组样本数据分别是(1,1),(2,1.5),(4,3),(5,4.5),则其回归方程 =bx+a必过点(3,2.5)

C. 若同学甲根据这组数据得到的回归模型l的残差平方和为E1=0.8,同学乙根据这组数据得到的回归模型2的残差平方和为E2=2.1,则模型1的拟合效果更好

D. 若用相关指数R2(R2=1- )来刻画回归效果,回归模型3的相关指数R23=0.32,回归模型4的相关指数R24=0.91,则模型3的拟合效果更好

2. 某校对学生周末的业余生活状况进行调查. 某调查小组随机抽查了该校55名学生,以此来研究学生在周末喜欢运动与性别的关系,得到下面的数据表:

(1)判断能否在犯错误的概率不超过0.5%的前提下认为喜欢运动与性别有关;

(2)用分层抽样的方法从喜欢运动的学生中抽取6名学生作进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1名男生和1名女生的概率.

下面的临界值表供参考:

注:k2= .endprint

猜你喜欢
回归方程线性直线
渐近线性Klein-Gordon-Maxwell系统正解的存在性
采用直线回归方程预测桑瘿蚊防治适期
走进回归分析,让回归方程不再是你高考的绊脚石
画直线
二阶线性微分方程的解法
两条直线 变变变
画直线
具有θ型C-Z核的多线性奇异积分的有界性
走直线等