2017-2018学年人教A版选修1-2 回归分析的基本思想及其初步应用 教案
2017-2018学年人教A版选修1-2  回归分析的基本思想及其初步应用   教案第2页

教学环节 教学活动 一、创设情境 1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响。

2.问题一:为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?

  我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和。 二、探究新知 ⑴总偏差平方和:每个效应(观测值减去总的平均值)的平方加起来,即用表示总的效应;

  学生动手计算出例1中的总偏差平方和。

⑵残差平方和:数据点和它在回归直线上相应的位置的差异是随机误差的效应,称为残差,为残差平方和;

  学生动手计算出例1中的残差(如下表)与残差平方和。

编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 yi 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 ei -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382   

⑶回归平方和:解释变量和随机误差的总效应(总偏差平方和),即总的偏差平方和=回归平方和+残差平方和,所以

回归平方和=总的偏差平方和-残差平方和

  学生动手计算出例1中的回归平方和。

学习要领:①注意、、的区别;

②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和;

③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;

④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越接近于1,说明残差平方和越小,也就是说模型拟合的效果越好,即解释变量和预报变量的线相关性越强.

  代入例1中的数据知例1中的,即解释变量对总效应约贡献了64%,而随机误差贡献了剩余的36%,所以身高对体重的效应比随机误差的效应大得多。

问题二:观察图1.1-5中的残差图,样本点是如何分布?有无异常情况(个别数据对应残差过大,或残差呈现不随机的规律性等等)?

  师:提出问题,指导学生画出残差图(以残差为纵坐标,样本编号或身高或体重为横坐标作出图形),引导学生进行残差分析,从而做到检查数据是否有误,或模型是否合适等。

  生:分析、讨论。

  从残差图中可以看到第1个样本点和第6个样本点的残差较大,需要确认是否出现采集的错误,指导学生去掉这两个数据后重新再计算回归方程与相关指数,了解到拟合的效果会更好。

  引导学生归纳残差所能说明的情况:

① 样本点的残差比较大,确认采集数据时是否出现人为的错误或其他原因;

② 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高。