第1章回归分析
回归分析研宄的主要对象是客观事物变量间的统计关系,即建立在对客观事物大量试验和观测的基础上,寻找隐藏在表面不确定现象中统计规律性的统计方法.本章主要介绍多元线性回归模型及相关性质、不符合基本假设的检验和多重共线性问题的解决方法.
1.1回归模型
1.1.一般形式及假设
如果P个自变量,和因变量Y之间存在如下的相关关系:
则称上式为多元回归模型,其中f( )称为回归函数,其中,是自变量的观察值,为随机误差项,满足高斯-马尔可夫(Gauss-Markov)假定
(1.1)
1.1.2线性模型及参数的*小二乘估计
考虑p个自变量,和因变量Y之间满足如下的相关关系:
(1.2)
则称(1.2)式为多元线性回归模型.称为多元线性回归函数,为待估参数,称为回归系数,为随机误差项.特别地,当p=1时(1.2)式就退化为一元线性回归模型.
设来自模型(1.2)的样本为,如果满足如下的条件:
(1.3)
(1.4)
(1.4)
(1.5)
(1.6)
(1.7)
(1.8)
(1.9)
1.1.3*小二乘估计的性质
性质1.1
证明由(1.4)式知
(1.9)
性质(1.2)
证明
性质(1.3)
性质(1.4)
证明由性质(1.2)得
性质1.5
证明 按如下方式分解总偏差平方和
性质1.6假定随机误差
证明
性质1.7假定随机误差,则有
(1)
(2)
(3)
证明比较复杂,请参考相关文献.
1.1.4线性模型的显著性检验
自变量和因变量之间是否具有密切的线性关系,需要对线性模型进行显著性检验.需要注意的是,即便,与之间有密切的线性关系,但也不意味着每个变量对都有显著的影响.因此,还必须检验每个变量对影响的显著性,对那些影响不显著的变量应从模型中逐个剔除后,重新建立只包含对有显著影响的自变量的回归方程.
1.模型的显著性检验
若所有自变量,对因变量的影响不显著,那么模型(1.2)中的系数.则问题转化为检验
(1.10)
由性质1.5可知,在H0成立条件下,对于确定的,较大是一个小概率事件,故选择拒绝域的形式为,再根据性质I.7知,当H0成立时,有
(1.11)
所以当H0成立时,对给定的显著水平可求得临界值
该检验方法称为F检验法.
还可以利用回归平方和在总离差平方和中所占比例大小衡量与,之间的线性相关的密切程度,称
(1.12)
展开