《回归诊断简介》针对回归中经常出现的影响估计精度的因素,对研究者的假设提出质疑,运用“回归诊断”判断假设的合理性并处理回归分析中存在的问题。本书从回归分析中析出几大重要方法,如蕞小二乘回归、蕞大似然法、共线性、非线性、离散数据等,对该问题进行解释,结构分明,叙述清楚。
回归诊断是用于探索存在于回归分析中问题及判断某些假设是否合理的一种技术。《回归诊断简介》主要回顾蕞小二乘线性回归,讨论多元回归中共线性的问题,处理奇异与强影响数据,探讨误差非线性、不一致的误差方差和非线性问题,简要阐释离散数据产生的问题,介绍基于蕞大似然法、计分检验和构造变量的较复杂的诊断方法。最后,探讨了如何将介绍的具体诊断方法和技术应用到研究中去。
模型的重新确定(model respecification)。尽管共线性是数据中的问题而非(必然)由于模型的缺陷,但一种解决此类问题的方法是模型重新确定。也许经过进一步的深思熟虑会发现,某些模型中的回归因子可能是同一个潜在的建构的不同概念化指标。所以这些测量可以使用某些方法进行合并,或者可以选择用来表示其他的建构。在这种情形下,被研究的自变量 的高度相关恰恰显示了高度的有效性。假设一个跨国分析是针对影响婴儿死亡率的因素,那么自变量中的人均GNP、人均耗能量以及人均电视拥有率会高度相关。此时研究可能将这些变量处理为表现总体经济发展水平的一个指标。
或者,我们可以重新考虑是否需要在检查 与 的关系时控制 。一般来说,这一类的重新确认只发生在初始模型不理想或研究者想要放弃一些研究目标时。例如,假设一个时间序列回归想要检验决定已婚妇女劳动参与的决定因素,共线性问题使得我们很难分离开男性工资水平与女性工资水平的影响。但是在这个研究中,我们可能仍然对在控制其他自变量时妇女的工资与参与劳动力市场的局部关系。
变量选择。一个常见的但往往容易被误导的解决共线性的方法是变量选择,它往往包括一定的步骤,用于将模型中回归因子减少至较低相关性的组合。向前逐步回归的方法每一次在模型中加入一个变量。在每一步中,使得 增量最大的变量将被选择留下。这一步骤在增量比预先设定的一个标准小时停止。向后逐步回归方法与之类似,差别在于全部过程从全模型开始,且每次删除掉一个变量。向前/向后的方法是上述两种方式的组合。
序
第1章 概论
第2章 最小二乘回归
第1节 回归模型
第2节 最小二乘估计
第3节 回归系数的统计推论
第4节 一般线性模型
第3章 共线性
第1节 共线性与方差膨胀
第2节 对共线性的处理:没有速效方法
第4章 奇异值与强影响数据
第1节 测量影响力:预测值
第2节 查找奇异值:学生残差
第3节 测量影响程度:Cook距离与其他诊断方法
第4节 诊断统计量中的数值截断点
第5节 联合的强影响观测子集:偏回归图
第6节 非同寻常的数据应该被抛弃吗?
第5章 非正态分布误差
第1节 残差的正态分位数比较散点图
第2节 残差的直方图
第3节 通过转换矫正不对称
第6章 不一致的误差方差
第1节 寻找不一致的误差方差
第2节 矫正不一致的误差方差
第7章 非线性
第1节 残差与偏残差散点图
第2节 进行线性转换
第8章 离散数据
第1节 检验非线性
第2节 检验不一致误差方差
第9章 最大似然法、计分检验和构造变量
第1节 y的Box-Cox转换
第2节 对x的Box-Tidwell转换
第3节 对不一致误差方差的矫正
第10章 建议
第1节 计算诊断量
第2节 延伸阅读
附录
参考文献
译名对照表
温馨提示:请使用员工书屋的读者帐号和密码进行登录