搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
无库存
现代稳健回归方法
0.00     定价 ¥ 38.00
浙江图书馆
  • ISBN:
    9787543230392
  • 作      者:
    罗伯特·安德森,李丁
  • 出 版 社 :
    格致出版社
  • 出版日期:
    2019-08-01
收藏
编辑推荐

在社会科学中,现代稳健及耐抗性回归方法还不太为人所知。这些方法之所以被称为“现代方法”,是因为它们通常属于密集型计算,这是当前很多依赖今天的高速电脑的统一方法的一个特征。《现代稳健回归方法》通过一套统一的符号系统,介绍了不同来源的多种稳健回归方法,以及它们彼此之间的联系。在主要统计软件如SAS和Stata已经采用这些蕞新回归方法的情况下,本书显得非常及时。

展开
作者简介

罗伯特·安德森(Robert Anderson),加拿大多伦多大学社会学和政治科学教授。他的研究兴趣是应用统计学,政治社会学(尤其是态度及政治行为的社会基础),社会分层,和工作社会学(the sociology of work)。曾在《美国社会学评论》 (American Sociology Review),《政治学刊》(The Journalof politics)和《社会学方法论》(Sociological Methodology)等期刊发表论文。

展开
内容介绍

稳健回归是一套接近密集计算型的现代技术,还能作为探测潜在问题案例的有用的诊断工具。《现代稳健回归方法》界定了一些对于理解估计的稳健性至关重要的术语,列出了异常观察案例及偏态分布影响OLS估计的不同方式,讨论了各种线性模型稳健回归方法及其限制,以及稳健回归估计的标准误,简要描述了广义线性模型和在这种模型中探测异常观察案例的几种诊断法。

展开
精彩书摘

何为“稳健” (Robustness)? 

    如休伯(Huber,2004:1)所言,“‘稳健’一词负载了很多有时并不完全一致的含义”。尽管如此,一般都认为对一个估计量(estimator)进行评价时,需要考虑两种类型的稳健性。这些是由莫斯特勒和图基(Mosteller & Tukey,1977:203-209)总结的,他们认为一个稳健的估计量必须满足两个条件:(1)数据的微小改动,将不会造成估计的剧烈变化;(2)在各种情况下该估计都具有高度的效率。第一个条件,反映的是估计量抵抗特异值干扰的抗扰性/耐抗性(resistance),可以被看作是效度的稳健性(robustness of validity)。换句话说,该估计量为数据的主体部分提供了有效的估计。第二个条件,与潜在的分布假定(underlying distributional assumption)有关,可以被当作是效率的稳健性(robustness of efficiency)。这一条件意味着,估计量的分布假定未被满足对其精度影响很小(换言之,对其标准误的影响很小)。

    本书主要关注效度的稳健性(robustness of validity)——也就是说,一个估计量在遇到异常观察值时保持不变的水平。当然,也会讨论效率的稳健性(robustness of efficiency),尽管对于一个稳健估计量来讲,它只被看作是一个第二位的标准。因此,在描述了估计量效度上的稳健性后,我们将会对其效率进行一定的讨论。必须澄清的是,尽管有偏分布(skewed distribution)和特异值/离群点(outlier)在概念上存在差异,但二者对于一个估计量可以造成类似的后果,不管是效度上的稳健性还是效率上的稳健性。不过,本书主要讨论的还是特异值的影响。简而言之,本书对试图抑制异常观察案例影响的多种估计量的稳健性进行了比较。从这个意义上讲,抗扰性(resistance)和稳健性(robustness)在整本书中被当作同义词使用——它们都被用来指示单个观察案例对估计量的影响程度。


稳健回归(Robust Regression)的定义 

    并不奇怪的是,对于回归分析而言,“稳健”也负载着很多意思。定义之一与所谓的“稳健标准误”(robust standard errors)相关,后者常被用来处理某些模式的异方差问题(heteroscedasticity)或误差相关(error dependency)问题。这一含义虽然很有用,但并不适合本书关于稳健回归的界定。前面已经说过,本书讨论的是各种专门试图适应——说得更好点,减轻——异常观察案例(影响)的方法。就这一点而言,稳健回归有两种定义与此直接相关。

    第一种将所有明确适应重尾型误差分布(heavy-tailed error distributions)及特异值的回归模型都叫做稳健回归模型。第二种区分了稳健回归(robust regression)和耐抗回归(resistant regression)。根据这种定义,稳健回归技术同时与效度的稳健性及效率的稳健性相关。这些技术用的是来自所有观察案例的信息,但给那些高度异常案例的权重较轻。很多稳健回归都考虑了残差异常值,自变量上的特异值(杠杆效应,leverage),或者两者的组合。这些方法中的大多数都能给出有效率的估计,不管误差分布是重尾分布还是正态分布。

    相反,通常被称为耐抗回归的方法一般很少考虑效率问题。这些方法的主要目标在于防止异常观察值剧烈影响回归斜率的取值。它们不仅降低异常观察案例的权重,并且经常设立一定的标准以将特异案例完全剔除出分析。

    人们通常还会将稳健回归区分为崩溃点/失效点(with a high breakdown point)高的与崩溃点低的(with a low breakdown point)。另外一种分类方式是根据模型是否存在有界限的影响(bounded influence)进行的。这些概念将在第二章中详细定义;就目前而言,只要知道一个非常稳健的估计量应该具备受限制的影响和高崩溃点就够了。这些区别曾经非常重要,不过最新发展的稳健回归已经将高崩溃点和有限影响结合起来了。

因此,就本书的目的而言,稳健回归被宽泛地定义为任何限制特异值对回归估计造成过分影响的回归。因此,这些不同的回归技术不会被分为“稳健”类或“耐抗”类。相反,本书正是从各种方法对已有方法做了怎样的发展这一角度来对它们进行探索的,当然,上述所有标准在各种方法的讨论中都会涉及。




展开
目录

第1章 导论

第1节 何为稳健?

第2节 稳健回归的定义

第3节 一个真实的例子:20世纪70年代已婚夫妇的性生活频率

第2章 重要背景

第1节 偏差与一致性

第2节 崩溃点/失效点

第3节 影响函数

第4节 相对效率

第5节 位置测度/位置量数

第6节 尺度测度

第7节 M估计

第8节 各种估计的对比

第3章 稳健性、抗扰性与最小二乘回归

第1节 一般最小二乘回归

第2节 异常案例对OLS估计及标准误的影响

第4章 线性模型的文件回归

第1节 L估计量

第2节 R估计量

第3节 M估计量

第4节 GM估计量

第5节 S估计量

第6节 广义S估计量

第7节 MM估计量

第8节 各种估计量的比较

第5章 稳健回归的标准误

第1节 稳健回归估计量的渐进标准误

第2节 自助标准误

第6章 广义线性模型中的权势案例

第1节 广义线性模型

第2节 稳健广义线性模型

第7章 结论

附录

注释

参考文献

译名对照表




展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用浙江图书馆的读者帐号和密码进行登录

点击获取验证码
登录