第1章 金融风险的基本事实
在实证研究中,通过前人的数据分析,或者现有的定性分析结果可以设定“假设”(hypothesis),根据假设,借助数据进行定量分析,以验证假设的可信度,最终在结论中选择具有数据支持的“正确的假设”。与传统计量方法不同,贝叶斯方法对假设的验证是通过不同的可能性分析实现的,而将分析结论以概率的形式呈现出来,也就是后验概率,而对于决策类问题则通过后验结果的置信度来决定选择哪一个假设。另外,在金融领域应用范围最广的是针对参数不稳定而进行的贝叶斯估计。
经典统计学用频率来描述概率,认为应该用大量重复试验的频率来确定概率;而贝叶斯统计在承认经典统计对概率的频率进行解释的同时,还允许主观概率的使用,即概率也是对事件发生的可能性所给出的信念。贝叶斯统计与经典统计学的主要差别在于是否利用先验信息,先验信息主要来源于经验和历史资料。
贝叶斯思维是在频率统计之外给出的另一类对未知现象的预判方法,而先验概率的核心理念是通过对已有数据的归纳完成对决策选择的修正。
在大数据时代,人们能够接触越来越多的信息,这些信息能否修订决策者已有的观念,对决策者的决策产生影响,是大数据能否发挥价值的关键所在。
对金融问题的研究,往往使用的是历史数据,无法进行大量重复试验,不能满足经典统计对概率的频率解释,从这个角度来说,用经典统计来研究金融问题是有局限性的,应用贝叶斯统计更为合理。
随着对金融问题研究的深入,人们发现了越来越多经典统计学难以解决的问题可以通过贝叶斯统计得到很好的解决。贝叶斯统计被很多人认为是**精确的统计方法,贝叶斯估计量具有更高的预测精度和稳定性,因为其同时利用总体信息、样本信息和先验信息,通过充分利用各种先验信息和样本信息对后验分布进行调整,可以使后验分布预测具有较高的精度。
1.1 “尖峰厚尾”的风险数据
部分金融数据存在厚尾现象,如金融收益序列的条件分布特征之一就表现出“尖峰厚尾”。我国的股市数据就有“尖峰厚尾”的特性,采用经典统计学的正态分布假设等进行拟合会与实际分布产生较大的偏差,正态分布虽可以对分布函数正常的、平稳的波动有较好的预测能力,但却无法准确描述分布的极端情形。与之相比,对数正态分布的厚尾性更好,t分布也是一种典型的“尖峰厚尾”分布。而贝叶斯统计则可以充分利用各种信息来提高拟合精度。例如,在知道数据存在“尖峰厚尾”的情况下,利用Copula函数可以构造非正态的似然函数,从而提高贝叶斯估计的精度和准确性。
1.2 小样本与数据缺失问题
贝叶斯方法可以有效处理信用风险度量中常见的数据缺失问题,而且为科学使用专家意见等主观经验提供了有效途径,已被广泛应用于信用风险度量领域。引用哈佛大学教授的一句话来说,“风险分析的本质是处理不确定性,而关键是贝叶斯统计决策方法的运用”。且从信息论的角度来看,基于极大似然估计思想的贝叶斯多源头信息融合方法充分合理地利用了各种信息,不仅可以增强统计推断结论的稳健性和可靠性,还可以有效减少统计抽样的次数,进而降低风险测度的成本。
1.3 风险预测需求
经典统计学在预测能力方面收效甚微,许多利用经典统计构造的模型几乎无法用于预测,而贝叶斯统计因同时利用总体信息、样本信息和先验信息,具有更高的预测精度。由于金融市场瞬息万变,离现在越久远的数据与当前市场情况的相关性越低,早期的数据只能用来说明历史问题,而根本不能用来描述现在,基于经典统计学的方法过分依赖历史数据,显然无法保证模型的精度和有效性。而贝叶斯统计将经验和历史资料与观测数据结合起来,使得投资者能够根据观测数据结合自己所掌握的经验信息对模型进行调整,以期获得的模型能够更准确地反映市场的风险状况,并据此做出正确的投资决策。
传统的时间序列分析与预测方法没有考虑样本和参数的先验信息,导致预测结果和实际数据的偏差较大;贝叶斯参数估计方法可以充分利用参数的先验信息,使得估计参数的方差更小,估计结果更加精确,预测结果更真实有效。贝叶斯统计学认为,贝叶斯预测结果是对先验信息与观测数据信息的一种均衡,先验信息的不确定性程度通过先验分布体现出来,而观测数据提供信息的准确程度则通过数据量的多少得以体现,当观测数据量较少时,预测结果偏重于反映先验信息,反之则偏重于观测数据所提供的信息。由于市场的变化非常快,离现在越久远的数据与当前市场情况的相关性就越低,因此不能使用太多的观测数据,否则就会使得预测结果过分依赖已经与现在无关的观测数据,降低预测的准确度。而贝叶斯预测综合了先验信息,提高了预测精度。
又如,贝叶斯向量自回归(Bayes vector autoregression,BVAR)模型利用变量的统计性质作为向量自回归(vector autoregression,VAR)模型参数的贝叶斯先验信息在一定程度上克服了VAR模型自由度消耗过快的问题,还可以提高预测精度。有学者研究表明,这种类型的模型能够对我国国内生产总值(gross domestic product,GDP)、消费、投资、出口、进口和通货膨胀进行准确短期预测,可以作为非常有用的工具。
1.4 不稳定的风险模型参数
在金融时间序列分析中,单位根检验是一个非常重要的研究问题。对于数据生成过程为自回归的厚尾型金融时序数据,传统计量经济学的单位根检验统计量应用非常困难,而应用了贝叶斯因子统计量的贝叶斯单位根检验能够取得较好的检验功效。
在运用传统的估计方法时都有一个基本的假设,就是模型中的参数是确定性的变量,但是贝叶斯参数估计方法则没有这个确定性的假设,贝叶斯参数估计的出发点是假设模型中的参数也是随机变量,与动态随机一般均衡模型完全相适应。这样,在估计参数时,贝叶斯方法就提供了一个逻辑一致的框架,可以将参数先验分布和样本信息(实际数据)结合起来,先给定参数的先验分布,先验分布设定了参数的可能取值(这些可能取值来自于模型的稳态条件或是历史经验值),这样就可以利用先验分布作为估计过程的权重,以避免参数的后验分布出现奇怪的峰值。
第2章 贝叶斯分析的应对策略
2.1 理 论 起 源
贝叶斯理论起源于贝叶斯于1763年在英国皇家学会学报上发表的著名论文“An essay towards solving a problem in the doctrine of chances”(Bayes,1763),该文提出了从二项分布的观察值出发对其参数进行概率推断的方法;之后数学家Laplace用贝叶斯提出的方法导出了重要的“相继律”。20世纪初意大利的Finetti 关于可换随机变量的研究成果为先验分布的客观性提供了理论基础;Fisher提出了推动贝叶斯理论发展的重要原理——似然原理,至今似然函数的使用依然是贝叶斯方法应用的基点,从最大似然估计到最大后验估计的转换,贝叶斯的推断理论和方法获得了系统的论述。之后不久英国Jeffreys建立了不变性原理,该原理在无信息先验分布理论领域中解决了原有假设中的一个重大矛盾,这项重要的突破性研究以及随后专著Theory of Probability(Jeffreys,1961)的出版标志着贝叶斯理论体系的形成。
计算思路及分析上的差异使得贝叶斯理论独立于经典统计学派而存在,在统计学发展过程中存在经典学派与贝叶斯学派。在统计推断的基本原理和方法方面,贝叶斯方法与经典频率统计方法之间最大的区别在于对概率的理解。经典学派认为概率可以用频率进行解释,估计和假设检验可以通过重复抽样来加以实现。而贝叶斯学派认为概率是一种主观信念,结合这种信念加以假设(先验概率),再依据样本数据信息针对先验概率进行调整就产生了后验概率。其次在使用信息上,经典学派使用了总体信息和样本信息,总体信息即总体分布或总体所属分布族的信息,样本信息即抽取样本(数据)提供给我们的信息。而贝叶斯学派除利用上述两种信息,还利用了一种先验信息,即总体分布中未知参数的分布信息。两者在使用样本信息上也有差异,经典学派对某个参数的估计可以说是无偏的,估计中利用了所有可能的样本信息;贝叶斯学派使用的是出现的样本信息,并提前对其分布做了假设,即抽样之前就有有关参数问题的一些信息。而经典统计把样本看成来自具有一定概率分布的总体,所研究的对象是总体,而不局限于数据本身,将未知参数看成常量。
贝叶斯统计模型中将参数 视为随机变量,并具有先验分布H( );贝叶斯学派与经典学派的分歧主要在于对参数的认识:经典学派视 为未知常数,贝叶斯学派视 为随机变量且具有先验分布;经典学派将概率视为大量重复试验频率的稳定值,贝叶斯学派赞成主观概率,将事件的概率理解为认识主体对事件发生的相信程度,当然,对于可以独立重复试验的事件,概率仍可视为频率稳定值。显然,将 视为随机变量且具有先验分布有实际意义,能拓宽统计学应用的范围,但也有研究学者提出先验信息的主观假定影响了估计的无偏性。
贝叶斯方法的优点有很多,例如,与频率方法比较,贝叶斯方法充分利用了样本信息和参数的先验信息,在进行参数估计时,通常贝叶斯估计量具有更小的方差或平方误差,能够得到更精确的预测结果;贝叶斯最大后验密度(highest posterior density,HPD)置信区间比不考虑参数先验信息的频率置信区间短;贝叶斯方法能对假设检验或估计问题所做出的判断结果进行量化评价,而不是频率统计理论中的接受、拒绝的简单判断;在基于无失效数据的分析工作中,贝叶斯统计有更多的优点。
第二次世界大战以后,Wald提出了统计的决策理论,随后贝叶斯学派开始将研究成果应用于实际应用领域,如社会科学、自然科学统计、经济和商业决策问题等。20世纪50年代,以Robbins(1951)为代表提出了经验贝叶斯方法,将贝叶斯方法与经典统计方法相结合,引起了统计界的广泛重视。随着统计分析技术应用范围的扩大,决策问题在统计应用中占有越来越重要的地位,贝叶斯方法在实践中也逐步得到应用,并得以迅速发展;尤其是在决策分析中,先验知识的利用不可或缺,在这一领域分析中,主观概率反映了决策者掌握信息的程度,贝叶斯观点被更多的研究者所接受。随着各种计算技术的成熟,两个统计学派依据对方提出的种种疑问,不断进行改进,20世纪后期,贝叶斯学派与经典学派在应用领域开始相互补充,共同发展。我国贝叶斯方法的应用起步较晚,直到1990年相对系统地介绍贝叶斯理论的著作才出版。
2.2 逆概率解说
本节借用以下例子来说明贝叶斯公式:
学校里有70%的男生,30%的女生。男生统一穿长裤,女生则一半穿长裤一半穿裙子。这些信息可以让我们计算“随机选取一名学生,这名学生穿长裤的概率和穿裙子的概率分别是多大”,也就是我们在概率论课程中常见的“正向概率”的问题。然而,假设你走在校园中,迎面走来一名穿长裤的学生,你能够推断出他(她)是男生的概率是多大吗?再将该问题改为传统频率统计类的表述形式:“你在校园里面随机游走,遇到了N名穿长裤的学生,问这N名学生里面有多少个女生、多少个男生”。
展开