第1章预备知识
本书用( )表示行向量,[ ]表示列向量, diag( )表示对角矩阵,.表示矩阵的转置, I 表示单位矩阵,1表示元素都是1的列向量,0是零矩阵(向量),其维数由上下文确定; Ai 表示矩阵 A 的第 i 列; N+={0,1,2, }为非负整数集;R =(-∞,+∞)为实数集, R+=[0,+∞)为非负实数集,为广义实数集, B(R)为实数 Borel 集全体;对任意,记; Rn 为n 维实数空间, B(Rn)为 Rn 中 Borel 集全体.表示空集,约定.
1.1概率空间与随机变量
定义1.1.1设Ω=(ω)是一非空集合,其中的元素称为“点”,用ω表示.设 F 是Ω中的某些子集所组成的集合,如果 F 具有下列性质,就称它是Ω上的一个σ代数:
(1)Ω∈ F;
(2)如 A ∈ F,则余集;
(3)如,则.
定义1.1.2定义在σ代数 F 上的集函数 P 称为概率,如果 P 满足下列条件:
1°对任意 A ∈ F,有;
2°
3°如,则.
称三元总体(Ω,F, P)为概率空间,并称Ω中的点ω为基本事件,Ω为基本事件空间, F 中的集 A 为事件, P(A)称为事件 A 的概率.
例1.1.1设是Ω中一切子集组成的集合,对任意的,其中 k 为 A 中所含点的个数.
例1.1.2设Ω=(0,1,2, ),即一切非负整数的集, F 为Ω中一切子集的集,其中λ>0为某常数.
例1.1.3设Ω=[0,1],即0与1之间一切实数的集, F 为Ω中一切 Borel 集所成的σ代数, P(A)等于 A 的 Lebesgue 测度.
这三个例中的(Ω,F, P)都是概率空间.
容易推知,概率具有单调性:若 A,B ∈ F,且 A . B,则 P(A). P(B).
有时,需设概率空间(Ω,F, P)或概率 P 为完全的.所谓完全是指:如果A ∈ F 且 P(A)=0,则对.B . A,有 B ∈ F,由概率的单调性,此时必然有P(B)=0.这就是说,对完全概率 P,概率为0的事件 A 的子集 B 也是事件,且概率为0.以后无特别说明时,总设此条件满足.
定义1.1.3设 X(ω)是定义域为Ω取值函数,如果对任意实数 x,有
(1.1.1)
称 X(ω)是一随机变量,简记为随机变量 X.
随机变量的统计规律可用分布函数来描述,下面给出分布函数的定义与性质.
定义1.1.4设(Ω,F, P)是概率空间, X = X(ω)是一随机变量,称为随机变量 X 的分布函数.
以后无特别说明时,我们总设 X(ω)取±∞为值的概率为0,并简单地称X(ω)为实值随机变量,因此分布函数 F(x)具有下列性质:
(1) F(x)具有单调性,即若 x1< x2,则;
(2);
(3) F(x)是右连续的,即 F(x +0)= F(x).
如果定义在 R =(.∞,+∞)上的实值函数 F(x)具有上述三个性质(分别称为单调性、有界性、右连续性),称此函数 F(x)为分布函数.
熟知,有两类典型的随机变量和分布函数.一类是离散型的,随机变量 X 取
值可数集 A ={a1, a2, },记.
其分布函数为.另一类是连续型的,即存在非负函数 p(x),使得,p(x)称为密度函数.统称两类 p(x)为分布函数的概率函数.如果分布函数 F(x)含有参数或参数向量,记其概率函数为或.
可以证明,对于任何分布函数 F(x),必存在一个概率空间(Ω,F, P),以及定义在其上的随机变量 X,使得 X 的分布函数是 F(x).
定义在同一概率空间(Ω,F, P)上的 n 个随机变量 X1(ω), ,Xn(ω)构成一个 n 维随机向量 X(ω):
(1.1.2)
并称 n 个元(λ1, ,λn)∈ Rn 的函数
(1.1.3)
为 X(ω)的 n 维分布函数.由(1.1.3)可见 F(λ1, ,λn)具有下列性质:
(a)对每个λj 是不下降的右连续函数;
(b);
(1.1.4)
(c)如果,则.
(1.1.5)
(当 n =2时此条件的直观意义*明显.一般地,(1.1.3)式右方是 X(ω)取值于Rn 中长方体内的概率,故它大于或等于0;此长方体是(λ1,μ1]×(λ2,μ2]× ×(λn,μn],即是由 Rn 中如下的点所成的集,它的第 j 个坐标位于(λj ,μj ]之中.
现在可以脱离随机变量来定义分布函数.称任一具有性质(a)—(c)的 n 元函数 F(λ1, ,λn)(λj ∈ R, j =1, , n)为 n 元分布函数.由测度论知, F(λ1, ,λn)在 B(Rn)上产生一概率测度 F(A):
(1.1.6)
称 F(A)(A ∈ B(Rn))为由 F(λ1, ,λn)所产生的 n 维分布.
可以证明,对 n 元分布函数 F(λ1, ,λn),必存在概率空间(Ω,F, P)及定义在其上的 n 元随机向量 X =(X1, ,Xn),使得 F 是 X(ω)的分布函数,即(1.1.3)式成立.
1.2几种常用分布
常见的分布有二项分布、泊松分布、均匀分布、正态分布、几何分布、指数分布等,下面分别就本书涉及的几何分布、指数分布以及衍生的混合几何分布与混合指数分布进行简要介绍.
1.2.1几何分布与指数分布
定义1.2.1称随机变量 X 服从参数为 p 的几何分布,如果 X 取正整数值,且满足
(1.2.7)
其中,0< p <1.记为.
例如,在伯努利试验中,记每次试验中事件 A 发生的概率为 p,事件 A 首次出现时的试验次数为 X,则.
显然,若随机变量,则有.
定理1.2.1(几何分布的无记忆性)设,则对任意正整数.
(1.2.8)
定义1.2.2称 X 服从参数λ的指数分布,若随机变量 X 的密度函数为,其中,参数λ>0.记作.
指数分布的分布函数为.
定理1.2.2(指数分布的无记忆性)设 X ~ Exp(λ),则对任意 s, t >0.
(1.2.9)
显然,若随机变量 X ~ Exp(λ),则有.
1.2.2混合几何分布与混合指数分布
在数据分析中,经常会碰到一些复杂数据,这些数据表现出不同的性质,此时单一地用某个分布来进行数据分析或拟合,将无法满足需求.例如,对于单个总体的寿命试验数据进行分析的统计方法已经发展得非常成熟.但是,在应用中经常会发现设备存在早期失效的个体.也就是说,进行一个寿命试验,前期的失效率是很高的.但是,随着时间的增加,失效率将保持稳定或者继续增加.当然,这和产品的失效机制有关.从实际的角度来看,工程师会把这些产品的失效归结为不同的失效机制.从统计的角度来看,可以认为这一些产品来自于不同的两个或多个子总体.
于是,混合分布被作为一种新的统计模型提出,它用于描述各种不同的分布按照一定的比例混合而成的总体.混合分布模型*早由克拉克(P. K. Clark)提出,[109,122]等对其进行了发展,从而奠定了理论基础.[45]介绍了混合几何分布,并应用于平稳队列系统的忙周期分布;[66]研究了几何分布与负二项分布的(有限项)混合及其拟合;等等.
下面定义混合分布模型,再给出混合几何分布与混合指数分布的定义.
定义1.2.3(混合分布模型)设有 n 个概率函数,其中每个为实数参数(或参数向量).设非负实数λi 满足
(1.2.10)
则也是概率函数,其中.称代表的分布为 n-混合分布,其参数为.
混合分布的随机变量 X 可如下产生.构造 n +1个相互独立的随机变量,其中 Xi 的概率函数为,且 N 的分布律为,则 XN 具有 n-混合分布,其参数为.
混合分布的一种特殊情形是混合几何分布,它是寿命数据的一种分析模型.
定义1.2.4称 X 服从 n-混合几何分布,如果随机变量 X 的概率函数为
(1.2.11)
其中,为混合参数,且.记为.
混合几何分布中,λi 表示第 i 个成分在混合分布中所占的比重, pi 表示分布中第 i 个几何总体的参数;亦可用表示整个总体中的参数.显然,若随机变量,则有.
混合指数分布也是寿命数据中广泛使用的一种非常重要的统计分析模型,它
广泛应用于可靠性分析、故障诊断、生物医学统计、生存分析等领域.
混合分布的另一种特殊情形是混合指数分布.
定义1.2.5称 X 服从 n-混合指数分布,若随机变量 X 的概率函数为
(1.2.12)
其中,为混合参数,且.
在混合指数分布中,λi 表示第 i 个成分在混合分布中所占的比重,αi 表示分布中第 i 个指数总体的参数;亦可用表示整个总体中的参数.
显然,若随机变量,则有,
展开