第1章 概率论概述
1.1 什么是概率?概率论是什么?
概率 随机现象(或随机事件)出现(或发生)的可能性大小的一种度量.
概率论 研究随机现象统计规律的一门数学分支学科.
随机现象 在一定条件下并不总是出现相同结果(每次结果具有一定偶然性)的现象,又称偶然现象,例如投硬币、掷骰子等.与之对应的是确定现象.
统计规律大量偶然现象所呈现的某种必然性,它是不依从人的意志所转移的客观规律.具体说,就是各种随机现象出现(或发生)的可能性大小的度量,即概率或概率分布.
图1.1
例1.1.1 (Galton(高尔顿)钉板)如图1.1,自上端放入小球,让其自由下落,在下落的过程中碰到钉子时,从左边落下和从右边落下的可能性相同.大量落下小球,就会出现规律性.无论是张三还是李四,试验结果大致相同:
小球的分布像一个“钟形”,这就是一种统计规律,是一种不以人的意志为转移的客观规律.
1.2 必然性与偶然性的关系
从哲学上讲:必然性和偶然性是对立统一的.必然性总是通过大量的偶然性表现出来,偶然性是必然性的表现形式和必要补充.必然性和偶然性在一定条件下相互转化.也就是说,
(1)必然性和偶然性是同时存在的;
(2)必然性存在于偶然性中,它通过大量的偶然性表现出来;
(3)偶然性中隐藏着必然性,它是必然性的补充和表现形式;
(4)它们在一定条件下可相互转化.
1.3 概率论简史
“好赌似乎是人类的天性”.追溯概率论,可以说它起源于赌博问题的概率计算.
据记载,人类*早的赌博游戏开始于公元前1400年,古埃及人为了忘却饥饿,经常聚在一起掷一种类似于现在骰子的东西来进行赌博.15—16世纪,意大利数学家Cardano(卡尔达诺)、Tartaglia(塔塔利亚)等研究过赌博问题,并未引起当时人们的注意.
1654年左右,爱好赌博的法国贵族Méray(梅雷)向Pascal(帕斯卡)提出了两个问题.
(1)赌金分配问题:甲乙两个人同掷(让中间人掷骰子),如果甲先掷出了3次“6”点,或乙先掷出3次“4”点,就赢了全部赌金.若甲已有2次“6”点,乙有1次“4”点,问如何分配赌金?
(2)一对骰子抛掷25次,把赌注押到“至少出现一次双6点”是否比“完全不出现双6点”有利?
Pascal和他的好友Fermat(费马,法)进行通信讨论,后来,荷兰数学家、物理学家Huygens(惠更斯)也加入了讨论,并写了《论赌博中的计算》一书.18、19世纪,随着社会的发展和生产实践的需要,特别是在人口统计、保险、测量、射击等方面提出了大量的概率问题,促使人们在概率的极限定理(大数定律和中心极限定理)等方面进行深入地研究,这时期先后对概率论发展做出重要贡献的数学家有:Bernoulli(伯努利,瑞士)、Laplace(拉普拉斯,法)、Poisson(泊松,法)、Gauss(高斯,德).
20世纪初,俄罗斯学派也做出重要贡献:Chebyshev(切比雪夫,俄)不等式、Markov(马尔可夫,俄)过程.1933年,Kolmogorov(柯尔莫哥洛夫,苏联)提出了概率论的公理化体系,这不仅部分地回答了Hilbert(希尔伯特)23个问题中的第6个问题:“物理学的公理化”,Hilbert建议用数学的公理化方法推演出全部物理学,首先是在概率论和力学领域,更重要的是,它为概率论的蓬勃发展和广泛应用奠定了坚实的理论基础.
1.4 概率论的地位、角色和应用
概率论在数学与统计学中的地位与角色如图1.2所示.
图1.2
应用
统计物理:用概率统计的方法对由大量微观粒子所构成的宏观物体的物理性质及宏观规律做出微观解释.由微观粒子状态的等概率性假设导出宏观物理性质——热力学性质.
1827年,Brown(布朗)发现花粉在液体中做不规则运动;1905年,Einstein(爱因斯坦)依据分子运动论的原理给出了分子运动的统计规律(分布),为证实分子的存在性找到了一种方法,同时也阐明了布朗运动的根源及其统计规律性.量子力学:薛定谔运用概率波函数得到了薛定谔方程.根据海森伯不确定性原理,微观粒子的位置与动量不可同时被精确确定,这时我们需要用概率方法来建模.在高能物理中,量子能级分布可用随机矩阵的谱分布来刻画.
天气预报:在实际生活中,我们可以用概率方法来预报降水的概率,描述PM2.5浓度的分布等.
经济金融:1900年,Bachelier的博士论文(投机理论)首次运用布朗运动来描述股价;保险精算中发生理赔的次数;在证券投资组合中,各资产的收益、期权定价等,都需要用到概率模型和方法来描述与分析.
医学:在临床医学中,各种疾病发病率、疗效率、死亡率等都需要用概率统计的方法进行估计与分析.
军事:我们可能运用概率模型和方法分析各种武器的命中率、失效率、杀伤力等性能.
社会学:我们常用出生率、死亡率建立人口数量变化的随机模型,描述人口变化规律.通过分析《红楼梦》各章回中虚词出现的频率及它们的相互关系来分析、判断《红楼梦》的作者.我们可以用随机网络的度分布来描述人际关系网络、论文相互引用网络、各公司资金流动网络等.
上述都大量涉及利用概率方法与建模.
这一章我们将讨论随机事件及其运算规律,古典概型和几何概型,概率的公理化定义及其性质,条件概率与随机事件的独立性、乘法公式、全概率公式和贝叶斯公式,这些是学习以后各章的基础.
2.1 随机事件
问题什么是随机事件?其数学本质是什么?有什么运算规律?
2.1.1 样本空间和随机事件
问题2.1.1我们考察某大学生每天使用手机某款应用软件(APP)上网的时间 (单位:小时),该生每天手机上网时间是随机的,是随机现象.我们关心如下问题:
(1)该生在某天没有用该APP的概率?
(2)该生在某天用该APP的时间不超过2小时的概率?
(3)如何刻画背后的统计规律?
问题2.1.2我们考察某公交车站旁边每天上午9:00的共享单车的数量,每天共享单车的数量是不一样的,具有一定的随机性.我们关心如下问题:
(1)某天该公交车站旁边没有共享单车的概率?
(2)某天该公交车站旁边共享单车数量在100到200之间的概率?
(3)又该如何刻画背后的统计规律?
生活中还存在大量的像这样的随机现象.我们要研究随机现象,需要引进如下概念:
随机试验对随机现象的观测,我们称为随机试验.
样本空间随机试验中的所有可能结果的全体,记为Ω.
样本点随机试验中一种可能的结果,或者说样本空间Ω中的元素ω.
在问题2.1.1中,样本空间为Ω={x:0.x.24};在问题2.1.2中,样本空间为Ω={0,1,2,3, }.
例2.1.1(1)观察新生婴儿的性别,Ω={男孩,女孩};
(2)“五一”国际劳动节的天气,Ω={下雨,不下雨};
(3)“五一”国际劳动节前*后一个交易日的股票价格,Ω={x:x.0};
(4)本周末光顾某超市的人数,Ω={0,1,2, }.
随机事件通俗讲,在观察随机现象中,可能发生也可能不发生,而在大量重复试验中具有某种规律性的事件,称为随机事件,简称事件.从数学上说,随机事件是样本点的集合,或者说Ω的子集,记为A,B,C, .基本事件只包含一个样本点的随机事件(单点集).
不可能事件不包含任何样本点的随机事件(空集), 必然事件包含所有样本点的集合,Ω.
设A.Ω为随机事件,则
事件A发生,当且仅当试验结果ω∈A.
例2.1.2 在问题2.1.1中,事件该生在某天没有用该为基本事件;事件该生在某天用该APP的时间不超过2小时,如果随机试验结果为1.2小时,则事件B发生;如果试验结果为2.3小时,则事件B没有发生.
2.1.2 (随机)事件的运算
由于事件本质上是集合,所以事件之间的关系与运算就转化为集合间的关系与运算.这里我们要着重理解其概率解释(含义).
(1)事件的并(集合并集)A∪B表示A事件发生或B事件发生,A,B至少有一个发生.如图2.1所示.
Ai表示A1, ,An中至少一个发生;
Ai表示A1,A2, 中至少一个发生.
(2)事件的交(集合交集)A∩B表示A,B事件同时发生,有时也记为AB.
如图2.2所示.
Ai表示A1, ,An同时发生;
Ai表示A1,A2, (可列无穷多个)同时发生.
图2.1
图2.2
例2.1.3 掷骰子一次,令A={2,4,6},B={点数.4},则A∩B={4,6}.
(3)事件的差(集合的差)B.A:=B.(A∩B)表示B发生且A不发生,如图2.3所示.
图2.3
(4)互不相容(不相交集合)AB=.表示A,B不能同时发生.
例2.1.4 掷骰子一次,A={1},B={2},则A,B互不相容,结果不可能出现点数既为1又为2.
若,则两个事件的并可以写成两个事件的加和.
(5)逆事件(补集合),又称为事件A的对立事件.
(6)对称差表示A,B至少有一个发生,但A,B不能同时发生(A,B仅有一个发生).
事件运算满足通常的交换律、结合律和分配律:
(1)交换律:A∪B=B∪A;
(2)结合律:A∪(B∪C)=(A∪B)∪C;
(3)分配律:
A∩(B∪C)=(A∩B)∪(A∩C),
A∪(B∩C)=(A∪B)∩(A∪C);
(4)对偶律(DeMorgan律):
A∪B=A∩B,A∩B=A∪B.
证明 仅证(4),易知且.于是,ω∈A且ω∈B,即.
同理证从而.类似可证:A∩B=A∪B.
一般地,事件并可以写成互不相容的事件的加和:
多个事件的并也有类似的写法.
2.2 相对频率和概率准则
问题随机事件发生的概率就是它发生的可能性的大小,是一个客观存在的数.能不能用试验来估计这个数呢?
定义2.2.1 设A为(随机)事件,重复观察n次,n(A)表示在n次试验(或观察)中A事件发生的次数.则称为事件A发生的(相对)频率.
展开