第1章 概率论的基本概念
1.1 引言
在自然界和人类社会生活中,经常会接触到两类现象,先从实例来分析这两类现象.
例1.1.1 水在一个标准大气压下加热到100℃会沸腾.
例1.1.2 函数在间断点处不存在导数.
例1.1.3 同性电荷必然互斥.
例1.1.4 在一个标准大气压下20℃的水会结冰.
例1.1.1~例1.1.3说明是在一定条件下必然发生的现象,而例1.1.4表述的是一定条件下不可能发生的现象,这些现象都具有确定性.
把在一定条件下必然发生或必然不发生的现象,称为确定性现象或必然现象.这类现象的特征是:条件完全决定结果.与此同时,在自然界和人类社会生活当中,人们还发现发生不同结果的另一类现象.
例1.1.5 在相同条件下掷一枚均匀的硬币,落地后可能正面(指币值面)朝上,也可能反面朝上.
例1.1.6 用同一门炮向同一目标发射同一类型炮弹多发,弹着点会各不相同.
例1.1.7 过马路交叉口时,可能遇上各种颜色的交通指挥灯.
例1.1.8 在合格率为99%的产品中任取一件产品,可能抽到正品,也可能抽到次品.
例1.1.5~例1.1.8描述的现象具有共性:发生的结果预先可以知道但事前又不能完全确定把在一定条件下可能发生也可能不发生的现象称为随机现象这类现象的特征:条件不能完全决定结果.人们经过长期实践并深入研究后发现,随机现象在个别试验中其结果呈现出不确定性,但在大量重复试验中其结果又呈现出固有的规律性,这就是统计规律性.
思考题1.1.1 下面哪些是随机现象?
(A)太阳从东方升起(B)明天的*低温度
(C) 新生婴儿的身高(D)上抛物体一定下落
概率论与数理统计是研究和揭示随机现象统计规律性的一门学科,是一个重要的数学分支概率论与数理统计在金融工程、经济规划和管理、产品质量控制、经营管理、医药卫生、交通工程、人文科学和社会科学等领域有着广泛应用概率论与数理统计的思想和方法在科学和工程技术的众多领域中取得了令人瞩目的成就,对某些新学科的产生和发展起到重要的作用,现已出现了随机信号处理、生物统计、统计物理等边缘学科同时,概率论与数理统计也是信息论、人工智能、模式识别、控制论、可靠性理论、风险分析与决策等学科的基础.
人们是通过研究随机试验来研究随机现象的这里试验的含义十分广泛,它包括各种各样的科学实验,也包括对事物某一特征的观察.下面列举一些试验的例子.
E1:将一枚硬币连续抛两次,观察正面(H)、反面(T)出现的情况;
E2:抛掷一颗般子,观察出现的点数;
E3:观察某一时间段通过某一路口的车辆数;
E4:观察某一电子元件(如灯泡)的寿命;
E5:观察某城市居民(单位:户)烟、酒的年支出费用(单位:元).
上述试验具有以下特点.
(1)可以在相同的条件下重复进行;
(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;
(3)进行一次试验之前不能确定哪一个结果会出现.
将满足上述三个条件的试验称为随机试验.记为E.注意,本书中以后提到的试验都是指随机试验.
1.2 样本空间、随机事件
1.2.1 样本空间
对于随机试验,尽管在进行一次试验之前不能确定哪一个结果会出现,但试验的所有可能结果组成的集合是己知的.将随机试验E的所有可能结果组成的集合称为E的样本空间,记为s. 样本空间的元素,即E的每个结果,称为样本点(也称为基本事件).
下面写出1.1节中试验的样本空间.
(样本点是一非负数,由于不能确知寿命的上界,所以可以认为任一非负实数都是一个可能结果.)
(烟、洒的年支出,结果可以用x,y)表示,x,y分别是烟、酒年支出的费用.因此,样本空间由坐标平面第一象限内一定区域内一切点构成.也可以按某种标准把年支出分为高、中、低三档.这时,样本点有(高,高),(高,中), ,(低,低)等9种情况,样本空间就由这9个样本点构成.)
试验E5说明,样本空间的元素是由试验的目的所确定的,试验的目的不一样,其样本空间也不一样.样本空间可分为下面两种类型.
(1)有限样本空间:样本空间中的样本点数是有限的,如.
(2)无限样本空间:样本空间中的样本点数是无限的,如.
1.2.2 随机事件
在实际进行的随机试验中,人们常常关心满足某种条件的那些样本点组成的集合例如,若规定某种灯泡的寿命(单位:h)小于500为次品,则E4中关心灯泡的寿命是否有.满足这一条件的样本点组成S4的一个子集:.称A为试验E4的一个随机事件.显然,当且仅当子集A中的一个样本点出现时,有,即随机事件A发生.
一般,称试验E的样本壁间S的子集为E的随机事件,简称事件,记为A,B,C, .由此可见,随机事件是由一个或多个样本点组成的样本空间的子集,在一次随机试验中,可能出现也可能不出现在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生随机事件可以分为以下儿种类型.
(1)基本事件 只含一个样本点的随机事件为基本事件.例如,试验E2中,“出现1点”,“出现2点”, ,“出现6点”,都是基本事件.
(2)复合事件 由两个或两个以上的样本点组成的事件为复合事件.例如,试验E2中,“点数小于5”“点数为偶数”都是复合事件.
(3)必然事件 样本空间S是由全体样本点组成的事件它作为样本空间自身的子集,在每次试验中必然发生的,称为必然事件.例如,试验E2中“点数小于7”就是必然事件.
(4)不可能事件 不包含任何样本点,它作为样本空间的子集,在每次试验中是决不会发生的,称为不可能事件.
例1.2.1 在抛掷假子试验中,观察掷出的点数.
(1)“掷出点数小于7”是必然事件;
(2)“掷出点数8”是不可能事件;
(3)事件Ai={掷出i点}(i=l,2, ,6)是基本事件;
(4)事件B={掷出奇数点};事件C={2,4,6}表示“出现偶数点”;事件D={l,2,3,4}表示“出现的点数不超过4”,均是复合事件.
上述事件显然都是样本空间的子集.下面可借助集合研究事件的关系.
1.2.3 事件间的关系与事件的运算
事件是一个集合,自然可以用集合论中有关集合的关系和运算来刻画事件间的关系和运算.
设试验E的样本空间为S,而A,B,Ai (i=l,2, )是S的子集.
1. 事件的包含和相等
若事件A发生必然导致事件B发生,则称事件B包含事件A或称事件A包含于事件B,
并记作或.
若且同时,则称事件A与事件B相等(等价),记为A=B.
2. 事件的和(并)
事件称为事件A与事件B的和事件(或并事件)当且仅当事件A,B中至少一个发生时,事件AUB发生.
推广 称为事件的和事件.更一般地,可列个事件的和事件,记为.
3. 事件的积(交)
事件 称为事件A与事件B的积事件(或交事件).当且仅当事件A,B同时发生时,事件A发生.
推广 称为事件的积事件;更-般地,可列个事件的积事件,记为.
思考题1.2.1 考察这些事件间有何包含关系:AB,A,B,.
4. 两事件的差
事件称为事件A与事件B的差事件.当且仅当事件A发生,事件B不发生时,事件A-B发生.
5. 互不相容(互斥)事件
若(即A,B两事件不可能同时发生), 则称事件A,B是互不相容(或互斥)的事件.
由互不相容的定义可知,基本事件是两两互不相容的.
6. 互逆事件(互相对立事件)
若且,则称事件A与B互为逆事件或互为对立事件.
A的对立事件记作称为A的逆事件或A的对立事件显然A也是的对立事件,即A与互为对立事件,此外,.
思考题1.2.2 成立吗?
思考题1.2.3 互不相容与互为对立事件有何区别?
事件间的关系与事件的运算可用图1.2.1表示这种图称为维恩图. 其中长方形表示样本空间S,圆A、圆B表示事件A与事件B.
图1.2.1
7. 事件运算的主要性质
(1)交换律:
(2)结合律:
(3)分配律:
(4)德摩根律:
对于一个具体事件,要学会用数学符号表示;反之,对于用数学符号表示的事件,要清楚其具体含义是什么,也就是说,要正确无误地“互译”出来,方法可以有多种.
例1.2.2 从一批产品中任取两件,观察合格品的情况.记A={两件产品都是合格品},{取出的第t件是合格品,则{两件产品中至少有一个是不合格品},用表示和,分别为.
例 1.2.3 在中记事件表示“产品是次品”,事件表示“产品是合格品”,事件表示“产品是一级品”,则A与B是互为对立事件,A与C是互不相容事件;表示“产品是合格品但不是一级品”;表示“产品是一级品”;表示“产品是合格品”.
1.3 频率与概率
随机现象中事件发生的可能性大小是客观存在的,人们常常希望知道某些事件在一次试验中发生的可能性究竟有多大,即希望用合适的数量指标对这种可能性大小进行度量.例如,常说“这事儿有百分之百把握”“那事儿有七成把握”等都是用。到1之间的一个实数来表示事件发生的可能性大小.为此,*先引入描述事件发生频繁程度的数一一频率,进而引出表征事件在一次试验中发生可能性大小的实数概率
1. 频率的定义和性质
定义1.3.1 在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数称为事件A发生的频数比值称为事件A发生的频率,并记为.
由频率定义,易知频率具有以下性质:
(1)非负性 ;
(2)规范性 ;
(3)有限可加性 若是两两互不相容的事件,则
由频率的定义知道,其大小表示事件在n次试验中发生的频繁程度.频率大,事件A发生就频繁,这意味着事件A在一次试验中发生可能性就大.反之亦然.因此,频率在一定程度上反映了事件发生的可能性太小,但能否直接用频率表示事件在一次试验中发生的可能性太小?先看下面的例子.
例1.3.1 考虑抛掷硬币,观察正面H 出现次数的试验将一枚硬币抛掷3次、50次、500次,各做10遍.得到数据见表1.3.1(其中n表示试验次数,nH表示H发生的频数,表示H发生的频率).
表1.3.1
在历史上有人做过这种试验,得到数据见表1.3.2.
表1.3.2
上述统计数据表明:抛硬币次数n较小时,频率在0与1之间随机波动,频率差异较大,但随着试验次数n增大,频率虽然不是一个确定的数,但是波动却减少,并且呈现出稳定性,稳定在0.5附近.
某事件出现的频率本身是不确定的,但大量试验证实,当重复试验次数逐渐增大时,随机事件A 发生的频率呈现出稳定性,即当试验次数n很大时,频率在一个稳定的值p(0<p<1)附近摆动,尽管每进行一连串(n次)试验,所得到的频率可以各不相同,但只要n相当大,频率与某个稳定的值是会非常接近的,这个性质称为频率的稳定性,即通常所说的统计规律性.因此,重复试验太量次数,计算出频率,用它来表征事件A发生可能性太小是合适的.
但是,实际中,不可能对每一件事件都做大量的试验,因此,直接用频率表征事件发生可能性的大小是不现实的.同时,为了理论研究的需要,结合频率的稳定性和自身的性质,频率
展开