随机试验与样本空间

来源: 生物医药科研助手/OumeyBio

曾经给中学生讲过一些概率问题,不过没有系统讲,今天再次给学生讲了一次概率论,讲授稍微抽象了一些,增加了分类的思想,也是帮助自己学习一下概率论。主要介绍了随机试验、样本空间以及随机事件这三个基本概念,读起来可能需要耗费一点脑筋。

什么叫随机试验?符合下面三个特点的试验就叫做随机试验:

(1)一次试验结果的随机性——进行一次试验之前无法确定哪一个结果会出现。

(2)全体测试结果的可知性——每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果。

(3) 可重复性——可以在同一条件下重复进行试验。”

“随机实验的一切可能基本结果组成的集合称为该试验的样本空间,样本空间的元素,即试验每一个可能的结果,称为样本点。”

样本空间的子集称为随机事件,样本点构成的单点集称为基本事件,但有时也把样本点本身称为基本事件。

基本概念清楚了,现在开始一点稍微“与众不同”的阐述。相对于同一个随机试验而言,样本空间是不是唯一的?我们还是从一个古典概型开始,一个骰子的六面分别标有123456六个数字,随机抛掷这个骰子,这是一个随机试验,那么样本空间是什么?估计大多数人都会说,样本空间自然是{123456},这当然是这个试验的样本空间,但这个样本空间指的是骰子出现不同数字的所有可能结果。如果我问,在这个随机试验中,出现奇数的概率是多少?你一定会认为{135}是一个随机事件,其概率可以根据135出现的概率来计算,三个点的概率相加,自然是1/2,解答肯定没错。我们再换一种方法,将135所在的面用白色的纸粘住,246用黑色的纸粘住,这样骰子的六个面只有黑白两色,随机抛掷这个骰子,可能出现的结果有哪些?换句话说,这个随机试验的样本空间是什么?你该不会说是{白,白,白,黑,黑,黑}吧?集合里面的元素是不能重复的,也就是说,这个随机试验的样本空间是{白,黑},明白我想说什么了吗?

在一个随机试验中,可能出现具有多种属性的结果,如果你关心的某种属性没有共性,那么所有可能的结果都是样本点,如果你关心的某种属性具有共性,也可以将具有共同属性的结果放在一起作为新的样本点。上面的随机试验说的就是这回事,当你关心的是骰子的每一面出现的具体的数字,而这些数字又是互不相同的,那么样本空间就是可能出现的每一个数字,例如上面的{123456}。如果关心的是这些数字的某种共同属性,例如奇偶性,那么可以将这种共同的属性作为可能的结果,即样本点,具体地说,如果上面掷骰子试验关心的是数字的奇偶性,那么样本空间是{{135}{246}}或者{奇数,偶数}。这里蕴含着分类的思想,将同为奇数的数字放在一起看成一点,同为偶数的数字放在一起也看成一点。

对于古典概型来说,无论采用哪种方法都不会带来歧义。歧义与悖论是不同的概念,所谓歧义是指在理解上会产生几种可能的结果,即可以这样理解也可以那样理解。歧义源于语言文字的意义不明确,有两种或几种可能的解释。悖论则属于逻辑学范畴,由A可以推出非A,非A可以推出A。所以歧义带来的不同结果与逻辑带来的悖论是不同范畴的东西,不可混为一谈。概率论中的一些问题由于随机设定的不明确容易导致歧义的产生,所以,避免歧义产生的方法有两种,一种方法是事先明确随机设定,另一种方法是遵守公认的规则,例如古典概型与几何概型遵循无差别原则,如果违背了这个原则,就不是古典概型或几何概型了。但即使这样仍然有可能产生歧义,即对目标的理解有差异。

目标是指你要解决什么问题,这个问题有时会让人一头雾水,例如:“随机作圆的弦,弦长大于该圆内接正三角形边长的概率是多少?”这个问题的目标是什么?样本空间是什么?语言是否有歧义?有一种观点认为样本空间是圆的弦,而弦由弦的中点唯一确定,所以样本空间可以看成该圆内的任意点。另一种观点认为,过圆上一点随机引圆的弦,弦的位置由该弦与过其顶点处圆的切线之夹角唯一确定,所以样本空间应该是角度。还有一种观点认为,由于目标是计算弦长大于正三角形边长的概率,如果以x表示弦的长度,这个问题中的随机事件是{x|x>正三角形的边长},显而易见,弦长是样本点。我赞同最后一个观点,因为该问题的目标很明确,它关心的是弦的长度,而不是具体的弦,正如前面掷骰子关心的是奇数还是偶数一样。然而弦长一定的弦有很多,与正三角形外接圆同心的小圆上所有的切弦都是等长的,反之亦然。因此,我们需要做一个等价类,将同一个圆上的所有切弦看成一点,或者说把所有等长的弦放在一起看成一点,从而只需要考察与大圆的固定直径垂直的弦就可以了。问题出现歧义正在于考察了弦的不同属性,第一种情形考察的是具体的弦,即弦的位置(个性),第二种情形考察的是弦与大圆切线的夹角(既有共性也有个性,因为圆周上每个点处都可以随机引圆的弦),第三种情形考察的是弦的长度(共性)。说白了,三种情形对应三个不同的问题,虽然最终貌似都与弦长有关,但真正只与“弦长”这个共性特征有关的情形是第三种情形,其它两种情形都与弦的位置这个“个性”特征有关。从这个问题的目标看,随机事件是{弦长大于正三角形的边长},这里并未涉及弦长之外的其它与弦有关的特征,为什么要人为添加上去呢?

如何确定样本空间是理解概率问题的关键,我们常常着眼于问题开始时的描述(随机试验),试图根据这个描述确定样本空间,却忽略了问题的目标,因为针对同一个随机试验,关注的目标不同,对应的概率问题也就不同。从这个角度说,只要一个随机试验包含多种属性,就有必要根据问题的目标来确定样本空间,因为目标才是确定随机事件的依据。以前面所说问题的第一种解答为例,如果我们把问题改成:“随机作圆的弦,弦的中点位于该圆内接正三角形的内切圆内的概率是多少?”这个问题的答案无疑是唯一的,即1/4