赌徒谬误:赌博与大数定律

来源: 生物医药科研助手/OumeyBio

先讲一个赌场捞金的故事。

很多人都听说过概率或统计中的蒙特卡罗(Monte-Carlo)方法,说白了就是利用大量数据在统计的基础上进行计算的方法。蒙特卡罗不是人名,是法国边上一个袖珍小国摩纳哥中著名赌场的名字。自从蒙特卡罗赌场于1865年开张后,摩纳哥从一个穷乡僻壤的弹丸之地,一跃而为欧洲最富有的国度之一,至今已经150年过去,这个国家仍然是以赌场和相关的旅游业为主。

那年代有一个名叫约瑟夫·贾格尔(Jaggers)的英国人【1,是约克郡一个棉花工厂的工程师,在摆弄加工棉花的机器之余,经常光顾蒙特卡罗赌场,特别感兴趣我们在系列第一篇中介绍过的那种38个数字的轮盘游戏。毕竟是位优秀的机械工程师,脑袋中的弯弯绕绕比一般赌徒要多一点,贾格尔想:这轮盘机器在理想的情况下,每个数字出现的概率都是1/38。但是,机器怎么可能做到完美对称呢?任何缺陷都可以改变获奖号码的随机性,导致转盘停止的位置偏向某些数字,使这些数字更为频繁地出现。因此,赌徒应该可以利用这种偏向性来赚钱!于是,在1873年,贾格尔下决心要改变自己的命运,他带上他所有的积蓄,前往蒙特卡罗赌场,雇用了六个助手,每个助手把守一个轮盘机器。白天,赌场开放了,助手们用贾格尔供给他们的“赌币”,让轮盘不停地哗啦哗啦转!不过,他们并不在乎输赢,他们的任务是记下轮盘停止时的每一个数字。然后,到了晚上赌场关门后,贾格尔便在旅馆里独自分析这些数字的规律。六天后,五个轮盘的数据没有发现有意义的偏离,但第六个轮盘为贾格尔带来了惊喜:38个数字中有9个数出现的概率显然要比其余的频繁得多!贾格尔兴奋不已,第七天他前往赌场,认定了那台有偏向性的轮盘,大量投注这九个频率高的数字:789171819222829。这种方法使贾格尔当天就赚了7万。不过,贾格尔没高兴几天,事情便引起了管理人员的注意,经理们采取了各种方法来挫败贾格尔的策略,最后贾格尔无法赚更多的钱,便离开了赌场,带着已经到手的巨款,投资房地产去了。

赌场中的确有极少数的人像贾格尔那样偶然幸运地赚了一笔,但更多的赌徒是十赌九输,一直到输光为止。这其中的原因有两个:一方面是因为所有赌场游戏的概率设计本来就是以利于赌场为准,让赌场一方赢的概率为51%52% ,玩家赢的概率为49%48% ,如此设计的赌场才能包赚不赔。另一方面,利用赌徒的心态也是赌博游戏设计者们的拿手好戏。赌徒谬误便是一种常见的、不符合概率规则的赌徒错误心态,经常被赌场利用。

赌徒谬误(The Gambler's Fallacy

赌徒谬误的来源是因为将前后互相独立的随机事件当成有关联而产生的。怎么样算是独立的随机事件呢?比如说,抛硬币一次,是一个随机事件。再抛一次,是另一个随机事件。两个事件独立的意思是说,第二次的结果并不依赖于第一次的,互相没有关联。假设硬币是理想对称的,将出现“正”记为1,“反”记为0,那么,每次结果为10的概率都是1/2。第二次“抛”和第一次“抛”互相独立,再多“抛”几次也一样,每次的“抛丢”事件互相独立,出现10的概率总是“1/21/2”,都和第一次一样。即使硬币不对称,比如两面之概率可能是“2/31/3”,也并不会影响每次投丢的“独立性”,每次得到正面的概率都是2/3,并不受上一次结果的影响。

道理容易懂但有时仍会糊涂。比如说,当你用“公平”硬币接连抛了51,到了第6次,你可能会认为这次“1”出现的概率会更小了(<1/2),“0”出现的概率更大了(> 1/2)。也有人是逆向思维,认为既然5次都是1,也可能继续是1(也被称为热手谬误)。实际上这两种想法,都是掉进了“赌徒谬误”的泥坑。也就是说,将独立事件想成了互相关联的事件。事实上,一般来说,硬币每次的结果,并不影响下一次正反的概率,硬币没有记忆,不会因为前面5次被抛下时都是正面向上就会加大(或减小)反面朝上的概率。也就是说,无论过去抛出的结果如何,每一次都是第一次,正反出现的几率都是1/2。另外,还有生男生女的问题,也很容易产生谬误,比如有对父母接连生了4个女孩儿,就觉得第5个是男孩的可能性增大了。但事实上,第5个是男或女的概率仍然是50%50%,并不因前面4个都是女儿而改变。这些都是与“赌徒谬误”类似的迷思。

还有一个笑话:某呆子上飞机时身上带了个炸弹,问其原因,答曰:飞机上有1个炸弹的几率是万分之一,同时有两人带炸弹的几率就是亿分之一,我自己带上一个(绝不爆炸!),便将飞机上有(将爆)炸弹的概率从万分之一降低到了亿分之一!想必你看到这儿,一定会抿嘴一笑。是啊,能不笑吗?此呆子将“自己带炸弹”与“别人带炸弹”的独立事件视为相关,呆子非赌徒,但这也算是一种赌徒谬误。

当然,认为每次抛硬币是互不关联的独立事件,或每一胎生男生女是独立的,也只是我们描述某些随机事件所使用的数学模型而已,物理世界中的此类事件并不一定真正独立。比如说到生男生女的问题,也许有某种与荷尔蒙有关的原因使得前后两胎的性别有所关联,也不是没有这种可能性的。但是,如果有关联,也要明白是如何关联的?应该使用何种模型来描述这种关联?那是另一种类型的研究课题,而赌徒谬误指的则是将本来没有关联的随机事件,以为有关联来考虑问题而产生的谬误。

1:赌徒谬误

赌徒有了“赌徒谬误”的心态,会输得更惨。比如说,赌场中著名的输后加倍下注系统(Martingale)便是利用赌徒谬误的例子。赌徒第一次下注1元,如输了则下注2元,再输则4元,如此类推,直到赢出为止。赌徒以为在连续输了多次之后,胜出的概率会非常大,所以愿意加倍又加倍地下注,殊不知其实概率是不变的,赌场的游戏机和通常抛丢的硬币一样,没有记忆,不会因为你输了就给你更多胜出的机会。赌徒或是因为不懂概率,或因为人性的弱点,往往自觉或不自觉地陷入赌场设置的陷阱中。

赌徒谬误不仅见于赌徒,也经常反映在一般人的思维方式中。人们在预测未来时,往往倾向于把过去的历史作为判断的依据,也就是说,根据某事件曾经发生的频率来预言事件将要发生的可能性。中国人说“风水轮流转”,这句话很多时候的确反映了现实,但如果将这种习惯性的思维方法随意地应用到前后互相独立的随机事件上,便犯了赌徒谬误。

即使明白地认识到“赌徒谬误”的错误,许多人仍然会犯糊涂而陷于其中。就数学原因而言,来自于某些容易混淆的概念,下面我们列举1例,用抛硬币的实验来说明。

有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。所以,第5次正面的机会只有1/32,而不是1/2

以上论证是混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,前者等于1/32,后者却是1/2

前者指的是:在硬币第1次抛出之前,如果预测接连抛5次的各种可能性,共有25=32种不同的排列情形,等效于从0000011111322进制数。每一种情形出现的几率均为1/32

后者指的是:已经抛了4次均为正面,那么,4次的结果已经固定了(1111),没有再选择的机会。剩下的第5次,可能是10,即总结果只有两种:1111111110,各占1/2

误用大数定律

赌徒谬误产生的另一个原因是对“大数定律”的误解。

首先要说说大数定律是什么【2。如果要用一句通俗的话来概括的话,大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率。

对一枚对称硬币而言,出现正面的预期概率是1/2。当我们进行n次实验后,得到正面出现的次数n,比值p= n/n,叫做正面出现的频率,频率不一定等于概率(1/2),但是,当n逐渐增大时,频率将会逐渐趋近1/2。掷骰子的情形也类似,掷100次,数目为1的面也许出现了20次,即出现1的频率是1/5;如果掷了10000次之后,1出现了1900次,那么这时出现1的频率是1900/10000=19%。如果这个骰子是6面对称的,出现1的频率会随着投掷次数的增加而趋近于1/6,即预期的概率。也就是说,频率取决于多次实验的结果,而概率是一个极限值,实验次数增大,频率趋近概率,这就是大数定律。

赌场赚钱的秘诀也是在于大数定律。赌博机一般被设计为“51%:49%”的预期概率,赌场赢的概率至少51%。因此,赌场永远不会和你进行“一锤子买卖”的交易,他们只需要多多地、不停地招揽顾客,然后,随着赌博机咕噜咕噜转动,硬币叮当叮当落下,赌徒们以为自己要赚大钱了,老板们却心中暗喜,静等大数定律显示威力,他们则坐收渔利。

提出并证明了大数定律最早形式的是瑞士数学家雅各布·伯努利(Jakob Bernoulli ,16541705),雅各布是概率论的重要奠基人。大数定律发表于他死后8年,即1713年才出版的《猜度术》中,这本巨著使概率论真正成为数学的一个分支,其中的大数定律和稍后狄莫弗(A.de Moivre)和拉普拉斯(P.S.Laplace)导出的“中心极限定理”,是概率论中极其重要的两个极限定理。

有一个所谓墨菲定律:“凡事有可能会出错,就一定会出错!”就是说,如果暂时没出错,也只是时间问题。大数定律体现了类似的意思:当试验次数足够多时,事件发生的频率终究会趋于它的概率。次数n趋于无穷,概率小的事件也会发生。换言之,一件事情,只要有发生的概率,那么随着重复次数变多,就几乎一定会发生。

上面的说法也基本上是略知大数定律的赌徒们的说法,这种说法理论上没错。错在对“多次重复”的理解。多少次试验才算“足够多”,才到达大数定律能够实用的大样本区间呢?此问题的答案:理论上是无穷大,实际中难以定论。大多数情形是:还没到“足够多”,该赌徒便已经财力耗尽、赌注输光、两手空空了!

有人喜欢买彩票,并且在每次填写彩票时,要选择以往中奖号码中出现少的数字,还振振有词地说这样做的依据是大数定律,某个数字过去出现得少,以后就会多呀,为什么呢?“要满足大数定律啊!”,可见对大数定律误解之深。


2:雅各布·伯努利和大数定律

赌徒思维的误区,便是将大数定律应用于试验的小样本区间,将小样本中某事件的概率分布看成是总体分布,以为少数样本与大样本区间具有同样的期望值,把短期频率当成长期概率,或把无限的情况当成有限的情况来分析。实际上,这是在错误应用大数定律时的心理偏差,因此被心理学家卡尼曼和特维尔斯基戏称为“小数法则”。事实上,任何一段有限次的试验得到的频率对于足够多次的试验的频率几乎没有什么影响,大数定律说的是总频率趋近于概率值,如图2b所示,小样本区间试验的结果并不影响最后趋近的概率。

发现大数定律的雅各布·伯努利所属的伯努利家族【3,当年在欧洲赫赫有名,是世界颇负盛名的科学世家,出了好几个有名的科学家,驰骋影响学界上百年。雅各布和他的弟弟约翰•伯努利(Johann Bernoulli1667-1748),都是那个时代著名的数学家。此外,学物理的人都知道流体力学中有一个著名的伯努利定律,说的是有关不可压缩流体沿着流线的移动行为,是由雅各布的侄子丹尼尔•伯努利(Daniel Bernoulli17001782)提出的。

有意思的是,伯努利家族这几个科学家之间,相处得并不和谐。互相在科学成就上争名夺利、纠纷不断。尤为后人留下笑柄的是约翰•伯努利,他与比他大十几岁的哥哥雅各布之间进行激烈的兄弟之争。事实上,雅各布还是约翰走进数学大门的启蒙老师,约翰进入巴塞尔大学时,雅各布已经是数学教授,但两人互相嫉妒明争暗斗。不过,无论如何,伯努利兄弟的你争我斗实际上也推动了变分法和泛函分析的发展。之后没过几年,雅各布就去世了。约翰却似乎过不了没有竞争对手的日子,他继而又把对雅各布的嫉妒心转移到了自己的天才儿子丹尼尔•伯努利的身上,据说他为了与儿子争夺一个奖项把丹尼尔赶出了家门,后来还窃取丹尼尔的成果据为己有。伯努利家族更多的故事不在这儿讲,只付诸一笑。

圣彼得堡悖论

伯努利家族中另一位,丹尼尔的堂兄尼古拉·伯努利(Nikolaus I. Bernoulli1687年-1759年),也是一名热衷研究赌博的数学家,他提出了著名的“圣彼得堡问题”。为了理解这个悖论,首先从赌博游戏的期望值说起。

赌博的输赢与期望值有关,期望值是以概率为权重的平均值。赌博的方式不一样,“赢”的期望值不一样。比如以轮盘赌为例,按照一般赌场的规矩,赌注押在其中一个数字上,如果押中,顾客得到$35,否则损失$1的赌注。顾客赢钱为正,损失为负,我们计算“顾客赢”的期望值(美元):

E= -1*37/38+35*1/38=-0.5

总期望值是负数,对赌徒不利。但设想有个傻一点的赌场老板,将上面规则中的$35改成$38的话,算出的期望值就会成为正数,这种策略就对顾客有利了,赌徒们高兴了,将蜂拥而至。如果将$35改成$37呢?这时候算出来的期望值为0,意味着长远来说,赌徒和赌场打平了,双方不输不赢(不计开赌场的费用),称之为“公平交易”。

因此,期望值被作为所谓“理性赌徒”们决定“赌或不赌”的数学依据。

然而,根据这个数学依据作出的决策有时候完全不符合人们从经验和直觉所作的判断。这是怎么回事呢?尼古拉·伯努利便是以“圣彼得堡悖论”为例对此提出质疑【4


3:圣彼得堡问题

尼古拉设想了一种简单的游戏方案:顾客不需要每次下赌金,但得买一张价钱固定(m元)的门票参加,游戏规则如下:

顾客只是掷(公平)硬币,掷出正面就停止,掷出反面就继续掷,直到掷出正面为止,见图3a。如果游戏停止了,顾客就能得到奖金,奖金的数目与掷的次数有关。游戏持续得越久,奖金就越高。比如说,游戏停止时掷了n次,那么顾客可得奖金数为(2n)元。

叙述得更具体一点:如果第一次掷出正面,游戏停止,顾客只能得2元(21),若掷出反面,就继续掷。若第二次掷出正面,顾客得4元(22),若掷出反面,又继续掷……依次类推,顾客若一直得到反面直到第n次才掷出正面,奖金数便是(2n)元,奖金数随n增大而指数增加。

现在,计算这个游戏中,顾客“赢钱”的期望值,即每次期望赢得的钱乘以概率后相加。然后,再将m元的门票作为负数放进去,得到期望值是:


从以上计算可见,无论门票m是多少(只要是个有限数),得到的期望值都是无穷大!上面的结论显得有些诡异,因为“期望值无穷大”意味着无论收多高的门票费,赌徒都会乐意参加这个游戏!但是这与事实太不符合了。如果你作一个民意调查便会发现,大部分人可能不愿意花多于60元去玩这个游戏,因为风险太大,要能够抛到6次以上,才能赢回门票钱,但人们凭经验知道,接连抛6次硬币的结果是(TTTTTH)的情况是非常少见的。

这就出现了矛盾,因此,尼古拉认为这是一个悖论,人们在做决策的时候,并不仅仅考虑数学期望的大小,更多的是在考虑风险。数学期望值不能完全描述风险。

为什么叫“圣彼得堡悖论”呢?因为这个悖论被尼古拉提出却是被丹尼尔解决的,丹尼尔提出经济学中的效用理论来解释这个问题,论文发表在1738年圣彼得堡召开的一次学术会议上,所以得名为圣彼得堡悖论【5

另一个与赌博有关的著名问题是“赌徒输光问题”,留待以后介绍。赌博虽然是一种恶习,由它却引发了不少有趣的数学问题,促进了概率论的发展,由于圣彼得堡悖论的解决而建立了“效用理论”,推动了经济学的发展。概率论中除了大数定律之外,还有一个极其重要的“中心极限定理”,有关中心极限定理及其应用,是我们下一篇的内容。

参考资料:

1WikipediaMen whobroke the bank at Monte Carlo

https://en.wikipedia.org/wiki/Men_who_broke_the_bank_at_Monte_Carlo

2】维基百科:大数定律

https://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E5%AE%9A%E5%BE%8B

3The Bernoulli Family, by H. Bernhard,Doubleday, Page & Company, (1938)

4"The St. PetersburgParadox", The Stanford Encyclopedia of Philosophy

https://plato.stanford.edu/archives/fall2004/entries/paradox-stpetersburg/

5Bernoulli, Daniel: 1738,"Exposition of a New Theory on the Measurement of Risk", Econometrica22 (1954), 23-36.