被随机性所欺骗

摘要
任何事物、科学理论、猜想、假设都无一例外地需要经过时间大师火眼金睛的识别和检验。在短时间内,人们所观察到的就是随机性、波动性。只有把时间拉长,才能把从随机性和波动性的考验中顽强存活的真实性质特征提炼出来。

  One doctor said to her anxious nervous patient: our medical operation has a mortality rate of 1%, so far, we have operated upon 99 patients with great successes, you are the 100th, so you are 100% deemed to be dying on the table. The patient turned pale, devastated and dead,pathetic!

  01

  谁是真正的赢家?

  街头常见的一种“摸球游戏”,游戏的规则是:袋中有16个大小、形状相同的玻璃球,其中8个红色、8个白色。游戏者从中一次摸出8个球,8个球中,当两种颜色出现以下比数时,摸球者可得到相应的奖励或惩罚:

  

  从表面上看,这个摸球游戏非常有吸引力,5种可能出现的结果中有4种都可以得到奖金,且奖金高达10元,只有一种情况受罚,罚金只有3元,请问谁是此类游戏真正的赢家?

  大多数人第一眼看到这个游戏,一定觉得信心满满,有很大的胜算把握。因为,从纸面上看,胜算的概率是80%,而只有20%的失败的机会,这不是天上掉下来的馅饼吗?

  之所以几乎每个人都有这样的想法,是因为人类的一个共同的致命弱点:被随机性所欺骗,低估随机性的威力,高估自己的判断力(过度自信)。

  上面的这个看似稳操胜券的摸球游戏,其实是深谙概率统计的庄家精心伪装设下的陷阱。笑到最后的还是布局者。

  为了让读者们看清真相,我就通过简单的排列组合计算来揭示迷雾后面的真相。

  对于每一种场景计算一下,有多少种可能:

  情形A: 2 * C(8,8) * C(8,8) = 2 * 1 * 1 = 2

  情形B: 2 * C(8,7) * C(8,1) = 2 * 8 * 8 = 128

  情形C: 2 * C(8,6) * C(8,2) = 2 * 28 * 28 = 1568

  情形D: 2 * C(8,5) * C(8,3) = 2 * 56 * 56 = 6272

  情形E: 2 * C(8,4) * C(8,4) = 2 * 70* 70 = 9800

  到这里,相信大家都能看出端倪来了。尽管,从表面上看,摸球者的盘面大好,但是,那只是庄家的一个障眼法,关键就在于,唯一摸球者失利的情形E所包含的可能性的数量要比其他所有可能性的总和加起来还要多!

  美国著名数学家和数学教育家G·珀利亚曾经说过:“你能一眼看透出题者的意图吗?”

  计算这个游戏的预期值:

  

  这个摸球的游戏的预期值是负的,和普通人买彩票以及去赌场下注是一样的,都是不折不扣的loser的游戏,每个人都应该远离。但是,人们还是被随机性所欺骗,认为自己是有胜算把握的,毫不犹豫地买入这些五花八门的随机性陷阱,还浑然不知。

  02

  新摩尔定律

  在当今这个数字化智能化的时代,信息就是最重要的生产要素,没有信息,几乎是寸步难行。无论是企业的发展还是个人社会交往,都离不开信息的支持。

  在上个世纪信息化革命的发源地,美国加州的硅谷,著名的Intel的联合创始人戈登·摩尔所提出享誉世界的摩尔定律早已家喻户晓:计算机服务器的性能每过两年就翻一倍。而对比于计算机终端服务器芯片的计算速度,今天的新摩尔定律就是每两年全社会的信息总量就翻一倍(可能更快)。

  面对排山倒海般的信息,很多人都误以为,信息的数量越多,对人的制定决策帮助越大。这种错误的认知忽略了一个重要的事实:噪音noises的数量同样地随着信息的总量成几何倍数增长。人们面对数量庞大的信息,从概率的角度上来分析,更有可能被虚假信息噪音所迷惑。这里的一个主要原因就是,信息的接收者,人,不是一台冷静客观理性的机器,而是被情感、认知偏见、心理活动所左右控制的非理性动物。

  在历史的长河中,有举不胜举的诸多案例说明,人的辨别是非,认清随机性本质的能力是很低下的,这里不仅指一般的“乌合之众”,也包括了深谙概率统计,了解随机性的科学家和学者们。当这些科学家和学者离开他们所熟悉的象牙塔,步入光怪陆离的真实社会,他们的冷静客观的科学思维就立刻被人本性的感情和情绪所掌控,犯和一般人无异的被随机性所欺骗的错误。

  03

  Wittgenstein’s ruler维特根斯坦的尺子

  生于奥地利的Ludwig Wittgenstein 路德维希·维特根斯坦被誉为是20世纪最伟大的哲学家,他的一生都献给了科学哲学和数学逻辑的深刻思考。他挑战当时盛行的认为主导社会一切发展的都是遵从自然科学规律的科学主义。他的想法后来被另外一位科学哲学家,也是奥地利人,Karl Popper发展出著名的证伪主义思想。

  路德维希·维特根斯坦一段著名的关于尺子度量桌子长度的论述,深刻地体现了随机性的普遍存在,世界没有绝对统一不变的标准,也即没有所谓的绝对真理,只有相对真理!

  Unless you have confidence in the ruler’s reliability, if you use a ruler to measure a table, you may also be using the table to measure the ruler. 这就是现代被Karl Popper的学生,著名宏观投资(投机)交易大师索罗斯所提出并倡导的“反身性”。

  把路德维希·维特根斯坦的话换成概率和统计的语言就是,在社会人生中最重要的信息都是来自于条件概率而不是绝对概率。

  下面,我通过三个生动有趣的例子来为大家解释,为什么条件概率要比绝对概率重要?

  第一个例子,几乎是一个众人皆知的案例,一种疾病,让约2/1000的人感染(这是大数据的绝对概率)。另外,一种精密的监测方式,它的假阳性False Positive的可能性只有5%,假设没有假阴性(把有病的人判别成正常的)。

  如果,一个人经过检查,报告显示是阳性,那么请问他或她真实患病的概率有多大?

  很多医生会脱口而出,是95%,这也证明了我在前面所提到的,概率统计的思维方式在几乎每个行业中都是匮乏的,从而导致很多专业人士犯认知的基本性错误。

  假设有10000人来检查,根据绝对概率,10000人中会有20人染病,9980人没有感染,但是因为检测的假阳性概率是5%,那么,也就是说,在9980人中,有9980 * 5% = 499人被宣布是阳性的检测结果,那么,在一共20 + 499 = 519的检测呈阳性的病例中,真实患病的人数比例只是20/519 = 3.85%, 并不是95% !,我们不能想象出当医生把这两个数字告诉病人的时候,病人的反映会是怎样的天壤之别,只是生与死的分水岭。

  第二个例子来自于上个世纪的美国惊天大案,那个时候我刚到美国读书,美国前著名橄榄球明星辛普森杀妻案。警察在案发现场收集检测到了辛普森的血迹DNA样本,检方众志成城、势在必得。但是辛普森花重金请来了几位经验丰富巧舌如簧的著名大律师,找到了检方和警察收集证据的致命破绽,一举扭转了被动的劣势大获全胜。

  在法庭上控辩双方律师的激烈攻守中,统计和概率不断被(并不能深刻理解概率统计意义的)律师拿出来作为攻击对方,证明自己论证合理性的武器。

  一位毕业于哈佛法学院的大律师为了证明辛普森的无罪而提出了以下的论述:在所有曾经有过家暴历史的成年男人中,只有10%的人后来杀了自己的妻子。从而,让陪审团相信,尽管辛普森曾经有确凿无疑的家暴历史,但是,他杀死前妻Nicole的可能性还是很低,不足以怀疑。

  这个荒谬的陈述是一个无条件绝对概率,而在法庭之上,控辩双方唇枪舌剑争论不休的是已知辛普森的前妻Nicole被杀身亡,在这个已知条件下,问辛普森是凶手的概率有多大?

  那位毕业于常青藤名校、口若悬河的律师把这个概率问题搞颠倒了,他应该问的是,在所有杀妻的罪犯中,找出来有多少过去有家暴历史的,计算一下比例。可以保证,正确的计算比例要比那位律师先生所引用的10%高出很多很多,那么他用以打动陪审团的慷慨陈词就完全没有任何意义了。

  另一个在法律上应用概率随机性来断案但是却成为反面教材是美国1968年加州的Collins抢劫案。1968年6月18日中午11:30,一位叫Juanita Brooks的老人拄着拐杖,步履蹒跚地从超市买东西回来,经过洛杉矶San Pedro地区的一条幽静的小巷,突然从背后被人推倒,钱包不翼而飞,她只看到一个年轻女人从现场跑走,体重大约有145磅,穿着一件黑色的衣服,头发的颜色在深棕色和浅棕色之间,梳着一个马尾辫。

  一位叫John Bass的小巷的住户,当时正在门前给草坪浇水,他看见一个女人从小巷里跑出来,跳上了一辆停在路边的黄色汽车,飞驰而去,因为小巷很窄,当汽车驶过Bass身边的时候,他看到车里是一位留着络腮胡须和八字胡的黑人在驾驶,其他的目击证人反映看到的车是黄色的以及车的上面部分是蛋壳白色。

  不久,根据这些目击者所提供的信息,警察找到了Collins夫妇,他们的林肯汽车以及夫妇两人的体征都符合案发现场罪犯的描述。

  但是,无论是受害人Juanita Brooks还是现场目击证人Bass都不能指认Collins就是抢劫的罪犯。眼看这场诉讼就要以失败而告终。这时候,检方请出了他们的明星“证人”,这位证人是一所大学的数学讲师。他提出了使用独立事件的联合概率来证明Collins就是抢劫的罪犯。

  请大家看一下下面这张列表:

  罪犯的特征性质

  随机性概率

  部分车身的颜色是黄色

  10%

  有八字胡的男士

  25%

  有络腮胡须的黑人

  10%

  梳着马尾辫的女人

  10%

  棕色头发的女人

  33.3%

  不同种族的夫妇同时在一辆车里

  0.1%

  这位数学讲师错误地提出表中所列出的特征表现的随机性概率都是相互独立的,因此,满足所有这些要求的夫妇的概率就是1/12000,000!不仅如此,这位讲师又大放厥词地说,Collins夫妇无罪的概率是1/12000,000! 这是什么思维逻辑?!

  首先要指出的是,表中所列的各项特征之间的概率不是相互独立的。比如,有络腮胡须的人大部分都有着八字胡,两个事件之间有很高的相关性,经过相关性调整后满足两者的共同的随机性概率要比简单地把各自边际概率相乘要大得多。这更多是技术上的错误。但是,最严重的就是这位数学讲师对于Collins夫妇无罪概率的见解,是认知的根本性错误。

  数学讲师所犯的错误和辛普森的辩护律师所犯的认知错误是一模一样的。在案件的分析中,重要的不是无条件的宏观概率统计,而是,对应于所发生事件的限制氛围下,重新考虑的随机性概率问题,两者是截然不同的。

  正确的随机性概率应该是对于所有满足以上要求的加州夫妇的人中,有多少可能性Collins夫妇就是真正的罪犯?

  经过调整后的联合概率是1/1000,000;加州案发地区的人口有几百万,也就是有2-3对夫妇满足以上所有的描述,那么Collins夫妇是罪犯的概率只是33%到50%,无罪的概率超过了一半!正是基于这些考量,美国加州最高法院推翻了Collins夫妇有罪的判决。

  04

  睁大你的眼睛

  你看到的都不是真的

  在除夕的晚上,一家人围坐在电视机前观看万众瞩目的春节联欢晚会,其中最吸引人当属魔术节目。特别是来自祖国宝岛台湾的魔术师刘谦的那句风靡中国的台词:“见证奇迹的时刻到了”,让我至今难忘。

  每个人都知道,魔术就是所谓的“障眼法”,核心是让人的感官感知带领人的认知和思考相信一件事情是对的,但在魔术师秘而不宣的黑箱操作中,别有洞天,和人们看到想到的完全不一样。无论人们怎样地睁大自己的眼睛,目不转睛地盯着魔术师的一举一动,但每每还是被魔术师的戏法所欺骗,魔术的关键就是找出人思维的盲区,加以利用。

  在生活中,我们经常听到“眼见为实”的说法,但即使是亲眼看到也不一定是真实的,因为人会被深藏在表面现象背后的随机性、波动性蒙蔽了双眼。随机性更像是一位技艺高超的魔术大师,让人们在他的精湛表演中如痴如醉,深陷其中,不能自拔。

  几年前,加拿大的一个彩票中心发现它的账户中还有很多没有被领取的中奖奖金,于是就用这些钱买了500辆车,从在彩票中心注册的240万的彩票会员中用计算机程序随机地抽取500名中奖者,并把这500名幸运儿的名单公布出来,但让他们大吃一惊和非常尴尬的是,有一个中奖者声称他中了两辆汽车!经过彩票中心的严格审查,确认是这一切是正确的。

  但是彩票中心的官员们和社会大众还是大惑不解,觉得这个不可思议的事情怎么可能会在众目睽睽之下发生,就像当魔术师完成他的杰作,在舞台上让所有的观众瞠目结舌之际,享受那一刻的经久不息的掌声,但这里的魔术师就是那个飘忽不定的随机性。

  一个简单的数学计算,240万候选的彩票会员中,先随机地选出一个人,概率是100%,再接着从240万人中选出另外一个人,随机性概率是 1–1/2400000;选下面一个和这两个人都不同的人的概率:1–2/2400000;以此类推,到第500人时,概率为 1–499/2400000。把这些单项的概率乘在一起得到选出的500人都不一样的随机可能性为95%,也就是说,有5%的概率可能发生一个人连中两元的匪夷所思的事件。那需要多少人会使得,连中两元的随机可能性超过50%呢,经过类似的计算,需要1824个人。

  现在是6月,美国NBA东西部的最后四强赛正在如火如荼地净行中,按照惯例,季后赛通常都是打7场4胜制。如果有两只NBA球队(我个人支持的是所居住的新泽西州的网队,阿里前合伙人蔡崇信是老板,和我学习工作过的纽约市的尼克斯队),不出意外,一定是一只队强一些,另一只相对较弱。假设,强队有55%的概率赢下一场比赛,而弱队只有45%的概率取胜。那么7胜4的较量中,弱队有多大的概率取胜?

  弱旅取胜的可能性是4场全胜、5场四胜、6场和7场比赛四胜。

  比赛的总场数

  弱旅胜4场的可能性

  随机性概率

  4

  1

  0.45^4 = 4%

  5

  5

  (5-1) * (0.45)^4 * (0.55)^1 = 9%

  6

  15

  (15-5) * (0.45)^4 * (0.55)^2 = 12%

  7

  35

  (35-15) * (0.45)^4 * (0.55)^3 = 14%

  通过上面的计算可以看出,弱队还有39%的可能性会取得冠军,机会还是很可观的。

  如果,假设它们两队之间的实力差距增大,强队有2/3概率获胜,而弱队则只有1/3的机会取胜,那么按照上面的方法计算,就得出弱队还有16%的概率胜出,摘得桂冠。

  如果套用概率分布中置信区间的概念,假设置信区间定为5%,也就是弱队胜算的随机可能性<5%,那么反过来可以推算出,要进行23场比赛!

  企业的发展中,经常会遇到这样的场景,即将推出一个产品到市场上,产品研发过程中很重要的一步,就是在团队内部展开对于产品的一些“内部民调”。

  假设团队有6个人,假设产品推出到市场后的大众接受率为50%,那么内部民调的结果和实际产品的市场数据有多大的差别呢?

  利用中国古典数学中的杨辉三角形,西方叫Pascal三角形,不难得出以下的结论:

  团队对产品投满意票的人数

  可能性

  0

  1

  1

  6

  2

  15

  3

  20

  4

  15

  5

  6

  6

  1

  如果只进行一次内部民调的话,那么,准确反映市场情况的可能性是20,而其他错误的可能性总共是44,也就是说,单一的民调测试的准确率还不到1/3。

  对于这一类的随机抽样测试问题,著名的伯努利大数定律回答了如何降低噪音和随机性,让抽样的统计结果,最大限度(在置信区间之内)达到预期的要求:需要提供大量的样本。

  在股票市场上,每个季度,上市公司都要向市场公布上一个季度的公司运营报告,华尔街的金融分析师们凭借着这些最新的季度报表,调整自己对于这些公司的预测和评估,做出买、卖、持有等投资推荐。这些季度报表的重要性可见一斑。

  但是,非常不幸地,季度报表同样面临着短期的随机性和波动性的问题。

  假设一家公司在市场上激烈的竞争中,和对手的比拼有60%的胜率,那么在未来的5年中,是否,投资者就会大概率地看到公司在3年中获胜呢?和上面的分析很类似的,

  未来5年中盈利的次数

  可能性

  0

  1

  1

  5

  2

  10

  3

  10

  4

  5

  5

  1

  正确和错误的可能性之比是10:22, 超过2/3的可能观察到的数据都是错误的。

  把这个数据应用到标普500的未来五年的表现,有超过333家公司所呈现的数据都是错误的。也就是说大部分的华尔街的金融分析师会被随机性所欺骗,用这些和事实不符的数据进行分析和研究所得出的报告当然不可能反映出公司的真实水平状况。

  时间是检验真理的唯一标准,任何事物、科学理论、猜想、假设都无一例外地需要经过时间大师火眼金睛的识别和检验。黑天鹅思想的倡导者Nassim Nicholas Taleb 就曾经一针见血地指出,在短时间内,人们所观察到的就是随机性、波动性。只有把时间拉长,才能把从随机性和波动性的考验中顽强存活的真实性质特征提炼出来。

关键词阅读:随机性

责任编辑:赵路 RF13155
精彩推荐
加载更多
全部评论
金融界App
金融界微博
金融界公众号