《考不好,没关系?》抢答环节概率模型的建立和分析

  《考不好,没关系?》抢答环节概率模型的建立和分析

  2019年1月20日星期日

   (本文或许需要像李永乐老师、妈咪叔这样的大神一证真伪。)

  先上广告:

  “关注西瓜视频每周六晚八点原创观察答题秀《考不好 没关系?》,看看爸爸变成小学生到底能考多少分!”

《考不好,没关系?》抢答环节概率模型的建立和分析

《考不好 没关系?》

  哈哈,再说正文。

  《考不好 没关系?》这个综艺节目相信已经很火爆了。昨晚第二期如约而至,由于忙于事务,我和儿子是在10点后一起看的。儿子这次表现的镇定了一些,但是当看到没有替爸爸抢到答题机会而哭泣的孩子们时,难免也揉起了自己的眼睛。这次我没有给儿子讲道理安慰,而是让他自己调适。我反倒在思考一个“数学问题”:这个抢答环节的概率模型是什么样的?

  《考不好 没关系?》的淘汰规则(或胜出规则)是这样的:

  第一个环节:21选13,通过笔试摸底,淘汰8位爸爸。

  第二个环节:13选5,通过孩子竞抢机会,爸爸作答,答对胜出,答错淘汰,胜出达到5位即止,讲究亲子协作。凡上一轮抢到答题机会的,无论爸爸胜出或淘汰,均不再参与下一轮抢答。

  第三个环节:5选3及进一步的3选2、2选1。通过依次答题,答对胜出,答错淘汰,决出3个幸运家庭,并进而产生季军、亚军、冠军。

  现在,我感兴趣或产生了数学问题的是第二个环节——抢答环节——的概率模型。经过一大早的纸笔演算和思考,打算写下本文。

  我写本文是具备一定基础的:

  1.我自学过《概率与统计》,考试成绩还不错。

  2.我喜欢思考这类问题,喜欢享受探究这类问题的驾轻就熟和成就感,似乎在找寻一种足以自夸的资本。

  3.我不想也不能给出关于“古典概型”、“几何概型”、“贝努里概型”、“随机事件”、“条件概率”、“事件的独立性”等一系列重要而基础的数学概念的定义,虽然这些概念与准确理解、评判本文内容密切相关。一则大家懒得读,再则我已将大多数准确的内容还给了“教材”,也算是一个凡夫俗子,岂敢摆出一副专家、教授、学者的嘴脸。

  4.当大家看了上面3条,在准备嗤之以鼻、义愤填膺、拔出刀来时,请务必念及我至少提出了一个正确的问题:抢答环节“13选5”的概率模型是什么?

  在开始正式阐释之前,先罗列一串基于“根本问题”——抢答环节“13选5”的概率模型是什么——的子问题。

  1.“抢答事件”是随机事件吗?多次重复进行的“抢答事件”是独立随机事件吗?也许您已经独立思考并得出了初步的结果:第一轮抢答概率为:1/13(十三分之一),第二轮抢答概率为:1/12,第三轮抢答概率为:1/11,第四轮抢答概率为:1/10……依次类推。但我要告诉您的是:这个结论是片面的。

  2.也许您觉得“抢答人数减少”、“别人遭淘汰”,有助于提高您的“抢中概率”,但是,影响每个人“抢中概率”高低的因素到底是什么呢?每个人的“抢中概率”是公平的吗?让我先迫不及待地告诉您答案:影响“抢中概率”的唯一因素是“抢答次数”,每个人的“单次抢中概率”是一样的。

  3.您有没有想过:抢答几次就可以完成节目“13选5”的任务要求?这个“抢答次数”具备随机性的特点吗?有没有可能5次抢答均胜出,导致节目提前结束?亦有没有可能抢答持续了13次,仍然没有选拔够5位胜出者?这是可能的,因为“抢答次数”具备随机性的特点。

  4.抢答次数最少是5次,这是节目“13选5”的硬性要求,但是到底几次会结束,事先不可预知。换个方式提问:最有可能几次结束?您有没有想过:影响“抢答次数”的因素是“选拔人数要求”和“题目难易程度”。题目简单了,5次抢答5次胜出将是大概率事件;题目复杂了,13次抢答不够5次胜出也可能是大概率事件。“题目难易程度”的考量不能联系答题者的主观水平和特长,如果是这样的话,该问题将不再具备“数学可研究性”。即使单纯考虑“题目”本身的难易程度,也难以做到完全“客观”、“公平”,而且题与题之间的难易程度不见得就是一致的。为了保证问题的“数学可研究性”,我们假定对题目难易程度的衡量是“客观准确”的。为了更进一步方便研究,或者先从最简单的情况出发,我们假定题目的难易程度是“固定不变”的。当然,我们也可以用数据描述“变化”的难易程度,但不利于分析获得有用的结论。

  下面开始具体的“建模和分析”过程。

  重点一:单次抢中概率是一致的。

  13位孩子竞抢一次答题机会,是一个“随机事件”,符合结果不可预知、每位孩子等可能性的特点。由于得到抢答机会的孩子,不论其爸爸答题胜出还是淘汰,均不再参加下一轮抢答,因此,该过程相当于“从13个球中随机抓取1个球的不放回随机试验”。对此,我们有重要的结论:

  “一般地,取后放回试验的每次结果之间是相互独立的,而取后不放回试验的各结果不具有独立性。为了使试验满足独立性,对于取后不放回试验,只要总数很大,而取出作试验的数又相应小,显然不放回,也视为独立。”

  强调“独立性”的原因在于:第一次竞抢影响第二次竞抢概率,第一、二次竞抢影响第三次竞抢概率……具体计算如下:

  第一次抢中概率:1/13

  第二次抢中概率:12/13×1/12=1/13

  为何如此计算?如果甲是第二次抢中的,则第一次竞抢中发生了“甲以外别人抢中事件”,这个事件的概率是:P(A)=12/13;在此基础上,甲抢中了第二次的条件概率是:P(B|A)=1/12;事件A与B共同发生的概率是:P(AB)=P(A)P(B|A)=12/13×1/12=1/13。所谓“事件A与B共同发生”是指“第一轮别人抢中”与“第二轮甲抢中”两个事件共同发生。以下道理类同,不在赘述。

  第三次抢中概率:12/13×11/12×1/11=1/13

  第四次抢中概率:12/13×11/12×10/11×1/10=1/13

  第五次抢中概率:12/13×11/12×10/11×9/10×1/9=1/13

  ……

  第十三次抢中概率:12/13×11/12×10/11×9/10×8/9×7/8×6/7×5/6×4/5×3/4×2/3×1/2×1/1=1/13

  可见,单次抢中概率是一致的:1/13≈0.076923077,其中,1/13是分数十三分之一的横写形式,其余同。

  (重要程度★★★★★)

  重点二:总抢中概率的高低取决于抢答次数。

  设:

  n:胜出次数。根据规则,n=5。

  m:淘汰次数。m最小为0,说明5次抢答,5次连续胜出;m最大为13,因为初始竞抢总人数是13人,顶多淘汰13人。但是,当m取值为9、10、11、12、13时,节目是失败的,因为选拔不够5个人,也说明“题目难度太大”。当m取值为8时,说明一共抢答了13次,每个人都抢到了答题机会。

  c:抢答次数。显然:c=n+m。

  可得:

《考不好,没关系?》抢答环节概率模型的建立和分析

  (重要程度★★★★★)

  例:

  5次抢中概率=5/13

  6次抢中概率=6/13

  7次抢中概率=7/13

  8次抢中概率=8/13

  ……

  13次抢中概率=13/13=1

  这是一个显然的结论,如果抢答进行了13次,则每个孩子都有抢中机会。

  可见,总抢中概率随着抢答次数的增加逐步提高,直到等于1。这说明事件“别人遭淘汰”发生,是有助于提高我们的总抢中概率的。因为胜出次数n是固定的5次,抢答次数的多寡便只取决于淘汰次数m的值。

  然而,不能高兴得太早的是:c次抢答出现的概率是不一样的。举例说:13次抢答出现时,每个人的总抢中概率等于1(也就是必然事件),貌似十分美满,但是13次抢答出现的概率,在题目难度较小的情况下,远远要比5次、6次抢答出现的概率低。因此,问题的另一方面是:事件“c次抢答”出现的概率。

  重点三:c次抢答出现概率取决于题目难易程度。

  再设:

  一轮抢答中,有胜出者用“1”表示,有淘汰者用“0”表示。

  p:胜出概率。取值0~1;值越接近0,说明胜出可能性越低,代表题目难度越大;值越接近1,说明胜出可能性越高,代表题目难度越小。

  q:淘汰概率。显然:q=1-p。

  为了本文叙述的简略,我们取:

  p=0.2,表示题目困难;

  p=0.5,表示题目适中;

  p=0.8,表示题目简单。

  当然,如果我能在头条发布我的“Excel电子表格”计算模型的话,您大可以将p取0~1之间的任何值。需要提醒的是,为了简化计算,我们依然假定题目与题目之间的难易程度是固定不变的,也即第1道题目、第2道题目……的p值都是统一的。

  ①5次抢答结束,表示为:

  (1,1,1,1),1

  只有一种情况,为:C(4,4)=1(4选4的组合数)。为何这样算?因为,最后一次肯定是以“第5个胜出者”作结束的,因此,先确定最后一个位置是“1”。

  ②6次抢答结束,表示为:

  (1,1,1,1,0),1

  有:C(4,5)=5种情况(5选4的组合数)。

  具体罗列如下:

  (1,1,1,1,0),1

  (1,1,1,0,1),1

  (1,1,0,1,1),1

  (1,0,1,1,1),1

  (0,1,1,1,1),1

  下面不再一一罗列,情况众多。

  ③7次抢答结束,表示为:

  (1,1,1,1,0,0),1

  有:C(4,6)=15种情况(6选4的组合数)。

  ④8次抢答结束,表示为:

  (1,1,1,1,0,0,0),1

  有:C(4,7)=35种情况(7选4的组合数)。

  ⑤9次抢答结束,表示为:

  (1,1,1,1,0,0,0,0),1

  有:C(4,8)=70种情况(8选4的组合数)。

  ……

  可见,c次抢答结束的情况数是:

《考不好,没关系?》抢答环节概率模型的建立和分析

  (n+m-1选4的组合数)。

  注意:

《考不好,没关系?》抢答环节概率模型的建立和分析

  在Excel电子表格中,组合数的计算命令是:combin,且输入为:=combin(8,4)。很明显,上下标数字在横写时前后位置恰好相反。

《考不好,没关系?》抢答环节概率模型的建立和分析

  (重要程度★★★★★)

  截取Excel电子表格计算模型图如下:

  共同部分:

《考不好,没关系?》抢答环节概率模型的建立和分析

  题目困难:

《考不好,没关系?》抢答环节概率模型的建立和分析

  可见,胜出概率p=0.2时,题目难度大,5次~13次抢答出现的总概率也只有10%左右。也就是说,很难成功完成“选拔5名胜出者”的任务,因为此时的数学期望只有:13×0.2=2.6(人),极少数人可以胜出。

  题目适中:

《考不好,没关系?》抢答环节概率模型的建立和分析

  胜出概率p=0.5时,题目难度适中,8次抢答和9次抢答出现的概率最高,达到了约13.7%。此时的数学期望是:13×0.5=6.5(人),一半的人可以胜出。

  题目简单:

《考不好,没关系?》抢答环节概率模型的建立和分析

  胜出概率p=0.8时,题目难度小,5次抢答和6次抢答出现的概率最高,达到了约32.8%。此时的数学期望是:13×0.8=10.4(人),较多的人可以胜出。

  最后,以胜出概率p=0.6,也即答题者可以取得“60分及格”为难度,举例说明有些令人匪夷所思的“综合概率”。上面“困难、适中、简单”三种示例中也包含“综合概率”。

《考不好,没关系?》抢答环节概率模型的建立和分析

综合概率

  可见,此时7次抢答、8次抢答出现概率最高。我没有细心计数《考不好 没关系?》第一期和第二期分别抢答了几次结束,此刻也不想再耽误写作时间,就请求细心的网友帮忙了。我猜测节目中题目难度为0.5、0.6的可能性居多(这个数字与通常的难度系数相反,因为我以胜出概率表达难度系数,数字越大,难度越低)。

  

综合概率=c次抢答出现概率×c次抢中概率

  (重要程度★★★★★)

  c次抢中概率是随着抢答次数递增的,直到1。但由于c次抢答出现的概率有高有低,且只有“c次抢答事件”出现,“c次抢中概率”才变为现实,因此,后者以前者为条件。根据条件概率的计算公式得到上面的综合概率计算公式,上文已有提及,不再赘述。

  “综合概率”是我自己给出的命名,是表达的需要。

  本来递增的“c次抢中概率”,在考察“c次抢答事件”出现概率,并综合计算后,由:

  5/13=0.384615385

  6/13=0.461538462

  7/13=0.538461538

  8/13=0.615384615

  9/13=0.692307692

  10/13=0.769230769

  11/13=0.846153846

  12/13=0.923076923

  13/13=1

  变为:

  5次抢答:0.029907692

  6次抢答:0.071778462

  7次抢答:0.100489846

  8次抢答:0.107189169

  9次抢答:0.096470252

  10次抢答:0.077176202

  11次抢答:0.056595881

  12次抢答:0.038808604

  13次抢答:0.025225593

  这样“两头低,中间高”的状态。

  结论是:8次抢答事件出现时的综合概率最高,是0.107189169。

  用最简单的事实描述就是:虽然抢答13次时每个孩子都有抢中机会,但是“抢答13次”在通常题目难度下,是一个小概率事件。

  好了,本文就此打住,如果您能细心阅读并同样纸笔演算至此,甚至根据几张Excel截图尝试建立自己的“电子表格计算模型”,您无疑是真正的具备独立思考的人。

  再会。


分享到:


相關文章: