跳转到内容

生日問題

本页使用了标题或全文手工转换
维基百科,自由的百科全书

生日问题(Birthday problem)是一个机率论中的问题,其叙述为:“需要多少人聚在一起,才能让其中至少两人在同一天生日的机率超过一半?”

答案是只需要23人。这个问题有时被称为“生日悖论”(Birthday paradox),但这并非真正的悖论,只是因为其结论违反了一般人的直觉。大多数人会认为,在23人中两人同生日的机率应该远小于50%。该问题衍生出的数学理论被广泛用于设计一种名为“生日攻击”的密码破解方法。

解释

[编辑]

生日问题可以理解成盲射打靶问题。首先计算:23人皆不同生日的概率是多少?可以想象一间空房间,23人依次进入。每个人进入时,其生日与房间内其他人皆不相同的概率依次为1等。最先进入房间的人,其生日皆不同的概率很高,前五人的概率乘积为 97.3%;而随着房间内人数增加,最后几人进入时找不到同生日者的概率下降至

这种概率可以看作对靶的盲射:靶面上有365个格子,其中约有17个黑格,其余为白格。假设每枪必中靶且落点符合几何概型,连射12枪左右且任何一发都没有击中黑格的概率十分微小。

理解生日问题的关键在于,考虑上述“依次入房”模型中最后几个入房的人“全都没碰到同生日者”的概率。

简言之,大多数人之所以认为23人中两人同生日的概率远远小于50%,是因为将问题误解为“其他22人与*特定某个人*同生日的概率”,而非问题的真谛——“23人中*任意两人之间*存在生日相同”。如果考虑到23人之间存在的两两配对组合数量多达253对,直觉上就能意识到发生生日碰撞的概率其实相当大。

概率估计

[编辑]

假设有个人在房内,计算两人同生日的机率。在不考虑特殊因素如闰年双胞胎的前提下,假设一年365日的出生概率平均分布(尽管现实中的出生机率并非完全平均)。

首先找出,表示个人中每人生日都互不相同的概率。假如,根据鸽巢原理其概率为0;假设,则概率为:

该图片显示特定人数对应的2个人生日一样的概率

因为第二人不能跟第一人同生日(概率是),第三人不能跟前两人同生日(概率是),依此类推。用阶乘可写成如下形式:

表示个人中至少两人同生日的概率:

时按上式计算;当时概率为1

时概率约等于0.507。其他人数对应的概率用上述算法可得出:

10 12%
20 41%
30 70%
50 97%
100 99.99996%
200 99.9999999999999999999999999998%
300
350
100%
比较 p(n) = 任意两人同生日的概率;q(n) = 和某人同生日的概率

注意所有人都是随机选出:作为对比,记表示房间中有人,当中与特定某人(比如你)同生日的概率:

时概率只有约0.059(约高于十七分之一)。如果房间内有人,要使其中存在某人跟你同生日的概率超过50%至少要达到253。这与任意两人同生日仅需23人的结果形成了巨大的反差,也是引发“悖论”错觉的根源。

数学论证(非数字方法)

[编辑]

保罗·哈莫斯在自传中认为,生日问题只用计算数值来解释是一种悲哀,因此给出了一种概念数学方法的解释推导。乘积:

等于。因此关注第一个使乘积小于。由平均数不等式可知:

再利用已知的1所有整数和等于,代入不等式,可得到:

如果仅当:

最后一条表达式的值会小于0.5。其中表示自然对数。其阈值略小于506,如果取就得到

在推导中,哈莫斯写道:

> 这推论是基于数学系学生必须掌握的重要工具。生日问题曾是用来演示纯思维如何胜过机械计算的绝妙例子:这些不等式一两分钟就写得出,但乘法运算就要更多时间且更易出错,无论使用的工具是铅笔还是老式电脑。计算器不能提供的是理解力、数学才能、或产生更高级、普适化理论的坚实基础。[1]

然而哈莫斯的推论只显示至少超过23人就能保证平等机会下的生日匹配概率过半。因为不知道给出的不等式界限有多严格,无法直接藉此计算过程确定时是否能让机率过半;相反,如今任何人都可以使用 Microsoft Excel 等个人电脑程序在几分钟内把整幅机率分布图画出来,对问题答案一目了然。

泛化和逼近

[编辑]
用逼近公式(红线)与真实概率(黑线)的比较

生日问题可以推广:假设有人,每人都随机从个特定的数中选一个数出来(可能是365或其他正整数)。

表示有两人选择了同样数字的概率,下面的逼近公式可以回答这个问题:

泛化

[编辑]

下面泛化生日问题:给定从符合连续/离散均匀分布的区间中随机取出个整数,至少2个数字相同的概率有多大?

类似的结果可以根据上面的推导得出:

若只探讨特定数值(如自己的生日)被选中的概率,则为:

反算问题

[编辑]

反算问题可以表述为:对于确定的概率

  • 找出最大的,满足所有的概率都小于给出的;或
  • 找出最小的,满足所有的概率都大于指定的

这个问题有如下逼近公式:

举例

[编辑]
指定概率 逼近公式推导 估计
推广界限
0.01 3.20864 3 0.00820 4 0.01636
0.05 6.61916 6 0.04046 7 0.05624
0.1 9.27002 9 0.09462 10 0.11695
0.2 13.26302 13 0.19441 14 0.22310
0.3 16.63607 16 0.28360 17 0.31501
0.5 22.99439 22 0.47570 23 0.50730
0.7 30.14625 30 0.70632 31 0.73045 (正确值:,
0.8 34.77666 34 0.79532 35 0.81438
0.9 41.49862 41 0.90315 42 0.91403 (正确值:,
0.95 47.26414 47 0.95477 48 0.96060 (正确值:,
0.99 58.48081 58 0.99166 59 0.99299 (正确值:,
  • 注意:某些带有洋红色标记的值,说明逼近公式总是严丝合缝地对应真实情况。*

经验性测试

[编辑]

生日问题可以通过计算机代码进行经验性模拟:

days := 365;
numPeople := 1;
prob := 0.0;
while prob < 0.5 do
begin
    numPeople := numPeople + 1;
    prob := 1 - ((1 - prob) * (days - (numPeople - 1)) / days);
    writeln('Number of people: ', numPeople);
    writeln('Prob. of same birthday: ', prob);
end;

生日问题也可以在 Microsoft Excel 等电子表格软件中进行模拟验证:

人数 人数对应的生日相同的概率公式
1 1 `=1-PERMUT(365,A1)/POWER(365,A1)`
2 `=A1+1` `=1-PERMUT(365,A2)/POWER(365,A2)`
3 `=A2+1` `=1-PERMUT(365,A3)/POWER(365,A3)`

当拉取公式直至行数达到23(即人数达到23)时,可以观察到概率结果开始超过50%

应用

[编辑]

生日问题被广泛应用于检测哈希函数的安全性:一个位长度的哈希表发生碰撞的预期测试次数不是次,而是只有次。这一结论被直接用在破解密码学散列函数生日攻击策略中。

此外,生日问题隐含的理论早已在Schnabel(1938年)提出的捉放法(capture-recapture)统计试验中得到了应用,常用来估计湖泊中的鱼类总数。

不平衡概率

[编辑]

正如前文所述,现实世界人口的生日并非绝对平均分布。然而这种非均衡生日概率问题的数学边界也已得到深入解决与论证。[來源請求]

近似匹配

[编辑]

此问题的另外一个泛化是,求在人中存在两人的生日同在个日历天内的概率。假设有个同等可能的生日。[2]

若要找到两人生日相差天或以内,并且使概率高于50%,所需的人数表如下:

下所需的 人数
0 23
1 14
2 11
3 9
4 8
5 8
6 7
7 7

这意味着只须随机抽取7个人,找到两人之间生日相差一周内的概率就会过半。[2]

其它相关错觉机率问题

[编辑]
  • 星期二男孩问题:一个两孩家庭有一个男孩,他是星期二出生的,那么另一个孩子也是男孩的机率是多少?答:13/27[3]

参考资料

[编辑]
  • Zoe Emily Schnabel: "The estimation of the total fish population of a lake"(某湖中鱼类总量估计),美国数学月刊45(1938年), 348-352页
  • M. Klamkin,D. Newman: "Extensions of the birthday surprise"(生日惊喜的扩充), Journal of Combinatorial Theory 3(1967年),279-282页。
  • D. Blom: "a birthday problem"(生日问题),美国数学月刊80(1973年),1141-1142页。这一论文证明了当生日按照平均分布,两个生日相同的概率最小。

相关条目

[编辑]

参考文献

[编辑]
  1. ^ 原文:The reasoning is based on important tools that all students of mathematics should have ready access to.  The birthday problem used to be a splendid illustration of the advantages of pure thought over mechanical manipulation; the inequalities can be obtained in a minute or two, whereas the multiplications would take much longer, and be much more subject to error, whether the instrument is a pencil or an old-fashioned desk computer. What calculators do not yield is understanding, or mathematical facility, or a solid basis for more advanced, generalized theories
  2. ^ 2.0 2.1 M. Abramson and W. O. J. Moser (1970) More Birthday Surprises, American Mathematical Monthly 77, 856–858
  3. ^ Jesper Juul. Tuesday Changes Everything (a Mathematical Puzzle). The Ludologist. [2022-05-01]. (原始内容存档于2022-01-24). 

外部链接

[编辑]