Narozeninový paradox

Kolik je potřeba lidí, aby bylo pravděpodobnějšíTedy, že pravděpodobnost je větší než 50 %., že alespoň dva jedinci budou mít narozeniny ve stejný den, než každý v jiný den?

Popis problému

Mějme skupinu  n jedinců, u nichž porovnáváme data narození. Cílem je zjistit, při jak velké populaci dochází k tomu, kdy je více pravděpodobné, že více jedinců slaví narozeniny ve stejný den. Není však důležité, zda v konkrétní populaci tento jev nastane, či nikoli. Jistě tedy existuje malá skupina, v níž více jedinců bude slavit narozeniny ve stejný den, a naopak velká skupina (maximálně H=365 jedinců), kteří slaví narozeniny každý v jiný den.

Předpoklady

  1. Rok má 365 dní.
  2. Neuvažujeme v populaci dvojčata.
  3. Očekává se rovnoměrné rozdělení data narození v průběhu roku.
  4. Data narození jedinců v populaci jsou nezávislými jevy.

Výpočet

Označme si  p(n) pravděpodobnost, že alespoň dva jedinci v dané populaci mají narozeniny ve stejný den. Pro jednodušší výpočet otočme otázku: jaká je pravděpodobnost, že každý jedinec má narozeniny v jiný den? Tímto dostaneme pravděpodobnost \bar{p}(n), pro niž musí nutně platit: \bar{p}(n) = 1-p(n).

Pravděpodobnost, že ve skupině čítající dva jedince má každý narozeniny v rozdílný den, dostaneme následovně:

  • První jedinec může mít narozeniny ve kterýkoli den v roce.
  • Druhý jedinec může mít narozeniny ve kterýkoli den vyjma v den narozenin prvního jedince.
  • Obě podmínky musejí nastat současně.

(1)    \begin{equation*} \bar{p}(2) = \frac{365}{365} \cdot \frac{365-1}{365} = \frac{365 \cdot 364}{365^2} = \frac{364}{365} \doteq 0,99726 \end{equation*}

 

Toto pravidlo můžeme rozšířit na vícečetnou populaci, kdy pro každého dalšího přidaného jedince platí:

  • n-tý jedinec může mít narozeniny ve kterýkoli den vyjma v den narozenin předcházejících jedinců.

(2)    \begin{equation*} \bar{p}(n) = \frac{365}{365} \cdot \frac{365-1}{365} \cdot \ldots \cdot \frac{365-(n-1)}{365} = \frac{365 \cdot 364 \cdot \ldots \cdot (365-n+1)}{365^n} \end{equation*}

Což můžeme zapsat i jako:

(3)    \begin{equation*} \bar{p}(n) = \frac{365!}{365^n \cdot (365-n)!} \end{equation*}

 

Abychom dostali odpověď na původní otázku, stačí již pouze odečíst tuto hodnotu od jedničky, tedy:

(4)    \begin{equation*} p(n) = 1-\frac{365!}{365^n \cdot (365-n)!} \end{equation*}

 

Přibližné hodnoty pro vybraná n nalezneme v tabulce níže.

Výsledky

Počet jedinců (N)Pravděpodobnost (P)Počet jedinců (N)Pravděpodobnost (P)
10,00 %2144,37 %
20,27 %2247,57 %
30,82 %2350,73 %
41,64 %2453,83 %
52,71 %2556,87 %
64,05 %2659,82 %
75,62 %2762,69 %
87,43 %2865,45 %
99,46 %2968,10 %
1011,69 %3070,63 %
1114,11 %
1216,70 %3581,44 %
1319,44 %4089,12 %
1422,31 %4594,10 %
1525,29 %5097,04 %
1628,36 %6099,41 %
1731,50 %7099,92 %
1834,69 %8099,99 %
1937,91 %9099,999 %
2041,14 %10099,9999 %

Řešení

Úvodní otázka zněla, jak velkou populaci je potřeba, aby pravděpodobnost, že alespoň dva jedinci v této populaci mají narozeniny ve stejný den, byla větší než 50 %. Z tabulky je patrné, že nejmenší  n , pro něž tato podmínka platí, je \boldsymbol{n=23} . Tedy, už ve skupině čítající 23 jedinců je větší šance, že narazíte na alespoň dva jedince, kteří mají narozeniny ve stejný den.

Poznámky

  • Pamatujete si, kolik vás bylo ve třídě na základní, střední, vysoké škole?
  • Ve vedlejší třídě či v kroužku, do kterého jste jako děti chodili?
  • V současném zaměstnání, či restauraci, kam chodíte na obědy?

Slavila někdy nějaká dvojiceTrojice, čtveřice, … – obecně  \boldsymbol{k} -tice narozeniny ve stejný den? Vsadil bych se, že alespoň jednou ANO. 🙂

 

Abychom neřešili pouze narozeniny, tento paradox má své uplatnění i v kryptografii. Jedná se o tzv. narozeninový útok, kdy je pro nalezení kolize v kryptovací funkci cílem najít dvě různé vstupní hodnoty, které generují stejný výstup (hash). Nalezení první kolize se předpokládá průměrně po:

(5)    \begin{equation*} Q(H) \approx \sqrt{\frac{\pi}{2} H} \end{equation*}

pokusech. Po dosazení za  H = 365 (počet všech možností, které mohou nastat) dostaneme:

(6)    \begin{equation*} Q(365) \approx \sqrt{\frac{\pi}{2} \cdot 365} \doteq 23,94 \nonumber \end{equation*}

Nějaký připomínky?

Tato stránka používá Akismet k omezení spamu. Podívejte se, jak vaše data z komentářů zpracováváme..