Představme si, že se chystáte udělat během probíhající krize oslavu narozenin. Žijete ve městě, kde je zhruba 1.200.000 obyvatel. Říkejme mu třeba Praha. Ve městě zrovna nabírá na síle další vlna pandemie, například onemocnění COVID-19. Řekněme, že je v něm přibližně 60.000 nakažených, kteří o sobě ještě neví, že jsou nakažení. Chcete být opatrní, a tak nehodláte dělat žádnou velkou akci. Pozvete jen kamarády z města, které jste dlouho neviděli, ne víc než 20 lidí. Jaká je šance, že zrovna mezi těmi 20 lidmi z toho obrovského města bude někdo nakažený?
Pokud si říkáte, že je přirozeně malá, pak… se mýlíte. Pravděpodobnost bude kolem 64 %.
Jak je to možné? Může za to vcelku dost neintuitivní fenomén nazývaný Narozeninový paradox. Řekněme, že chceme určit pravděpodobnosti, že v nějaké skupině mají dva lidé narozeniny ve stejný den a měsíc. Jaká je pravděpodobnost, když skupina čítá dva lidi? Nebudete asi překvapení, tohle číslo je malé a činí pouze 0,27 %. Protože první z nich může mít narozeniny kdykoli z 365 dní v roce a ten druhý kdykoli kromě jednoho dne, kdy se narodil ten první. Pro výpočet nám tak stačí spočítat 365/365 × 364/365 a získáme pravděpodobnost, že mají v narozeniny v různé dny.
Pokud tuto hodnotu odečteme od jedničky, dostaneme výsledek pro pravděpodobnost, že je mají ve stejný den. Pokud chceme vědět, jaká je pravděpodobnost pro tři účastníky, opakujeme celý postup pro tři účastníky a tak dále. Ta pravděpodobnost je zpočátku stále malá. Jenže pak to celé vezme rychlý spád a při skupině 23 lidí jsme již na pravděpodobnosti 50,73 %. Celou tabulku včetně vzorců naleznete třeba na Wikipedii v rámci hesla Birthday problem.
Vraťme se teď k našemu problému s COVIDem – zde totiž najde princip narozeninového problému své epidemiologické uplatnění, jen místo narozenin a dnů v roce je třeba počítat s velikostí osídlení (které nás zajímá), počtem nakažených v něm (kteří o své nákaze nevědí) a konečně s počtem lidí, kteří se se sejdou na jednom místě. A stejně jako v předchozím příkladu, tak i tady to bere rychlý spád.
Pro naše původní předpoklady o situaci ve městě tak můžeme poměrně snadno spočítat následující tabulku:
Počet hostů kromě mne | P[je tam nakažený] |
1 | 5.00% |
2 | 9.75% |
5 | 22.62% |
10 | 40.13% |
20 | 64.15% |
30 | 78.54% |
40 | 87.15% |
50 | 92.31% |
60 | 95.39% |
70 | 97.24% |
80 | 98.35% |
90 | 99.01% |
100 | 99.41% |
Pravděpodobnost, že konkrétní host je nakažený, je rovna počtu nakažených ve městě vydělenému počtem všech obyvetel města. Označme toto číslo p. Šance, že tento člověk nakažen není, je 1-p. Šance, že ani jeden z dvojice vybraných hostů není nakažený, je (1-p)×(1-p). (Puntíčkář zde může namítnout, že pravděpodobnost, že druhý host je infekční, není roven přesně p, ale počtu nakažených vydělenému počtem obyvatel města mínus jedna, nicméně tento rozdíl je při rozumné velikosti města a rozumně malé party zanedbatelný.) Když takto pokračujeme dále, dostaneme, že šance, že není nakažen nikdo, je (1-p)počet_hostů, což dává, že pravděpodobnost, že alespoň jeden je nakažený, je 1- (1-p)počet_hostů
Vidíme, že riziko roste velmi rychle – právě z tohoto pohledu dává epidemiologické opatření vázané na nízké počty lidí na jednom místě smysl. Může se vám zdát, že je celý příklad poněkud přitažený za vlasy a že v Praze přece nemáme 60.000 nakažených, že jich je sotva tak 30.000. Jenže poloviční počet nakažených neznamená, že se nám zmenší riziko v dvacetičlenné skupině o polovinu. Ve skutečnosti klesne “jen” na přibližně 40 %. Chcete si to sami vyzkoušet? Pak si sami můžete parametry naklikat v simulátoru.
Co z toho všeho plyne prakticky? Za prvé: pokud jde o teorii pravděpodobnosti, tak nikdy nevěřte své intuici a raději si sedněte a počítejte. Za druhé: pokud jde o epidemii, tak teď možná lépe vidíte, proč i při relativně malém počtu nakažených je třeba sáhnout po tak drakonických opatřeních, jaká vidíme i u nás. Zůstaňte doma a neplánujte žádnou party. Momentálně je to to nejlepší, co můžete udělat.
Josef Šlerka, Martin Šmíd