Probabilità condizionata e teorema di Bayes: esercizi svolti

La probabilità condizionata misura quanto cambia la probabilità di un evento alla luce di un’informazione. È la base del teorema di Bayes, che permette di “invertire” il condizionamento: dalla probabilità dell’effetto data la causa, risalire alla causa dato l’effetto. Questa scheda copre condizionamento, indipendenza, probabilità totale e Bayes con esempi classici.

Definizione: $\;P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}$ , con $P(B)>0$ .

1. Probabilità condizionata di base

Esercizio. Si lancia un dado equo. Sapendo che è uscito un numero pari, qual è la probabilità che sia il $6$ ?

L’informazione “numero pari” riduce lo spazio a $\{2,4,6\}$ :

$P(6\mid\text{pari})=\dfrac{P(6\cap\text{pari})}{P(\text{pari})}=\dfrac{1/6}{3/6}=\dfrac{1}{3}.$

Condizionare significa restringere lo spazio campionario all’evento noto e rinormalizzare.

2. Regola del prodotto

Esercizio. Da un’urna con 5 palline bianche e 3 nere si estraggono 2 palline senza reimmissione. Probabilità che entrambe siano bianche?

La regola del prodotto concatena le condizionate:

$P(B_1\cap B_2)=P(B_1)\,P(B_2\mid B_1)=\dfrac{5}{8}\times\dfrac{4}{7}=\dfrac{20}{56}=\dfrac{5}{14}\approx0{,}357.$

Senza reimmissione la seconda probabilità dipende dalla prima estrazione: gli eventi non sono indipendenti.

3. Verifica di indipendenza

Esercizio. Da un mazzo di 52 carte se ne estrae una. $A=$ “è un re”, $B=$ “è cuori”. $A$ e $B$ sono indipendenti?

Due eventi sono indipendenti se $P(A\cap B)=P(A)P(B)$ :

$P(A)=\dfrac{4}{52}=\dfrac{1}{13},\quad P(B)=\dfrac{13}{52}=\dfrac{1}{4},\quad P(A\cap B)=\dfrac{1}{52}.$

$P(A)P(B)=\dfrac{1}{13}\times\dfrac{1}{4}=\dfrac{1}{52}=P(A\cap B).\ \checkmark$

Sono indipendenti: conoscere il seme non altera la probabilità che sia un re.

4. Formula della probabilità totale

Esercizio. Due macchine producono pezzi: la macchina 1 il $60\%$ con scarto $2\%$ , la macchina 2 il $40\%$ con scarto $5\%$ . Qual è la probabilità che un pezzo a caso sia difettoso?

La probabilità totale somma sui casi mutuamente esclusivi:

$P(D)=P(D\mid M_1)P(M_1)+P(D\mid M_2)P(M_2)=0{,}02\times0{,}60+0{,}05\times0{,}40.$

$P(D)=0{,}012+0{,}020=0{,}032=3{,}2\%.$

Si “scompone” l’evento difettoso sulle sue possibili origini, pesando ogni contributo per la sua probabilità.

5. Teorema di Bayes

Esercizio. Nel contesto del punto 4, un pezzo è risultato difettoso. Qual è la probabilità che provenga dalla macchina 2?

Bayes inverte il condizionamento:

$P(M_2\mid D)=\dfrac{P(D\mid M_2)P(M_2)}{P(D)}=\dfrac{0{,}05\times0{,}40}{0{,}032}=\dfrac{0{,}020}{0{,}032}=0{,}625=62{,}5\%.$

Pur producendo meno pezzi, la macchina 2 è responsabile del $62{,}5\%$ dei difetti: il suo tasso di scarto più alto la rende la causa più probabile a posteriori.

6. Test diagnostico e falsi positivi

Esercizio. Una malattia ha prevalenza $P(M)=1\%$ . Un test ha sensibilità $P(+\mid M)=99\%$ e specificità $P(-\mid \bar M)=95\%$ . Se il test è positivo, qual è la probabilità di essere malati?

Passo 1 — falso positivo: $P(+\mid\bar M)=1-0{,}95=0{,}05$ .

Passo 2 — probabilità totale di positivo:

$P(+)=P(+\mid M)P(M)+P(+\mid\bar M)P(\bar M)=0{,}99\times0{,}01+0{,}05\times0{,}99=0{,}0099+0{,}0495=0{,}0594.$

Passo 3 — Bayes:

$P(M\mid +)=\dfrac{0{,}99\times0{,}01}{0{,}0594}=\dfrac{0{,}0099}{0{,}0594}=0{,}167=16{,}7\%.$

Risultato controintuitivo: nonostante il test sia molto accurato, un positivo ha solo il $17\%$ di probabilità di essere malato. La rarità della malattia fa sì che i falsi positivi (numerosi in valore assoluto) dominino. È il “paradosso del test raro”.

7. Bayes con più ipotesi

Esercizio. Tre urne: U1 con 2 bianche/8 nere, U2 con 5/5, U3 con 8/2. Si sceglie un’urna a caso ed esce una pallina bianca. Probabilità che fosse U3?

Passo 1 — verosimiglianze: $P(B\mid U_1)=0{,}2$ , $P(B\mid U_2)=0{,}5$ , $P(B\mid U_3)=0{,}8$ ; ogni urna $P(U_i)=1/3$ .

Passo 2 — probabilità totale:

$P(B)=\dfrac{1}{3}(0{,}2+0{,}5+0{,}8)=\dfrac{1}{3}\times1{,}5=0{,}5.$

Passo 3 — Bayes per U3:

$P(U_3\mid B)=\dfrac{0{,}8\times\dfrac{1}{3}}{0{,}5}=\dfrac{0{,}2667}{0{,}5}=0{,}533=53{,}3\%.$

L’osservazione “bianca” sposta la probabilità verso l’urna più ricca di bianche: da $33\%$ a priori a $53\%$ a posteriori.

8. Bayes in forma di odds

Esercizio. Un componente può essere difettoso con probabilità a priori $P(D)=0{,}02$ . Un test ha rapporto di verosimiglianza positivo

LR^+=\dfrac{P(+\mid D)}{P(+\mid \bar D)}=20.

Calcolare la probabilità a posteriori di difetto dopo un test positivo.

La forma a odds di Bayes è:

\text{odds posteriori}=\text{odds priori}\times LR.

Gli odds priori sono

\dfrac{P(D)}{P(\bar D)}=\dfrac{0{,}02}{0{,}98}=0{,}0204.

Dopo il test positivo:

\text{odds posteriori}=0{,}0204\cdot20=0{,}408.

Convertiamo gli odds $o$ in probabilità:

p=\dfrac{o}{1+o} =\dfrac{0{,}408}{1{,}408} =0{,}290.

La probabilità a posteriori è circa $29\%$ . Anche un test forte non porta automaticamente a probabilità alte se la probabilità a priori è bassa.

9. Probabilità dopo un test negativo

Esercizio. Nello scenario del punto 6, calcolare $P(M\mid -)$ .

Dati:

P(M)=0{,}01,\quad P(\bar M)=0{,}99,\quad P(-\mid M)=1-0{,}99=0{,}01,\quad P(-\mid\bar M)=0{,}95.

La probabilità totale di test negativo è

P(-)=P(-\mid M)P(M)+P(-\mid\bar M)P(\bar M) =0{,}01\cdot0{,}01+0{,}95\cdot0{,}99.

Quindi

P(-)=0{,}0001+0{,}9405=0{,}9406.

Bayes:

P(M\mid -)=\dfrac{P(-\mid M)P(M)}{P(-)} =\dfrac{0{,}0001}{0{,}9406} =0{,}000106.

La probabilità residua di malattia dopo un negativo è circa $0{,}011\%$ : il test negativo è molto rassicurante perché la sensibilità è alta.

10. Dipendenza condizionata

Esercizio. Si lanciano due dadi equi. Sia $A=$ “il primo dado è 6”, $B=$ “il secondo dado è 6”, $C=$ “almeno un dado è 6”. Gli eventi $A$ e $B$ sono indipendenti? Sono indipendenti condizionatamente a $C$ ?

Senza condizionamento:

P(A)=P(B)=\dfrac{1}{6},\qquad P(A\cap B)=\dfrac{1}{36}.

Poiché

P(A)P(B)=\dfrac{1}{6}\cdot\dfrac{1}{6}=\dfrac{1}{36},

$A$ e $B$ sono indipendenti.

Condizioniamo però a $C$ . Lo spazio condizionato contiene i casi in cui almeno un dado è $6$ : sono

6+6-1=11

esiti equiprobabili. Allora

P(A\mid C)=\dfrac{6}{11},\qquad P(B\mid C)=\dfrac{6}{11},

P(A\cap B\mid C)=\dfrac{1}{11}.

Se fossero indipendenti condizionatamente a $C$ , dovremmo avere

P(A\cap B\mid C)=P(A\mid C)P(B\mid C)=\dfrac{36}{121},

che non coincide con $1/11$ . Dunque non sono indipendenti condizionatamente a $C$ .

Il condizionamento può creare dipendenza tra eventi che prima erano indipendenti: è una fonte frequente di errori nei problemi con informazioni parziali.

Errori comuni

Confondere $P(A\mid B)$ con $P(B\mid A)$ . È l’errore di base che Bayes serve proprio a correggere: sensibilità $P(+\mid M)$ e valore predittivo $P(M\mid+)$ sono cose diverse.
Trascurare la probabilità a priori. Ignorare la prevalenza porta a sovrastimare enormemente $P(M\mid+)$ : il termine $P(M)$ è decisivo.
Assumere indipendenza senza verifica. Moltiplicare le probabilità vale solo se gli eventi sono indipendenti; senza reimmissione non lo sono.
Dimenticare di normalizzare in Bayes. Il denominatore $P(B)$ (probabilità totale) è la somma di tutti i numeratori: ometterlo dà valori che non sommano a 1.
Pensare che l’indipendenza sopravviva sempre al condizionamento. Eventi indipendenti possono diventare dipendenti una volta nota un’informazione comune.
Interpretare il test positivo senza base rate. Sensibilità e specificità non bastano: serve sempre la prevalenza o probabilità a priori.