La probabilità condizionata misura quanto cambia la probabilità di un evento alla luce di un’informazione. È la base del teorema di Bayes, che permette di “invertire” il condizionamento: dalla probabilità dell’effetto data la causa, risalire alla causa dato l’effetto. Questa scheda copre condizionamento, indipendenza, probabilità totale e Bayes con esempi classici.
Definizione: \;P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}, con P(B)>0.
1. Probabilità condizionata di base
Esercizio. Si lancia un dado equo. Sapendo che è uscito un numero pari, qual è la probabilità che sia il 6?
L’informazione “numero pari” riduce lo spazio a \{2,4,6\}:
P(6\mid\text{pari})=\dfrac{P(6\cap\text{pari})}{P(\text{pari})}=\dfrac{1/6}{3/6}=\dfrac{1}{3}.
Condizionare significa restringere lo spazio campionario all’evento noto e rinormalizzare.
2. Regola del prodotto
Esercizio. Da un’urna con 5 palline bianche e 3 nere si estraggono 2 palline senza reimmissione. Probabilità che entrambe siano bianche?
La regola del prodotto concatena le condizionate:
P(B_1\cap B_2)=P(B_1)\,P(B_2\mid B_1)=\dfrac{5}{8}\times\dfrac{4}{7}=\dfrac{20}{56}=\dfrac{5}{14}\approx0{,}357.
Senza reimmissione la seconda probabilità dipende dalla prima estrazione: gli eventi non sono indipendenti.
3. Verifica di indipendenza
Esercizio. Da un mazzo di 52 carte se ne estrae una. A= “è un re”, B= “è cuori”. A e B sono indipendenti?
Due eventi sono indipendenti se P(A\cap B)=P(A)P(B):
P(A)=\dfrac{4}{52}=\dfrac{1}{13},\quad P(B)=\dfrac{13}{52}=\dfrac{1}{4},\quad P(A\cap B)=\dfrac{1}{52}.
P(A)P(B)=\dfrac{1}{13}\times\dfrac{1}{4}=\dfrac{1}{52}=P(A\cap B).\ \checkmark
Sono indipendenti: conoscere il seme non altera la probabilità che sia un re.
4. Formula della probabilità totale
Esercizio. Due macchine producono pezzi: la macchina 1 il 60\% con scarto 2\%, la macchina 2 il 40\% con scarto 5\%. Qual è la probabilità che un pezzo a caso sia difettoso?
La probabilità totale somma sui casi mutuamente esclusivi:
P(D)=P(D\mid M_1)P(M_1)+P(D\mid M_2)P(M_2)=0{,}02\times0{,}60+0{,}05\times0{,}40.
P(D)=0{,}012+0{,}020=0{,}032=3{,}2\%.
Si “scompone” l’evento difettoso sulle sue possibili origini, pesando ogni contributo per la sua probabilità.
5. Teorema di Bayes
Esercizio. Nel contesto del punto 4, un pezzo è risultato difettoso. Qual è la probabilità che provenga dalla macchina 2?
Bayes inverte il condizionamento:
P(M_2\mid D)=\dfrac{P(D\mid M_2)P(M_2)}{P(D)}=\dfrac{0{,}05\times0{,}40}{0{,}032}=\dfrac{0{,}020}{0{,}032}=0{,}625=62{,}5\%.
Pur producendo meno pezzi, la macchina 2 è responsabile del 62{,}5\% dei difetti: il suo tasso di scarto più alto la rende la causa più probabile a posteriori.
6. Test diagnostico e falsi positivi
Esercizio. Una malattia ha prevalenza P(M)=1\%. Un test ha sensibilità P(+\mid M)=99\% e specificità P(-\mid \bar M)=95\%. Se il test è positivo, qual è la probabilità di essere malati?
Passo 1 — falso positivo: P(+\mid\bar M)=1-0{,}95=0{,}05.
Passo 2 — probabilità totale di positivo:
P(+)=P(+\mid M)P(M)+P(+\mid\bar M)P(\bar M)=0{,}99\times0{,}01+0{,}05\times0{,}99=0{,}0099+0{,}0495=0{,}0594.
Passo 3 — Bayes:
P(M\mid +)=\dfrac{0{,}99\times0{,}01}{0{,}0594}=\dfrac{0{,}0099}{0{,}0594}=0{,}167=16{,}7\%.
Risultato controintuitivo: nonostante il test sia molto accurato, un positivo ha solo il 17\% di probabilità di essere malato. La rarità della malattia fa sì che i falsi positivi (numerosi in valore assoluto) dominino. È il “paradosso del test raro”.
7. Bayes con più ipotesi
Esercizio. Tre urne: U1 con 2 bianche/8 nere, U2 con 5/5, U3 con 8/2. Si sceglie un’urna a caso ed esce una pallina bianca. Probabilità che fosse U3?
Passo 1 — verosimiglianze: P(B\mid U_1)=0{,}2, P(B\mid U_2)=0{,}5, P(B\mid U_3)=0{,}8; ogni urna P(U_i)=1/3.
Passo 2 — probabilità totale:
P(B)=\dfrac{1}{3}(0{,}2+0{,}5+0{,}8)=\dfrac{1}{3}\times1{,}5=0{,}5.
Passo 3 — Bayes per U3:
P(U_3\mid B)=\dfrac{0{,}8\times\dfrac{1}{3}}{0{,}5}=\dfrac{0{,}2667}{0{,}5}=0{,}533=53{,}3\%.
L’osservazione “bianca” sposta la probabilità verso l’urna più ricca di bianche: da 33\% a priori a 53\% a posteriori.
8. Bayes in forma di odds
Esercizio. Un componente può essere difettoso con probabilità a priori P(D)=0{,}02. Un test ha rapporto di verosimiglianza positivo
Calcolare la probabilità a posteriori di difetto dopo un test positivo.
La forma a odds di Bayes è:
Gli odds priori sono
Dopo il test positivo:
Convertiamo gli odds o in probabilità:
La probabilità a posteriori è circa 29\%. Anche un test forte non porta automaticamente a probabilità alte se la probabilità a priori è bassa.
9. Probabilità dopo un test negativo
Esercizio. Nello scenario del punto 6, calcolare P(M\mid -).
Dati:
La probabilità totale di test negativo è
Quindi
Bayes:
La probabilità residua di malattia dopo un negativo è circa 0{,}011\%: il test negativo è molto rassicurante perché la sensibilità è alta.
10. Dipendenza condizionata
Esercizio. Si lanciano due dadi equi. Sia A= “il primo dado è 6”, B= “il secondo dado è 6”, C= “almeno un dado è 6”. Gli eventi A e B sono indipendenti? Sono indipendenti condizionatamente a C?
Senza condizionamento:
Poiché
A e B sono indipendenti.
Condizioniamo però a C. Lo spazio condizionato contiene i casi in cui almeno un dado è 6: sono
esiti equiprobabili. Allora
ma
Se fossero indipendenti condizionatamente a C, dovremmo avere
che non coincide con 1/11. Dunque non sono indipendenti condizionatamente a C.
Il condizionamento può creare dipendenza tra eventi che prima erano indipendenti: è una fonte frequente di errori nei problemi con informazioni parziali.
Errori comuni
- Confondere P(A\mid B) con P(B\mid A). È l’errore di base che Bayes serve proprio a correggere: sensibilità P(+\mid M) e valore predittivo P(M\mid+) sono cose diverse.
- Trascurare la probabilità a priori. Ignorare la prevalenza porta a sovrastimare enormemente P(M\mid+): il termine P(M) è decisivo.
- Assumere indipendenza senza verifica. Moltiplicare le probabilità vale solo se gli eventi sono indipendenti; senza reimmissione non lo sono.
- Dimenticare di normalizzare in Bayes. Il denominatore P(B) (probabilità totale) è la somma di tutti i numeratori: ometterlo dà valori che non sommano a 1.
- Pensare che l’indipendenza sopravviva sempre al condizionamento. Eventi indipendenti possono diventare dipendenti una volta nota un’informazione comune.
- Interpretare il test positivo senza base rate. Sensibilità e specificità non bastano: serve sempre la prevalenza o probabilità a priori.