Probabilità condizionata e teorema di Bayes: esercizi svolti

Indice dei contenuti

    La probabilità condizionata misura quanto cambia la probabilità di un evento alla luce di un’informazione. È la base del teorema di Bayes, che permette di “invertire” il condizionamento: dalla probabilità dell’effetto data la causa, risalire alla causa dato l’effetto. Questa scheda copre condizionamento, indipendenza, probabilità totale e Bayes con esempi classici.

    Definizione: \;P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}, con P(B)>0.

    1. Probabilità condizionata di base

    Esercizio. Si lancia un dado equo. Sapendo che è uscito un numero pari, qual è la probabilità che sia il 6?

    L’informazione “numero pari” riduce lo spazio a \{2,4,6\}:

    P(6\mid\text{pari})=\dfrac{P(6\cap\text{pari})}{P(\text{pari})}=\dfrac{1/6}{3/6}=\dfrac{1}{3}.

    Condizionare significa restringere lo spazio campionario all’evento noto e rinormalizzare.

    2. Regola del prodotto

    Esercizio. Da un’urna con 5 palline bianche e 3 nere si estraggono 2 palline senza reimmissione. Probabilità che entrambe siano bianche?

    La regola del prodotto concatena le condizionate:

    P(B_1\cap B_2)=P(B_1)\,P(B_2\mid B_1)=\dfrac{5}{8}\times\dfrac{4}{7}=\dfrac{20}{56}=\dfrac{5}{14}\approx0{,}357.

    Senza reimmissione la seconda probabilità dipende dalla prima estrazione: gli eventi non sono indipendenti.

    3. Verifica di indipendenza

    Esercizio. Da un mazzo di 52 carte se ne estrae una. A= “è un re”, B= “è cuori”. A e B sono indipendenti?

    Due eventi sono indipendenti se P(A\cap B)=P(A)P(B):

    P(A)=\dfrac{4}{52}=\dfrac{1}{13},\quad P(B)=\dfrac{13}{52}=\dfrac{1}{4},\quad P(A\cap B)=\dfrac{1}{52}.

    P(A)P(B)=\dfrac{1}{13}\times\dfrac{1}{4}=\dfrac{1}{52}=P(A\cap B).\ \checkmark

    Sono indipendenti: conoscere il seme non altera la probabilità che sia un re.

    4. Formula della probabilità totale

    Esercizio. Due macchine producono pezzi: la macchina 1 il 60\% con scarto 2\%, la macchina 2 il 40\% con scarto 5\%. Qual è la probabilità che un pezzo a caso sia difettoso?

    La probabilità totale somma sui casi mutuamente esclusivi:

    P(D)=P(D\mid M_1)P(M_1)+P(D\mid M_2)P(M_2)=0{,}02\times0{,}60+0{,}05\times0{,}40.

    P(D)=0{,}012+0{,}020=0{,}032=3{,}2\%.

    Si “scompone” l’evento difettoso sulle sue possibili origini, pesando ogni contributo per la sua probabilità.

    5. Teorema di Bayes

    Esercizio. Nel contesto del punto 4, un pezzo è risultato difettoso. Qual è la probabilità che provenga dalla macchina 2?

    Bayes inverte il condizionamento:

    P(M_2\mid D)=\dfrac{P(D\mid M_2)P(M_2)}{P(D)}=\dfrac{0{,}05\times0{,}40}{0{,}032}=\dfrac{0{,}020}{0{,}032}=0{,}625=62{,}5\%.

    Pur producendo meno pezzi, la macchina 2 è responsabile del 62{,}5\% dei difetti: il suo tasso di scarto più alto la rende la causa più probabile a posteriori.

    6. Test diagnostico e falsi positivi

    Esercizio. Una malattia ha prevalenza P(M)=1\%. Un test ha sensibilità P(+\mid M)=99\% e specificità P(-\mid \bar M)=95\%. Se il test è positivo, qual è la probabilità di essere malati?

    Passo 1 — falso positivo: P(+\mid\bar M)=1-0{,}95=0{,}05.

    Passo 2 — probabilità totale di positivo:

    P(+)=P(+\mid M)P(M)+P(+\mid\bar M)P(\bar M)=0{,}99\times0{,}01+0{,}05\times0{,}99=0{,}0099+0{,}0495=0{,}0594.

    Passo 3 — Bayes:

    P(M\mid +)=\dfrac{0{,}99\times0{,}01}{0{,}0594}=\dfrac{0{,}0099}{0{,}0594}=0{,}167=16{,}7\%.

    Risultato controintuitivo: nonostante il test sia molto accurato, un positivo ha solo il 17\% di probabilità di essere malato. La rarità della malattia fa sì che i falsi positivi (numerosi in valore assoluto) dominino. È il “paradosso del test raro”.

    7. Bayes con più ipotesi

    Esercizio. Tre urne: U1 con 2 bianche/8 nere, U2 con 5/5, U3 con 8/2. Si sceglie un’urna a caso ed esce una pallina bianca. Probabilità che fosse U3?

    Passo 1 — verosimiglianze: P(B\mid U_1)=0{,}2, P(B\mid U_2)=0{,}5, P(B\mid U_3)=0{,}8; ogni urna P(U_i)=1/3.

    Passo 2 — probabilità totale:

    P(B)=\dfrac{1}{3}(0{,}2+0{,}5+0{,}8)=\dfrac{1}{3}\times1{,}5=0{,}5.

    Passo 3 — Bayes per U3:

    P(U_3\mid B)=\dfrac{0{,}8\times\dfrac{1}{3}}{0{,}5}=\dfrac{0{,}2667}{0{,}5}=0{,}533=53{,}3\%.

    L’osservazione “bianca” sposta la probabilità verso l’urna più ricca di bianche: da 33\% a priori a 53\% a posteriori.

    8. Bayes in forma di odds

    Esercizio. Un componente può essere difettoso con probabilità a priori P(D)=0{,}02. Un test ha rapporto di verosimiglianza positivo

    LR^+=\dfrac{P(+\mid D)}{P(+\mid \bar D)}=20.

    Calcolare la probabilità a posteriori di difetto dopo un test positivo.

    La forma a odds di Bayes è:

    \text{odds posteriori}=\text{odds priori}\times LR.

    Gli odds priori sono

    \dfrac{P(D)}{P(\bar D)}=\dfrac{0{,}02}{0{,}98}=0{,}0204.

    Dopo il test positivo:

    \text{odds posteriori}=0{,}0204\cdot20=0{,}408.

    Convertiamo gli odds o in probabilità:

    p=\dfrac{o}{1+o} =\dfrac{0{,}408}{1{,}408} =0{,}290.

    La probabilità a posteriori è circa 29\%. Anche un test forte non porta automaticamente a probabilità alte se la probabilità a priori è bassa.

    9. Probabilità dopo un test negativo

    Esercizio. Nello scenario del punto 6, calcolare P(M\mid -).

    Dati:

    P(M)=0{,}01,\quad P(\bar M)=0{,}99,\quad P(-\mid M)=1-0{,}99=0{,}01,\quad P(-\mid\bar M)=0{,}95.

    La probabilità totale di test negativo è

    P(-)=P(-\mid M)P(M)+P(-\mid\bar M)P(\bar M) =0{,}01\cdot0{,}01+0{,}95\cdot0{,}99.

    Quindi

    P(-)=0{,}0001+0{,}9405=0{,}9406.

    Bayes:

    P(M\mid -)=\dfrac{P(-\mid M)P(M)}{P(-)} =\dfrac{0{,}0001}{0{,}9406} =0{,}000106.

    La probabilità residua di malattia dopo un negativo è circa 0{,}011\%: il test negativo è molto rassicurante perché la sensibilità è alta.

    10. Dipendenza condizionata

    Esercizio. Si lanciano due dadi equi. Sia A= “il primo dado è 6”, B= “il secondo dado è 6”, C= “almeno un dado è 6”. Gli eventi A e B sono indipendenti? Sono indipendenti condizionatamente a C?

    Senza condizionamento:

    P(A)=P(B)=\dfrac{1}{6},\qquad P(A\cap B)=\dfrac{1}{36}.

    Poiché

    P(A)P(B)=\dfrac{1}{6}\cdot\dfrac{1}{6}=\dfrac{1}{36},

    A e B sono indipendenti.

    Condizioniamo però a C. Lo spazio condizionato contiene i casi in cui almeno un dado è 6: sono

    6+6-1=11

    esiti equiprobabili. Allora

    P(A\mid C)=\dfrac{6}{11},\qquad P(B\mid C)=\dfrac{6}{11},

    ma

    P(A\cap B\mid C)=\dfrac{1}{11}.

    Se fossero indipendenti condizionatamente a C, dovremmo avere

    P(A\cap B\mid C)=P(A\mid C)P(B\mid C)=\dfrac{36}{121},

    che non coincide con 1/11. Dunque non sono indipendenti condizionatamente a C.

    Il condizionamento può creare dipendenza tra eventi che prima erano indipendenti: è una fonte frequente di errori nei problemi con informazioni parziali.

    Errori comuni

    • Confondere P(A\mid B) con P(B\mid A). È l’errore di base che Bayes serve proprio a correggere: sensibilità P(+\mid M) e valore predittivo P(M\mid+) sono cose diverse.
    • Trascurare la probabilità a priori. Ignorare la prevalenza porta a sovrastimare enormemente P(M\mid+): il termine P(M) è decisivo.
    • Assumere indipendenza senza verifica. Moltiplicare le probabilità vale solo se gli eventi sono indipendenti; senza reimmissione non lo sono.
    • Dimenticare di normalizzare in Bayes. Il denominatore P(B) (probabilità totale) è la somma di tutti i numeratori: ometterlo dà valori che non sommano a 1.
    • Pensare che l’indipendenza sopravviva sempre al condizionamento. Eventi indipendenti possono diventare dipendenti una volta nota un’informazione comune.
    • Interpretare il test positivo senza base rate. Sensibilità e specificità non bastano: serve sempre la prevalenza o probabilità a priori.

    Ultimo aggiornamento: