Intervallo di credibilità

Indice dei contenuti

    Un intervallo di credibilità è un intervallo, o più in generale una regione, che contiene un parametro incognito con una probabilità a posteriori assegnata. È un concetto dell’inferenza bayesiana: dopo aver osservato i dati, il parametro viene descritto tramite una distribuzione a posteriori e l’intervallo riassume una parte prefissata di quella distribuzione.

    Se \theta è il parametro e x indica i dati osservati, un intervallo di credibilità di livello 1-\alpha è un insieme C tale che

    P(\theta\in C\mid x)=1-\alpha.

    Per esempio, un intervallo di credibilità al 95\% contiene il 95\% della massa posteriore del parametro.

    Differenza rispetto all’intervallo di confidenza

    L’interpretazione è diversa da quella di un intervallo di confidenza frequentista. Nel quadro frequentista il parametro è fisso e l’intervallo è casuale perché dipende dal campione; dire “confidenza al 95\%” riguarda il comportamento della procedura su ripetizioni ideali dell’esperimento.

    Nel quadro bayesiano, dopo aver osservato i dati, si assegna una distribuzione al parametro:

    p(\theta\mid x) = \dfrac{p(x\mid\theta)p(\theta)}{p(x)}.

    L’intervallo di credibilità è quindi leggibile direttamente come probabilità a posteriori del parametro, condizionatamente ai dati e alla prior scelta. Questa interpretazione è spesso più naturale per chi deve comunicare incertezza decisionale, ma dipende esplicitamente dal modello bayesiano.

    Intervallo tramite quantili

    Se la distribuzione posteriore è unidimensionale, un intervallo centrale di credibilità al livello 1-\alpha può essere costruito usando i quantili posteriori:

    C= \left[ q_{\alpha/2}, q_{1-\alpha/2} \right],

    dove

    P(\theta\le q_{\alpha/2}\mid x)=\dfrac{\alpha}{2}, \qquad P(\theta\le q_{1-\alpha/2}\mid x)=1-\dfrac{\alpha}{2}.

    Questo intervallo lascia la stessa probabilità nelle due code. È semplice da calcolare e da comunicare, specialmente quando la distribuzione posteriore è simmetrica o quasi simmetrica.

    Regione HPD

    Un’altra costruzione è la regione HPD, da highest posterior density. In questo caso si cerca l’insieme dei valori più plausibili secondo la densità posteriore:

    C_{\mathrm{HPD}}=\{\theta:p(\theta\mid x)\ge k\},

    dove k è scelto in modo che

    P(\theta\in C_{\mathrm{HPD}}\mid x)=1-\alpha.

    Una regione HPD è spesso più corta dell’intervallo centrale, ma può essere più difficile da calcolare e, per distribuzioni multimodali, può non essere un unico intervallo continuo.

    Esempio con proporzione binomiale

    Se si osservano s successi su n prove e si usa una prior Beta,

    \theta\sim \mathrm{Beta}(a,b),

    la posteriore è ancora una distribuzione beta:

    \theta\mid x\sim \mathrm{Beta}(a+s,b+n-s).

    Un intervallo di credibilità si ottiene dai quantili di questa distribuzione posteriore. L’esempio mostra bene il ruolo della prior: con pochi dati, prior diverse possono produrre intervalli sensibilmente diversi; con molti dati, l’effetto della prior tende spesso a ridursi.

    Interpretazione operativa

    In una relazione tecnica, dire che \theta appartiene a [L,U] con probabilità a posteriori 0{,}95 significa che, dato il modello, i dati e la prior, il 95\% della distribuzione posteriore cade in quell’intervallo. Non significa che l’intervallo sia vero in assoluto: la validità dell’affermazione dipende dalla correttezza del modello statistico e dalla scelta della prior.

    L’intervallo di credibilità va distinto anche dall’intervallo di predizione, che riguarda una futura osservazione e include anche la variabilità del dato osservabile, non solo l’incertezza sul parametro.

    Errori comuni

    Il primo errore è trattare intervalli di credibilità e intervalli di confidenza come sinonimi. Possono essere numericamente simili in modelli regolari con prior deboli e molti dati, ma la loro interpretazione resta diversa. Il secondo è nascondere la prior: un intervallo bayesiano è sempre condizionato anche alla prior. Il terzo è usare solo l’intervallo senza ispezionare la forma della posteriore; in presenza di asimmetria o multimodalità, due estremi possono riassumere male l’incertezza.

    Per esempi di aggiornamento bayesiano e uso della probabilità condizionata, si vedano gli esercizi su probabilità condizionata e Bayes e quelli su inferenza bayesiana e priori coniugate.

    Ultimo aggiornamento: