Odds ratio

Indice dei contenuti

    L’odds ratio confronta gli odds di un evento tra due condizioni. Se p è la probabilità dell’evento, gli odds sono:

    \dfrac{p}{1-p}.

    Gli odds non sono una probabilità: esprimono il rapporto tra probabilità che l’evento accada e probabilità che non accada. Se p=0{,}2, gli odds sono 0{,}2/0{,}8=0{,}25; se p=0{,}8, gli odds sono 4. L’odds ratio confronta due odds:

    \operatorname{OR} = \dfrac{p_1/(1-p_1)}{p_0/(1-p_0)}.

    Un odds ratio pari a 1 indica assenza di variazione negli odds; maggiore di 1 indica odds più alti nella prima condizione; minore di 1 indica odds più bassi.

    Tabella due per due

    In una tabella di contingenza con esposizione e evento:

    \begin{array}{c|cc} & \text{Evento} & \text{Non evento}\\ \hline \text{Esposto} & a & b\\ \text{Non esposto} & c & d \end{array}

    l’odds ratio campionario è:

    \widehat{\operatorname{OR}} = \dfrac{a/b}{c/d} = \dfrac{ad}{bc}.

    Questa forma è comune negli studi caso-controllo, nell’analisi di guasti, nella diagnostica e nei modelli di classificazione binaria. Se una cella è zero, la stima può diventare infinita o nulla; in questi casi si usano correzioni, modelli penalizzati o metodi esatti.

    Regressione logistica

    In regressione logistica il modello è:

    \log\left(\dfrac{p}{1-p}\right) = \beta_0+\beta_1x_1+\cdots+\beta_px_p.

    Il coefficiente \beta_j agisce sulla log-odds. Esponenziandolo si ottiene:

    e^{\beta_j},

    che è l’odds ratio associato a un incremento unitario del predittore x_j, mantenendo costanti le altre covariate. Se e^{\beta_j}=1{,}5, gli odds sono moltiplicati per 1{,}5 per ogni unità in più di x_j, a parità degli altri predittori.

    Questa interpretazione dipende dalla scala del predittore. Un incremento unitario può essere un grado, un millimetro, un anno, un volt o un valore standardizzato; il significato tecnico cambia di conseguenza. Per variabili continue conviene spesso riportare odds ratio per incrementi fisicamente rilevanti, non solo per una unità arbitraria.

    Differenza dal rischio relativo

    L’odds ratio non va confuso con il rischio relativo:

    \operatorname{RR} = \dfrac{p_1}{p_0}.

    Quando l’evento è raro, odds ratio e rischio relativo sono simili. Quando l’evento è frequente, l’odds ratio può sembrare molto più grande del rischio relativo. Per esempio, passare da p_0=0{,}4 a p_1=0{,}6 dà un rischio relativo di 1{,}5, ma un odds ratio di 2{,}25. Interpretare l’odds ratio come se fosse un rapporto di probabilità porta quindi a sovrastimare l’effetto percepito.

    Intervalli e scala logaritmica

    Gli intervalli di confidenza per odds ratio si costruiscono spesso sulla scala logaritmica, perché \log(\widehat{\operatorname{OR}}) ha approssimazioni più simmetriche:

    \log(\widehat{\operatorname{OR}}) \pm z_{1-\alpha/2}\, \operatorname{se}\left(\log(\widehat{\operatorname{OR}})\right).

    Esponenziando gli estremi si ottiene l’intervallo per l’odds ratio. Se l’intervallo include 1, l’associazione non è statisticamente distinta dall’assenza di variazione al livello considerato.

    Uso ingegneristico

    In ingegneria l’odds ratio compare in affidabilità, sicurezza, manutenzione, qualità e classificazione. Può misurare quanto una certa condizione operativa aumenti gli odds di guasto, quanto una procedura riduca gli odds di difetto, o quanto una feature sia associata a un esito binario in un modello diagnostico.

    Il valore va sempre accompagnato dal contesto: frequenza base dell’evento, intervallo di confidenza, covariate controllate e disegno dello studio. Un odds ratio elevato su un evento rarissimo può corrispondere a un aumento assoluto piccolo; un odds ratio moderato su un evento comune può avere grande impatto operativo.

    Errori comuni

    Il primo errore è dire che un odds ratio di 2 significa “probabilità doppia”. In generale significa odds doppi, non probabilità doppia. Il secondo è confrontare odds ratio stimati da modelli con covariate diverse come se fossero direttamente equivalenti. Il terzo è trascurare la non linearità: lo stesso odds ratio può corrispondere a differenze assolute di probabilità diverse a seconda del livello di partenza.

    L’odds ratio è quindi una misura potente e naturale per modelli logit e tabelle due per due, ma richiede una traduzione accurata quando si comunica il risultato in termini decisionali.

    Ultimo aggiornamento: