Test esatto di Fisher — ingegnerismo.it

Il test esatto di Fisher verifica l’associazione in una tabella $2\times2$ senza affidarsi all’approssimazione chi-quadro.

Condizionando ai totali marginali, la distribuzione del conteggio in una cella è ipergeometrica. Il p-value si ottiene sommando le probabilità delle tabelle almeno tanto estreme quanto quella osservata.

È particolarmente utile con campioni piccoli o frequenze attese basse, dove il test chi-quadro può essere impreciso. Il prezzo è che il condizionamento sui marginali può risultare conservativo in alcune applicazioni.

Tabella 2x2

La struttura tipica è

\begin{array}{c|cc|c} & \text{Esito 1} & \text{Esito 2} & \text{Totale}\\ \hline \text{Gruppo 1} & a & b & a+b\\ \text{Gruppo 2} & c & d & c+d\\ \hline \text{Totale} & a+c & b+d & n \end{array}

L’ipotesi nulla afferma che gruppo ed esito siano indipendenti. A differenza del test chi-quadro, Fisher lavora condizionando ai margini osservati, cioè trattando come fissi i totali di riga e colonna.

Distribuzione ipergeometrica

Condizionati i margini, la cella $a$ determina tutte le altre celle. La probabilità di osservare un valore specifico $a$ è

P(A=a) = \dfrac{ \binom{a+b}{a} \binom{c+d}{a+c-a} }{ \binom{n}{a+c} }.

In forma equivalente:

P(A=a) = \dfrac{ \binom{a+b}{a} \binom{c+d}{c} }{ \binom{n}{a+c} }.

Questa è una distribuzione ipergeometrica: si estraggono successi da una popolazione finita senza reinserimento, mantenendo fissati i totali.

p-value

Il p-value dipende dall’alternativa:

alternativa unilaterale destra: si sommano le probabilità delle tabelle con $A$ almeno grande quanto quello osservato;
alternativa unilaterale sinistra: si sommano le probabilità delle tabelle con $A$ al massimo pari a quello osservato;
alternativa bilaterale: si sommano le tabelle considerate almeno tanto estreme quanto quella osservata.

La versione bilaterale richiede una convenzione su cosa significhi “più estremo” in uno spazio discreto. Molti software usano la somma delle probabilità delle tabelle con probabilità non superiore a quella osservata.

Relazione con odds ratio

Nelle tabelle $2\times2$ l’associazione è spesso riassunta dall’odds ratio:

OR= \dfrac{ad}{bc}.

Il test esatto di Fisher verifica, nella formulazione classica, se l’odds ratio è compatibile con $1$ sotto l’ipotesi nulla di indipendenza. Il test risponde alla significatività statistica; l’odds ratio descrive grandezza e direzione dell’associazione.

Quando usarlo

Fisher è particolarmente indicato quando:

il campione è piccolo;
una o più frequenze attese sono basse;
la tabella è molto sbilanciata;
si vuole evitare l’approssimazione asintotica della distribuzione chi-quadro.

In campioni grandi, il test chi-quadro e Fisher tendono a dare risultati simili, ma Fisher può essere computazionalmente più oneroso per estensioni a tabelle più grandi.

Conservatività e interpretazione

Il condizionamento sui marginali rende il test esatto rispetto al modello condizionato, ma può produrre p-value conservativi: il livello effettivo del test può essere inferiore al livello di significatività nominale.

Questo non significa che il test sia “sbagliato”; significa che la nozione di esattezza dipende dal modello probabilistico adottato. In applicazioni sperimentali, il condizionamento sui marginali è spesso naturale; in altre situazioni può essere una scelta più discutibile.

Errori comuni

Un errore frequente è usare Fisher solo perché “più esatto” senza guardare il disegno dello studio. Esatto non significa automaticamente più appropriato in ogni contesto. Un secondo errore è riportare solo il p-value: con campioni piccoli, è ancora più importante indicare odds ratio e intervallo di confidenza, perché la significatività può essere assente anche in presenza di effetti potenzialmente rilevanti ma stimati con grande incertezza.