Test F — ingegnerismo.it

Il test F è una famiglia di test statistici in cui la statistica di test segue, sotto l’ipotesi nulla, una distribuzione F di Fisher. Compare nel confronto tra varianze, nell’ANOVA e nei test globali o parziali della regressione lineare.

L’idea comune è confrontare due stime di variabilità: una associata a effetti spiegati dal modello, l’altra associata alla variabilità residua.

Confronto tra due varianze

Se $S_1^2$ e $S_2^2$ sono varianze campionarie indipendenti ottenute da popolazioni gaussiane con la stessa varianza teorica sotto l’ipotesi nulla, allora

F=\dfrac{S_1^2}{S_2^2}.

Sotto $H_0:\sigma_1^2=\sigma_2^2$ , la statistica segue una distribuzione F con gradi di libertà legati alle due varianze campionarie:

F\sim F_{n_1-1,n_2-1}.

Per convenzione, spesso si mette al numeratore la varianza più grande, ma la scelta dipende dalla formulazione del test e dall’alternativa.

Test F in ANOVA

Nell’analisi della varianza, il test F confronta la variabilità tra gruppi con la variabilità entro gruppi:

F= \dfrac{MS_{\text{tra}}}{MS_{\text{entro}}},

dove $MS$ indica una media quadratica, cioè una somma dei quadrati divisa per i suoi gradi di libertà.

Se le medie dei gruppi sono davvero uguali, la variabilità tra gruppi dovrebbe essere compatibile con la variabilità interna. Un valore di $F$ molto grande suggerisce che almeno una media differisca dalle altre.

Test globale in regressione

In un modello di regressione lineare

y=X\beta+\varepsilon,

il test F globale verifica se i regressori, presi insieme, spiegano una quota significativa della variabilità della risposta. Una forma comune è

F= \dfrac{(SSR/p)}{SSE/(n-p-1)},

dove $SSR$ è la somma dei quadrati spiegata, $SSE$ quella residua, $p$ il numero di regressori e $n$ la dimensione campionaria.

In modo equivalente, usando $R^2$ :

F= \dfrac{R^2/p}{(1-R^2)/(n-p-1)}.

Il test valuta l’ipotesi

H_0:\beta_1=\cdots=\beta_p=0.

Modelli annidati

Il test F può confrontare due modelli lineari annidati, cioè un modello ridotto contenuto in un modello completo. Se $SSE_R$ e $SSE_C$ sono le somme dei quadrati residue del modello ridotto e completo, allora

F= \dfrac{(SSE_R-SSE_C)/(p_C-p_R)} {SSE_C/(n-p_C)}.

Se l’aggiunta di parametri riduce molto l’errore residuo rispetto al costo in gradi di libertà, il test può indicare che il modello completo migliora significativamente il fit.

Ipotesi

Nei modelli classici, l’uso esatto del test F richiede:

indipendenza degli errori;
normalità degli errori per la distribuzione esatta in piccoli campioni;
omoschedasticità;
corretta specificazione del modello;
osservazioni ottenute secondo un disegno appropriato.

Con campioni grandi, alcune violazioni della normalità possono essere meno gravi, ma eteroschedasticità e dipendenze non modellate possono alterare fortemente il livello del test.

P-value e decisione

Il p-value del test F è la probabilità, sotto $H_0$ , di osservare una statistica almeno così estrema. Se il p-value è piccolo rispetto al livello di significatività scelto, si rifiuta $H_0$ .

Come sempre, rifiutare $H_0$ non misura automaticamente l’importanza pratica dell’effetto. In campioni grandi, effetti piccoli possono risultare statisticamente significativi; in campioni piccoli, effetti rilevanti possono non emergere.

Errori comuni

Il primo errore è usare il test F per confrontare modelli non annidati. Il secondo è ignorare omoschedasticità e indipendenza. Il terzo è interpretare un test F significativo come prova che tutti i coefficienti siano significativi: il test globale dice che almeno una parte del modello contribuisce, non identifica da solo quale parametro sia responsabile.

Per esercizi collegati si vedano ANOVA: esercizi svolti, regressione lineare semplice e test d’ipotesi parametrici.