Il test F è una famiglia di test statistici in cui la statistica di test segue, sotto l’ipotesi nulla, una distribuzione F di Fisher. Compare nel confronto tra varianze, nell’ANOVA e nei test globali o parziali della regressione lineare.
L’idea comune è confrontare due stime di variabilità: una associata a effetti spiegati dal modello, l’altra associata alla variabilità residua.
Confronto tra due varianze
Se S_1^2 e S_2^2 sono varianze campionarie indipendenti ottenute da popolazioni gaussiane con la stessa varianza teorica sotto l’ipotesi nulla, allora
Sotto H_0:\sigma_1^2=\sigma_2^2, la statistica segue una distribuzione F con gradi di libertà legati alle due varianze campionarie:
Per convenzione, spesso si mette al numeratore la varianza più grande, ma la scelta dipende dalla formulazione del test e dall’alternativa.
Test F in ANOVA
Nell’analisi della varianza, il test F confronta la variabilità tra gruppi con la variabilità entro gruppi:
dove MS indica una media quadratica, cioè una somma dei quadrati divisa per i suoi gradi di libertà.
Se le medie dei gruppi sono davvero uguali, la variabilità tra gruppi dovrebbe essere compatibile con la variabilità interna. Un valore di F molto grande suggerisce che almeno una media differisca dalle altre.
Test globale in regressione
In un modello di regressione lineare
il test F globale verifica se i regressori, presi insieme, spiegano una quota significativa della variabilità della risposta. Una forma comune è
dove SSR è la somma dei quadrati spiegata, SSE quella residua, p il numero di regressori e n la dimensione campionaria.
In modo equivalente, usando R^2:
Il test valuta l’ipotesi
Modelli annidati
Il test F può confrontare due modelli lineari annidati, cioè un modello ridotto contenuto in un modello completo. Se SSE_R e SSE_C sono le somme dei quadrati residue del modello ridotto e completo, allora
Se l’aggiunta di parametri riduce molto l’errore residuo rispetto al costo in gradi di libertà, il test può indicare che il modello completo migliora significativamente il fit.
Ipotesi
Nei modelli classici, l’uso esatto del test F richiede:
- indipendenza degli errori;
- normalità degli errori per la distribuzione esatta in piccoli campioni;
- omoschedasticità;
- corretta specificazione del modello;
- osservazioni ottenute secondo un disegno appropriato.
Con campioni grandi, alcune violazioni della normalità possono essere meno gravi, ma eteroschedasticità e dipendenze non modellate possono alterare fortemente il livello del test.
P-value e decisione
Il p-value del test F è la probabilità, sotto H_0, di osservare una statistica almeno così estrema. Se il p-value è piccolo rispetto al livello di significatività scelto, si rifiuta H_0.
Come sempre, rifiutare H_0 non misura automaticamente l’importanza pratica dell’effetto. In campioni grandi, effetti piccoli possono risultare statisticamente significativi; in campioni piccoli, effetti rilevanti possono non emergere.
Errori comuni
Il primo errore è usare il test F per confrontare modelli non annidati. Il secondo è ignorare omoschedasticità e indipendenza. Il terzo è interpretare un test F significativo come prova che tutti i coefficienti siano significativi: il test globale dice che almeno una parte del modello contribuisce, non identifica da solo quale parametro sia responsabile.
Per esercizi collegati si vedano ANOVA: esercizi svolti, regressione lineare semplice e test d’ipotesi parametrici.