Test F

Indice dei contenuti

    Il test F è una famiglia di test statistici in cui la statistica di test segue, sotto l’ipotesi nulla, una distribuzione F di Fisher. Compare nel confronto tra varianze, nell’ANOVA e nei test globali o parziali della regressione lineare.

    L’idea comune è confrontare due stime di variabilità: una associata a effetti spiegati dal modello, l’altra associata alla variabilità residua.

    Confronto tra due varianze

    Se S_1^2 e S_2^2 sono varianze campionarie indipendenti ottenute da popolazioni gaussiane con la stessa varianza teorica sotto l’ipotesi nulla, allora

    F=\dfrac{S_1^2}{S_2^2}.

    Sotto H_0:\sigma_1^2=\sigma_2^2, la statistica segue una distribuzione F con gradi di libertà legati alle due varianze campionarie:

    F\sim F_{n_1-1,n_2-1}.

    Per convenzione, spesso si mette al numeratore la varianza più grande, ma la scelta dipende dalla formulazione del test e dall’alternativa.

    Test F in ANOVA

    Nell’analisi della varianza, il test F confronta la variabilità tra gruppi con la variabilità entro gruppi:

    F= \dfrac{MS_{\text{tra}}}{MS_{\text{entro}}},

    dove MS indica una media quadratica, cioè una somma dei quadrati divisa per i suoi gradi di libertà.

    Se le medie dei gruppi sono davvero uguali, la variabilità tra gruppi dovrebbe essere compatibile con la variabilità interna. Un valore di F molto grande suggerisce che almeno una media differisca dalle altre.

    Test globale in regressione

    In un modello di regressione lineare

    y=X\beta+\varepsilon,

    il test F globale verifica se i regressori, presi insieme, spiegano una quota significativa della variabilità della risposta. Una forma comune è

    F= \dfrac{(SSR/p)}{SSE/(n-p-1)},

    dove SSR è la somma dei quadrati spiegata, SSE quella residua, p il numero di regressori e n la dimensione campionaria.

    In modo equivalente, usando R^2:

    F= \dfrac{R^2/p}{(1-R^2)/(n-p-1)}.

    Il test valuta l’ipotesi

    H_0:\beta_1=\cdots=\beta_p=0.

    Modelli annidati

    Il test F può confrontare due modelli lineari annidati, cioè un modello ridotto contenuto in un modello completo. Se SSE_R e SSE_C sono le somme dei quadrati residue del modello ridotto e completo, allora

    F= \dfrac{(SSE_R-SSE_C)/(p_C-p_R)} {SSE_C/(n-p_C)}.

    Se l’aggiunta di parametri riduce molto l’errore residuo rispetto al costo in gradi di libertà, il test può indicare che il modello completo migliora significativamente il fit.

    Ipotesi

    Nei modelli classici, l’uso esatto del test F richiede:

    • indipendenza degli errori;
    • normalità degli errori per la distribuzione esatta in piccoli campioni;
    • omoschedasticità;
    • corretta specificazione del modello;
    • osservazioni ottenute secondo un disegno appropriato.

    Con campioni grandi, alcune violazioni della normalità possono essere meno gravi, ma eteroschedasticità e dipendenze non modellate possono alterare fortemente il livello del test.

    P-value e decisione

    Il p-value del test F è la probabilità, sotto H_0, di osservare una statistica almeno così estrema. Se il p-value è piccolo rispetto al livello di significatività scelto, si rifiuta H_0.

    Come sempre, rifiutare H_0 non misura automaticamente l’importanza pratica dell’effetto. In campioni grandi, effetti piccoli possono risultare statisticamente significativi; in campioni piccoli, effetti rilevanti possono non emergere.

    Errori comuni

    Il primo errore è usare il test F per confrontare modelli non annidati. Il secondo è ignorare omoschedasticità e indipendenza. Il terzo è interpretare un test F significativo come prova che tutti i coefficienti siano significativi: il test globale dice che almeno una parte del modello contribuisce, non identifica da solo quale parametro sia responsabile.

    Per esercizi collegati si vedano ANOVA: esercizi svolti, regressione lineare semplice e test d’ipotesi parametrici.

    Ultimo aggiornamento: