ANCOVA — ingegnerismo.it

L’ANCOVA, Analysis of Covariance, è un modello statistico che combina ANOVA e regressione. Serve a confrontare le medie di più gruppi tenendo conto di una o più covariate quantitative che influenzano la risposta. In termini pratici, risponde alla domanda: i gruppi differiscono ancora dopo avere corretto per una variabile concomitante?

È molto usata in esperimenti, studi osservazionali controllati, biostatistica, controllo qualità, affidabilità e analisi di prestazioni, perché permette di separare l’effetto del trattamento dalla variabilità spiegabile da covariate misurate.

1. Modello base

Con un fattore di gruppo $G$ e una covariata continua $X$ , il modello ANCOVA più semplice è:

Y_{ij} = \mu+\alpha_i+\beta(X_{ij}-\bar{X})+\varepsilon_{ij},

dove:

$Y_{ij}$ è la risposta dell’unità $j$ nel gruppo $i$ ;
$\mu$ è il livello medio generale;
$\alpha_i$ è l’effetto del gruppo $i$ ;
$X_{ij}$ è la covariata;
$\beta$ è la pendenza comune della covariata;
$\varepsilon_{ij}$ è l’errore residuo.

La centratura $X_{ij}-\bar{X}$ non è obbligatoria, ma rende l’intercetta e le medie aggiustate più interpretabili. Il test principale valuta se gli effetti di gruppo $\alpha_i$ sono nulli dopo aver controllato la covariata.

2. Medie aggiustate

L’ANCOVA produce spesso medie aggiustate, cioè stime delle medie di gruppo portate allo stesso valore della covariata. Se i gruppi hanno distribuzioni diverse di $X$ , le medie grezze possono essere fuorvianti; le medie aggiustate cercano di confrontare i gruppi a parità di covariata.

Per esempio, se si confrontano tre materiali rispetto alla resistenza finale e lo spessore dei provini varia tra gruppi, l’ANCOVA può confrontare i materiali correggendo per lo spessore. In questo modo una differenza dovuta a provini più spessi non viene attribuita automaticamente al materiale.

3. Relazione con ANOVA e regressione

Se non ci sono covariate, l’ANCOVA si riduce a un’ANOVA. Se non ci sono fattori categoriali, si riduce a una regressione lineare. La sua forza sta nella combinazione:

\text{risposta} = \text{effetti di gruppo} + \text{effetti delle covariate} + \text{errore}.

Questa struttura permette di usare un unico modello lineare per trattare fattori qualitativi e variabili quantitative.

4. Omogeneità delle pendenze

L’ipotesi più caratteristica dell’ANCOVA classica è l’omogeneità delle pendenze: la relazione tra covariata e risposta deve essere la stessa in tutti i gruppi. Nel modello base, infatti, $\beta$ non dipende da $i$ .

Per verificarla si introduce un termine di interazione:

Y_{ij} = \mu+\alpha_i+\beta X_{ij} +\gamma_i X_{ij} +\varepsilon_{ij}.

Se l’interazione gruppo-covariata è rilevante, le pendenze differiscono tra gruppi. In quel caso una singola correzione comune può essere fuorviante: l’effetto del gruppo dipende dal valore della covariata. Il problema non si risolve semplicemente ignorando l’interazione; occorre interpretare il modello condizionatamente a valori specifici di $X$ .

5. Ipotesi del modello

Le ipotesi operative sono quelle del modello lineare, con alcune attenzioni specifiche:

indipendenza delle osservazioni;
relazione approssimativamente lineare tra covariata e risposta;
omogeneità delle pendenze, se si usa il modello ANCOVA classico;
varianza residua simile tra gruppi;
residui senza forti deviazioni incompatibili con l’inferenza scelta;
covariata misurata prima o indipendentemente dal trattamento, quando si vuole una lettura causale.

L’ultima condizione è spesso sottovalutata. Se la covariata è influenzata dal trattamento, correggere per essa può rimuovere una parte dell’effetto che si voleva misurare o introdurre confondimento.

6. ANCOVA e confondimento

Negli studi osservazionali l’ANCOVA può ridurre il confondimento dovuto a covariate misurate, ma non elimina confondenti non osservati. Se i gruppi differiscono sistematicamente per variabili non incluse nel modello, l’aggiustamento può dare una falsa sensazione di controllo.

Negli esperimenti randomizzati, invece, l’ANCOVA è spesso usata per aumentare precisione: una covariata pre-trattamento fortemente associata alla risposta riduce la variabilità residua e rende più sensibile il confronto tra gruppi.

7. Test F nel modello

Il confronto tra gruppi viene spesso valutato con un test F, confrontando la variabilità spiegata dagli effetti di gruppo con la variabilità residua dopo l’aggiustamento per le covariate. In forma generale:

F= \dfrac{\text{varianza media spiegata dal termine}} {\text{varianza media residua}}.

Il p-value associato indica se l’effetto di gruppo aggiunge informazione rispetto al modello che contiene solo covariate e intercetta. Come sempre, il p-value non misura la grandezza dell’effetto: occorre riportare medie aggiustate, intervalli di confidenza e dimensioni dell’effetto.

8. Più covariate e fattori

L’ANCOVA può includere più covariate:

Y = \mu+\alpha_G+\beta_1X_1+\cdots+\beta_pX_p+\varepsilon.

Può anche includere più fattori categoriali, interazioni tra fattori e interazioni tra fattori e covariate. A quel punto diventa un caso particolare del modello lineare generale.

La complessità va però giustificata. Aggiungere molte covariate in campioni piccoli può aumentare instabilità, collinearità e dipendenza dal modello. La scelta delle covariate dovrebbe essere guidata dal disegno sperimentale e dal meccanismo del fenomeno, non solo dalla ricerca del p-value più favorevole.

9. Errori comuni

Il primo errore è usare l’ANCOVA per “aggiustare” differenze tra gruppi non comparabili senza chiedersi perché quelle differenze esistano. L’aggiustamento statistico non sostituisce un buon disegno degli esperimenti.

Il secondo errore è non verificare l’omogeneità delle pendenze. Se le pendenze sono diverse, una media aggiustata unica può nascondere che il trattamento è migliore per certi valori della covariata e peggiore per altri.

Il terzo errore è controllare per variabili post-trattamento. Se una covariata è conseguenza del trattamento, includerla nel modello può distorcere la stima dell’effetto totale.

10. Uso operativo

L’ANCOVA è utile quando un confronto tra gruppi rischia di essere mascherato o amplificato da covariate quantitative. In un report tecnico dovrebbe includere sempre: modello specificato, covariate usate, verifica dell’interazione gruppo-covariata, medie grezze e aggiustate, intervalli di confidenza, diagnostica dei residui e motivazione sostanziale delle covariate.

Usata bene, non è una correzione cosmetica delle medie, ma un modo per rendere il confronto più equo e più preciso.