Il test del rapporto di verosimiglianza confronta quanto bene i dati sono spiegati dal modello vincolato dell’ipotesi nulla rispetto al modello completo.
La statistica tipica è:
Qui \Theta_0 è lo spazio dei parametri ammesso dall’ipotesi nulla, mentre \Theta è lo spazio del modello completo. Poiché \Theta_0\subseteq\Theta, il numeratore non può superare il denominatore e quindi 0\le\Lambda\le1. Valori piccoli indicano che imporre H_0 riduce molto la verosimiglianza massima: i dati sono compatibili molto meglio con il modello più ricco.
Forma logaritmica
Nella pratica si usa quasi sempre:
dove \ell è la log-verosimiglianza, \widehat{\theta} è lo stimatore di massima verosimiglianza nel modello completo e \widehat{\theta}_0 è lo stimatore vincolato sotto H_0. La forma logaritmica è numericamente più stabile e trasforma prodotti di densità in somme.
Più grande è D, maggiore è la perdita di adattamento causata dal vincolo imposto dall’ipotesi nulla. Il test rifiuta H_0 per valori grandi di D, non per valori grandi di \Lambda.
Distribuzione asintotica
Nei modelli regolari, la quantità -2\log\Lambda ha distribuzione asintotica chi-quadro secondo il teorema di Wilks:
r è il numero di vincoli indipendenti imposti da H_0, cioè la differenza tra la dimensione del modello completo e quella del modello ridotto. Per esempio, se si confrontano due modelli annidati e il modello completo ha due parametri in più, il riferimento asintotico è una \chi^2_2.
Questa approssimazione richiede campioni sufficientemente grandi, identificabilità dei parametri, regolarità della log-verosimiglianza e ipotesi nulla non posta su un bordo patologico dello spazio parametrico. Quando queste condizioni falliscono, il riferimento chi-quadro può essere errato.
Modelli annidati
Il test del rapporto di verosimiglianza è naturale per confrontare modelli annidati. Un modello ridotto è annidato nel modello completo quando si ottiene imponendo vincoli sui parametri del modello completo. Esempi tipici sono:
- regressione con e senza un gruppo di predittori;
- modello logistico con o senza interazione;
- modello di sopravvivenza con coefficienti nulli;
- distribuzione con parametro fissato contro parametro libero.
Nei modelli lineari generalizzati, la stessa idea compare come differenza di devianza statistica tra modello ridotto e modello completo.
Interpretazione operativa
Il test non misura se il modello completo è “vero”. Misura se il vincolo specifico imposto da H_0 produce una perdita di verosimiglianza incompatibile con la variabilità campionaria attesa. Un risultato significativo suggerisce che il modello completo descrive meglio i dati; un risultato non significativo indica che i dati non giustificano l’aumento di complessità, ma non dimostra che il vincolo sia esattamente vero.
Per applicazioni ingegneristiche, il test è utile quando si decide se un parametro di modello debba essere mantenuto: effetto di un fattore di processo, coefficiente di rischio, termine di interazione, dispersione extra o differenza tra due popolazioni. La decisione statistica va però combinata con grandezza dell’effetto, costi di misura, stabilità predittiva e interpretabilità.
Errori comuni
Un errore frequente è usare il test tra modelli non annidati: in quel caso il rapporto non ha la distribuzione di Wilks standard. Un altro errore è confrontare valori di verosimiglianza senza penalizzare la maggiore flessibilità del modello completo; il test lo fa tramite la distribuzione della differenza logaritmica, ma solo sotto ipotesi precise.
Va anche evitato l’uso meccanico con campioni molto piccoli o parametri sul bordo, per esempio varianze nulle, probabilità pari a zero o componenti di miscela che scompaiono. In questi casi servono simulazioni, bootstrap parametrico o risultati asintotici specifici.