Test del rapporto di verosimiglianza

Il test del rapporto di verosimiglianza confronta quanto bene i dati sono spiegati dal modello vincolato dell’ipotesi nulla rispetto al modello completo.

La statistica tipica è:

\Lambda=\dfrac{\sup_{\Theta_0}L(\theta)}{\sup_{\Theta}L(\theta)}.

Qui $\Theta_0$ è lo spazio dei parametri ammesso dall’ipotesi nulla, mentre $\Theta$ è lo spazio del modello completo. Poiché $\Theta_0\subseteq\Theta$ , il numeratore non può superare il denominatore e quindi $0\le\Lambda\le1$ . Valori piccoli indicano che imporre $H_0$ riduce molto la verosimiglianza massima: i dati sono compatibili molto meglio con il modello più ricco.

Forma logaritmica

Nella pratica si usa quasi sempre:

D=-2\log\Lambda =2\left[\ell(\widehat{\theta})-\ell(\widehat{\theta}_0)\right],

dove $\ell$ è la log-verosimiglianza, $\widehat{\theta}$ è lo stimatore di massima verosimiglianza nel modello completo e $\widehat{\theta}_0$ è lo stimatore vincolato sotto $H_0$ . La forma logaritmica è numericamente più stabile e trasforma prodotti di densità in somme.

Più grande è $D$ , maggiore è la perdita di adattamento causata dal vincolo imposto dall’ipotesi nulla. Il test rifiuta $H_0$ per valori grandi di $D$ , non per valori grandi di $\Lambda$ .

Distribuzione asintotica

Nei modelli regolari, la quantità $-2\log\Lambda$ ha distribuzione asintotica chi-quadro secondo il teorema di Wilks:

-2\log\Lambda \;\xrightarrow{d}\; \chi^2_r.

$r$ è il numero di vincoli indipendenti imposti da $H_0$ , cioè la differenza tra la dimensione del modello completo e quella del modello ridotto. Per esempio, se si confrontano due modelli annidati e il modello completo ha due parametri in più, il riferimento asintotico è una $\chi^2_2$ .

Questa approssimazione richiede campioni sufficientemente grandi, identificabilità dei parametri, regolarità della log-verosimiglianza e ipotesi nulla non posta su un bordo patologico dello spazio parametrico. Quando queste condizioni falliscono, il riferimento chi-quadro può essere errato.

Modelli annidati

Il test del rapporto di verosimiglianza è naturale per confrontare modelli annidati. Un modello ridotto è annidato nel modello completo quando si ottiene imponendo vincoli sui parametri del modello completo. Esempi tipici sono:

regressione con e senza un gruppo di predittori;
modello logistico con o senza interazione;
modello di sopravvivenza con coefficienti nulli;
distribuzione con parametro fissato contro parametro libero.

Nei modelli lineari generalizzati, la stessa idea compare come differenza di devianza statistica tra modello ridotto e modello completo.

Interpretazione operativa

Il test non misura se il modello completo è “vero”. Misura se il vincolo specifico imposto da $H_0$ produce una perdita di verosimiglianza incompatibile con la variabilità campionaria attesa. Un risultato significativo suggerisce che il modello completo descrive meglio i dati; un risultato non significativo indica che i dati non giustificano l’aumento di complessità, ma non dimostra che il vincolo sia esattamente vero.

Per applicazioni ingegneristiche, il test è utile quando si decide se un parametro di modello debba essere mantenuto: effetto di un fattore di processo, coefficiente di rischio, termine di interazione, dispersione extra o differenza tra due popolazioni. La decisione statistica va però combinata con grandezza dell’effetto, costi di misura, stabilità predittiva e interpretabilità.

Errori comuni

Un errore frequente è usare il test tra modelli non annidati: in quel caso il rapporto non ha la distribuzione di Wilks standard. Un altro errore è confrontare valori di verosimiglianza senza penalizzare la maggiore flessibilità del modello completo; il test lo fa tramite la distribuzione della differenza logaritmica, ma solo sotto ipotesi precise.

Va anche evitato l’uso meccanico con campioni molto piccoli o parametri sul bordo, per esempio varianze nulle, probabilità pari a zero o componenti di miscela che scompaiono. In questi casi servono simulazioni, bootstrap parametrico o risultati asintotici specifici.