Test del rapporto di verosimiglianza

Indice dei contenuti

    Il test del rapporto di verosimiglianza confronta quanto bene i dati sono spiegati dal modello vincolato dell’ipotesi nulla rispetto al modello completo.

    La statistica tipica è:

    \Lambda=\dfrac{\sup_{\Theta_0}L(\theta)}{\sup_{\Theta}L(\theta)}.

    Qui \Theta_0 è lo spazio dei parametri ammesso dall’ipotesi nulla, mentre \Theta è lo spazio del modello completo. Poiché \Theta_0\subseteq\Theta, il numeratore non può superare il denominatore e quindi 0\le\Lambda\le1. Valori piccoli indicano che imporre H_0 riduce molto la verosimiglianza massima: i dati sono compatibili molto meglio con il modello più ricco.

    Forma logaritmica

    Nella pratica si usa quasi sempre:

    D=-2\log\Lambda =2\left[\ell(\widehat{\theta})-\ell(\widehat{\theta}_0)\right],

    dove \ell è la log-verosimiglianza, \widehat{\theta} è lo stimatore di massima verosimiglianza nel modello completo e \widehat{\theta}_0 è lo stimatore vincolato sotto H_0. La forma logaritmica è numericamente più stabile e trasforma prodotti di densità in somme.

    Più grande è D, maggiore è la perdita di adattamento causata dal vincolo imposto dall’ipotesi nulla. Il test rifiuta H_0 per valori grandi di D, non per valori grandi di \Lambda.

    Distribuzione asintotica

    Nei modelli regolari, la quantità -2\log\Lambda ha distribuzione asintotica chi-quadro secondo il teorema di Wilks:

    -2\log\Lambda \;\xrightarrow{d}\; \chi^2_r.

    r è il numero di vincoli indipendenti imposti da H_0, cioè la differenza tra la dimensione del modello completo e quella del modello ridotto. Per esempio, se si confrontano due modelli annidati e il modello completo ha due parametri in più, il riferimento asintotico è una \chi^2_2.

    Questa approssimazione richiede campioni sufficientemente grandi, identificabilità dei parametri, regolarità della log-verosimiglianza e ipotesi nulla non posta su un bordo patologico dello spazio parametrico. Quando queste condizioni falliscono, il riferimento chi-quadro può essere errato.

    Modelli annidati

    Il test del rapporto di verosimiglianza è naturale per confrontare modelli annidati. Un modello ridotto è annidato nel modello completo quando si ottiene imponendo vincoli sui parametri del modello completo. Esempi tipici sono:

    • regressione con e senza un gruppo di predittori;
    • modello logistico con o senza interazione;
    • modello di sopravvivenza con coefficienti nulli;
    • distribuzione con parametro fissato contro parametro libero.

    Nei modelli lineari generalizzati, la stessa idea compare come differenza di devianza statistica tra modello ridotto e modello completo.

    Interpretazione operativa

    Il test non misura se il modello completo è “vero”. Misura se il vincolo specifico imposto da H_0 produce una perdita di verosimiglianza incompatibile con la variabilità campionaria attesa. Un risultato significativo suggerisce che il modello completo descrive meglio i dati; un risultato non significativo indica che i dati non giustificano l’aumento di complessità, ma non dimostra che il vincolo sia esattamente vero.

    Per applicazioni ingegneristiche, il test è utile quando si decide se un parametro di modello debba essere mantenuto: effetto di un fattore di processo, coefficiente di rischio, termine di interazione, dispersione extra o differenza tra due popolazioni. La decisione statistica va però combinata con grandezza dell’effetto, costi di misura, stabilità predittiva e interpretabilità.

    Errori comuni

    Un errore frequente è usare il test tra modelli non annidati: in quel caso il rapporto non ha la distribuzione di Wilks standard. Un altro errore è confrontare valori di verosimiglianza senza penalizzare la maggiore flessibilità del modello completo; il test lo fa tramite la distribuzione della differenza logaritmica, ma solo sotto ipotesi precise.

    Va anche evitato l’uso meccanico con campioni molto piccoli o parametri sul bordo, per esempio varianze nulle, probabilità pari a zero o componenti di miscela che scompaiono. In questi casi servono simulazioni, bootstrap parametrico o risultati asintotici specifici.

    Ultimo aggiornamento: