Test Jarque-Bera — ingegnerismo.it

Il test Jarque-Bera verifica la normalità usando asimmetria e curtosi campionarie. La statistica è:

JB=\dfrac{n}{6}\left(g_1^2+\dfrac{1}{4}g_2^2\right),

dove $g_1$ è l’asimmetria e $g_2$ l’eccesso di curtosi.

Sotto normalità e per campioni grandi, $JB$ ha distribuzione approssimata $\chi^2_2$ . Il test è semplice e utile per diagnosticare code pesanti o asimmetria, ma è asintotico e può essere poco affidabile su campioni piccoli.

Asimmetria e curtosi

La distribuzione normale ha asimmetria nulla ed eccesso di curtosi nullo. Il test Jarque-Bera misura quanto le corrispondenti statistiche campionarie si allontanano da questi valori.

Indicando con $m_r$ il momento centrale campionario di ordine $r$ ,

m_r= \dfrac{1}{n} \sum_{i=1}^n (x_i-\bar x)^r,

si definisce spesso

g_1= \dfrac{m_3}{m_2^{3/2}}, \qquad g_2= \dfrac{m_4}{m_2^2}-3.

Qui $g_1$ misura l’asimmetria statistica e $g_2$ l’eccesso di curtosi rispetto alla normale.

Statistica del test

La statistica Jarque-Bera è

JB= \dfrac{n}{6} \left( g_1^2+ \dfrac{g_2^2}{4} \right).

Il termine $g_1^2$ penalizza deviazioni simmetriche in positivo o negativo dall’asimmetria nulla. Il termine $g_2^2/4$ penalizza code troppo pesanti o troppo leggere rispetto alla normale.

Sotto l’ipotesi nulla di normalità e per campioni grandi,

JB\ \dot{\sim}\ \chi^2_2.

Il p-value si calcola quindi sulla coda superiore della distribuzione chi-quadro con due gradi di libertà.

Ipotesi nulla e alternativa

L’ipotesi nulla è che i dati provengano da una distribuzione normale, almeno rispetto alle caratteristiche di asimmetria e curtosi catturate dal test. L’alternativa è generica: il test può rifiutare per asimmetria, code pesanti, code leggere o combinazioni di questi effetti.

Non indica quale modello alternativo sia corretto. Un rifiuto suggerisce che l’ipotesi di normalità è sospetta, ma richiede diagnostica aggiuntiva.

Uso sui residui

Jarque-Bera è spesso applicato ai residui di una regressione o di un modello di serie storiche. In quel caso non si sta testando la normalità della variabile osservata, ma la normalità degli errori dopo aver rimosso la struttura modellata.

Questa distinzione è importante: residui non normali possono dipendere da outlier, eteroschedasticità, forma funzionale sbagliata, variabili omesse o code effettivamente non gaussiane.

Limiti

Il test è asintotico. Con campioni piccoli può avere livello non accurato e bassa potenza. Con campioni molto grandi può rifiutare per deviazioni minime e tecnicamente irrilevanti. La significatività statistica deve quindi essere letta insieme a grafici quantile-quantile, istogrammi, residui e conoscenza del dominio.

Inoltre Jarque-Bera guarda solo due aspetti della distribuzione: asimmetria e curtosi. Una distribuzione può avere asimmetria e curtosi simili alla normale ma differire per altre caratteristiche.

Interpretazione operativa

Se il test non rifiuta, non significa che i dati siano certamente normali: significa che non è emersa evidenza sufficiente contro la normalità rispetto alla potenza del test e alla numerosità disponibile. Se il test rifiuta, non significa che ogni metodo parametrico sia inutilizzabile: bisogna valutare robustezza, obiettivo dell’analisi e sensibilità dei risultati.

Nei modelli lineari, per esempio, la normalità è più importante per inferenza esatta su piccoli campioni che per la stima dei coefficienti in sé. In grandi campioni, approssimazioni asintotiche e errori standard robusti possono essere più rilevanti della normalità stretta.

Errori comuni

Un errore frequente è usare Jarque-Bera come unico controllo diagnostico. Un test numerico non sostituisce l’ispezione dei dati. Un secondo errore è testare la normalità dei dati grezzi quando l’ipotesi del modello riguarda i residui.

Jarque-Bera è utile come campanello d’allarme rapido, soprattutto in econometria e controllo statistico, ma va interpretato come parte di una diagnostica più ampia.