Il test Jarque-Bera verifica la normalità usando asimmetria e curtosi campionarie. La statistica è:
dove g_1 è l’asimmetria e g_2 l’eccesso di curtosi.
Sotto normalità e per campioni grandi, JB ha distribuzione approssimata \chi^2_2. Il test è semplice e utile per diagnosticare code pesanti o asimmetria, ma è asintotico e può essere poco affidabile su campioni piccoli.
Asimmetria e curtosi
La distribuzione normale ha asimmetria nulla ed eccesso di curtosi nullo. Il test Jarque-Bera misura quanto le corrispondenti statistiche campionarie si allontanano da questi valori.
Indicando con m_r il momento centrale campionario di ordine r,
si definisce spesso
Qui g_1 misura l’asimmetria statistica e g_2 l’eccesso di curtosi rispetto alla normale.
Statistica del test
La statistica Jarque-Bera è
Il termine g_1^2 penalizza deviazioni simmetriche in positivo o negativo dall’asimmetria nulla. Il termine g_2^2/4 penalizza code troppo pesanti o troppo leggere rispetto alla normale.
Sotto l’ipotesi nulla di normalità e per campioni grandi,
Il p-value si calcola quindi sulla coda superiore della distribuzione chi-quadro con due gradi di libertà.
Ipotesi nulla e alternativa
L’ipotesi nulla è che i dati provengano da una distribuzione normale, almeno rispetto alle caratteristiche di asimmetria e curtosi catturate dal test. L’alternativa è generica: il test può rifiutare per asimmetria, code pesanti, code leggere o combinazioni di questi effetti.
Non indica quale modello alternativo sia corretto. Un rifiuto suggerisce che l’ipotesi di normalità è sospetta, ma richiede diagnostica aggiuntiva.
Uso sui residui
Jarque-Bera è spesso applicato ai residui di una regressione o di un modello di serie storiche. In quel caso non si sta testando la normalità della variabile osservata, ma la normalità degli errori dopo aver rimosso la struttura modellata.
Questa distinzione è importante: residui non normali possono dipendere da outlier, eteroschedasticità, forma funzionale sbagliata, variabili omesse o code effettivamente non gaussiane.
Limiti
Il test è asintotico. Con campioni piccoli può avere livello non accurato e bassa potenza. Con campioni molto grandi può rifiutare per deviazioni minime e tecnicamente irrilevanti. La significatività statistica deve quindi essere letta insieme a grafici quantile-quantile, istogrammi, residui e conoscenza del dominio.
Inoltre Jarque-Bera guarda solo due aspetti della distribuzione: asimmetria e curtosi. Una distribuzione può avere asimmetria e curtosi simili alla normale ma differire per altre caratteristiche.
Interpretazione operativa
Se il test non rifiuta, non significa che i dati siano certamente normali: significa che non è emersa evidenza sufficiente contro la normalità rispetto alla potenza del test e alla numerosità disponibile. Se il test rifiuta, non significa che ogni metodo parametrico sia inutilizzabile: bisogna valutare robustezza, obiettivo dell’analisi e sensibilità dei risultati.
Nei modelli lineari, per esempio, la normalità è più importante per inferenza esatta su piccoli campioni che per la stima dei coefficienti in sé. In grandi campioni, approssimazioni asintotiche e errori standard robusti possono essere più rilevanti della normalità stretta.
Errori comuni
Un errore frequente è usare Jarque-Bera come unico controllo diagnostico. Un test numerico non sostituisce l’ispezione dei dati. Un secondo errore è testare la normalità dei dati grezzi quando l’ipotesi del modello riguarda i residui.
Jarque-Bera è utile come campanello d’allarme rapido, soprattutto in econometria e controllo statistico, ma va interpretato come parte di una diagnostica più ampia.