Il teorema di Berry-Esseen è una versione quantitativa del teorema del limite centrale: non si limita a dire che la somma standardizzata tende a una normale, ma fornisce un limite superiore all’errore di approssimazione. È quindi uno strumento utile quando si vuole capire se il numero di osservazioni disponibili è abbastanza grande per usare un modello normale in modo ragionevole.
La differenza rispetto al normale teorema del limite centrale è operativa: il TLC dà una convergenza asintotica, mentre Berry-Esseen dice con quale ordine l’errore si riduce al crescere di n.
Enunciato per variabili indipendenti e identicamente distribuite
Siano X_1,\ldots,X_n variabili aleatorie indipendenti e identicamente distribuite, con media \mu, varianza \sigma^2>0 e terzo momento assoluto centrale finito:
Definendo la somma standardizzata
il teorema afferma che esiste una costante universale C tale che
Qui \Phi è la funzione di ripartizione della normale standard. Il membro sinistro misura la massima distanza verticale tra la distribuzione effettiva di Z_n e la normale standard: è una distanza uniforme tra funzioni di ripartizione.
Significato della stima
La quantità
è adimensionale e misura quanto la distribuzione di partenza può essere lontana da una forma simmetrica e regolare. Se le code sono pesanti o la distribuzione è molto asimmetrica, il terzo momento assoluto centrale può essere grande e l’approssimazione normale richiede campioni più numerosi.
Il fattore decisivo è comunque
Il teorema dice che, sotto le ipotesi indicate, l’errore normale non decresce più lentamente dell’ordine O(n^{-1/2}). Questo ordine è importante in statistica applicata: raddoppiare la precisione dell’approssimazione richiede, in prima approssimazione, quadruplicare la numerosità campionaria.
Uso in statistica e ingegneria
Il risultato compare quando si usano intervalli normali, test asintotici, somme di errori indipendenti, rumore aggregato o medie campionarie. In una catena di misura, per esempio, Berry-Esseen aiuta a distinguere due situazioni diverse: una somma è teoricamente approssimabile con una normale, ma il campione disponibile può non essere ancora abbastanza grande perché l’errore sia trascurabile.
La stima è anche un avvertimento contro un uso meccanico della normale. Se la distribuzione di base ha code molto pesanti e il terzo momento assoluto non esiste, questa forma del teorema non è applicabile. In quel caso la convergenza può essere più lenta, oppure può essere necessario usare modelli limite differenti.
Errori comuni
Un primo errore è leggere il teorema come una garanzia puntuale sulla densità. La disuguaglianza riguarda le funzioni di ripartizione, non la differenza tra densità.
Un secondo errore è ignorare il rapporto \rho/\sigma^3. Due campioni con la stessa numerosità possono avere qualità di approssimazione molto diversa se le distribuzioni di partenza hanno asimmetria o code differenti.
Infine, Berry-Esseen non sostituisce la verifica delle ipotesi: richiede indipendenza, stessa distribuzione nella forma classica e terzo momento assoluto finito. Quando queste condizioni non sono credibili, la normale può essere comunque utile come euristica, ma il controllo quantitativo fornito dal teorema non è più disponibile. Per un inquadramento più ampio, vedi anche il formulario di probabilità e gli esercizi sulle variabili aleatorie continue.