Teorema di Berry-Esseen — ingegnerismo.it

Il teorema di Berry-Esseen è una versione quantitativa del teorema del limite centrale: non si limita a dire che la somma standardizzata tende a una normale, ma fornisce un limite superiore all’errore di approssimazione. È quindi uno strumento utile quando si vuole capire se il numero di osservazioni disponibili è abbastanza grande per usare un modello normale in modo ragionevole.

La differenza rispetto al normale teorema del limite centrale è operativa: il TLC dà una convergenza asintotica, mentre Berry-Esseen dice con quale ordine l’errore si riduce al crescere di $n$ .

Enunciato per variabili indipendenti e identicamente distribuite

Siano $X_1,\ldots,X_n$ variabili aleatorie indipendenti e identicamente distribuite, con media $\mu$ , varianza $\sigma^2>0$ e terzo momento assoluto centrale finito:

\rho=E\!\left[|X_1-\mu|^3\right]<\infty.

Definendo la somma standardizzata

Z_n=\dfrac{\sum_{i=1}^{n}(X_i-\mu)}{\sigma\sqrt n},

il teorema afferma che esiste una costante universale $C$ tale che

\sup_{x\in\mathbb{R}} \left|P(Z_n\le x)-\Phi(x)\right| \le \dfrac{C\,\rho}{\sigma^3\sqrt n}.

Qui $\Phi$ è la funzione di ripartizione della normale standard. Il membro sinistro misura la massima distanza verticale tra la distribuzione effettiva di $Z_n$ e la normale standard: è una distanza uniforme tra funzioni di ripartizione.

Significato della stima

La quantità

\dfrac{\rho}{\sigma^3}

è adimensionale e misura quanto la distribuzione di partenza può essere lontana da una forma simmetrica e regolare. Se le code sono pesanti o la distribuzione è molto asimmetrica, il terzo momento assoluto centrale può essere grande e l’approssimazione normale richiede campioni più numerosi.

Il fattore decisivo è comunque

\dfrac{1}{\sqrt n}.

Il teorema dice che, sotto le ipotesi indicate, l’errore normale non decresce più lentamente dell’ordine $O(n^{-1/2})$ . Questo ordine è importante in statistica applicata: raddoppiare la precisione dell’approssimazione richiede, in prima approssimazione, quadruplicare la numerosità campionaria.

Uso in statistica e ingegneria

Il risultato compare quando si usano intervalli normali, test asintotici, somme di errori indipendenti, rumore aggregato o medie campionarie. In una catena di misura, per esempio, Berry-Esseen aiuta a distinguere due situazioni diverse: una somma è teoricamente approssimabile con una normale, ma il campione disponibile può non essere ancora abbastanza grande perché l’errore sia trascurabile.

La stima è anche un avvertimento contro un uso meccanico della normale. Se la distribuzione di base ha code molto pesanti e il terzo momento assoluto non esiste, questa forma del teorema non è applicabile. In quel caso la convergenza può essere più lenta, oppure può essere necessario usare modelli limite differenti.

Errori comuni

Un primo errore è leggere il teorema come una garanzia puntuale sulla densità. La disuguaglianza riguarda le funzioni di ripartizione, non la differenza tra densità.

Un secondo errore è ignorare il rapporto $\rho/\sigma^3$ . Due campioni con la stessa numerosità possono avere qualità di approssimazione molto diversa se le distribuzioni di partenza hanno asimmetria o code differenti.

Infine, Berry-Esseen non sostituisce la verifica delle ipotesi: richiede indipendenza, stessa distribuzione nella forma classica e terzo momento assoluto finito. Quando queste condizioni non sono credibili, la normale può essere comunque utile come euristica, ma il controllo quantitativo fornito dal teorema non è più disponibile. Per un inquadramento più ampio, vedi anche il formulario di probabilità e gli esercizi sulle variabili aleatorie continue.