Teorema di Berry-Esseen

Indice dei contenuti

    Il teorema di Berry-Esseen è una versione quantitativa del teorema del limite centrale: non si limita a dire che la somma standardizzata tende a una normale, ma fornisce un limite superiore all’errore di approssimazione. È quindi uno strumento utile quando si vuole capire se il numero di osservazioni disponibili è abbastanza grande per usare un modello normale in modo ragionevole.

    La differenza rispetto al normale teorema del limite centrale è operativa: il TLC dà una convergenza asintotica, mentre Berry-Esseen dice con quale ordine l’errore si riduce al crescere di n.

    Enunciato per variabili indipendenti e identicamente distribuite

    Siano X_1,\ldots,X_n variabili aleatorie indipendenti e identicamente distribuite, con media \mu, varianza \sigma^2>0 e terzo momento assoluto centrale finito:

    \rho=E\!\left[|X_1-\mu|^3\right]<\infty.

    Definendo la somma standardizzata

    Z_n=\dfrac{\sum_{i=1}^{n}(X_i-\mu)}{\sigma\sqrt n},

    il teorema afferma che esiste una costante universale C tale che

    \sup_{x\in\mathbb{R}} \left|P(Z_n\le x)-\Phi(x)\right| \le \dfrac{C\,\rho}{\sigma^3\sqrt n}.

    Qui \Phi è la funzione di ripartizione della normale standard. Il membro sinistro misura la massima distanza verticale tra la distribuzione effettiva di Z_n e la normale standard: è una distanza uniforme tra funzioni di ripartizione.

    Significato della stima

    La quantità

    \dfrac{\rho}{\sigma^3}

    è adimensionale e misura quanto la distribuzione di partenza può essere lontana da una forma simmetrica e regolare. Se le code sono pesanti o la distribuzione è molto asimmetrica, il terzo momento assoluto centrale può essere grande e l’approssimazione normale richiede campioni più numerosi.

    Il fattore decisivo è comunque

    \dfrac{1}{\sqrt n}.

    Il teorema dice che, sotto le ipotesi indicate, l’errore normale non decresce più lentamente dell’ordine O(n^{-1/2}). Questo ordine è importante in statistica applicata: raddoppiare la precisione dell’approssimazione richiede, in prima approssimazione, quadruplicare la numerosità campionaria.

    Uso in statistica e ingegneria

    Il risultato compare quando si usano intervalli normali, test asintotici, somme di errori indipendenti, rumore aggregato o medie campionarie. In una catena di misura, per esempio, Berry-Esseen aiuta a distinguere due situazioni diverse: una somma è teoricamente approssimabile con una normale, ma il campione disponibile può non essere ancora abbastanza grande perché l’errore sia trascurabile.

    La stima è anche un avvertimento contro un uso meccanico della normale. Se la distribuzione di base ha code molto pesanti e il terzo momento assoluto non esiste, questa forma del teorema non è applicabile. In quel caso la convergenza può essere più lenta, oppure può essere necessario usare modelli limite differenti.

    Errori comuni

    Un primo errore è leggere il teorema come una garanzia puntuale sulla densità. La disuguaglianza riguarda le funzioni di ripartizione, non la differenza tra densità.

    Un secondo errore è ignorare il rapporto \rho/\sigma^3. Due campioni con la stessa numerosità possono avere qualità di approssimazione molto diversa se le distribuzioni di partenza hanno asimmetria o code differenti.

    Infine, Berry-Esseen non sostituisce la verifica delle ipotesi: richiede indipendenza, stessa distribuzione nella forma classica e terzo momento assoluto finito. Quando queste condizioni non sono credibili, la normale può essere comunque utile come euristica, ma il controllo quantitativo fornito dal teorema non è più disponibile. Per un inquadramento più ampio, vedi anche il formulario di probabilità e gli esercizi sulle variabili aleatorie continue.

    Ultimo aggiornamento: