Teorema di Cramér-Wold — ingegnerismo.it

Il teorema di Cramér-Wold è un criterio fondamentale per riconoscere la convergenza congiunta di vettori aleatori. L’idea è che la distribuzione di un vettore in $\mathbb R^d$ è determinata da tutte le sue proiezioni lineari unidimensionali.

Se $\mathbf X$ è un vettore aleatorio e $a\in\mathbb R^d$ , la proiezione lineare

a^T\mathbf X

è una variabile aleatoria reale. Il teorema afferma che, per controllare la convergenza in distribuzione di $\mathbf X_n$ , è sufficiente controllare la convergenza in distribuzione di tutte queste proiezioni.

Enunciato

Siano $\mathbf X_n$ e $\mathbf X$ vettori aleatori in $\mathbb R^d$ . Allora

\mathbf X_n\xrightarrow{d}\mathbf X

se e solo se, per ogni vettore $a\in\mathbb R^d$ ,

a^T\mathbf X_n\xrightarrow{d}a^T\mathbf X.

In altre parole, la convergenza congiunta è equivalente alla convergenza in distribuzione di ogni combinazione lineare delle componenti.

Tavola di lettura

Oggetto	Formula	Significato
Vettore aleatorio	$\displaystyle \mathbf X_n=(X_{n,1},\ldots,X_{n,d})$	Contiene le componenti da studiare congiuntamente.
Proiezione lineare	$\displaystyle a^T\mathbf X_n=\sum_{j=1}^d a_jX_{n,j}$	Riduce il problema multivariato a una variabile reale.
Criterio di convergenza	$\displaystyle a^T\mathbf X_n\xrightarrow{d}a^T\mathbf X\quad\forall a\in\mathbb R^d$	Equivale a $\displaystyle \mathbf X_n\xrightarrow{d}\mathbf X$ .
Caso normale	$\displaystyle a^T\mathbf X\sim\mathcal N(a^T\mu,a^T\Sigma a)$	Identifica la normale multivariata tramite proiezioni gaussiane.

Schema operativo

Il teorema è utile quando il vettore limite è difficile da trattare direttamente, ma le combinazioni lineari sono gestibili.

Passo	Operazione	Controllo
1	Fissare un vettore deterministico $\displaystyle a\in\mathbb R^d$	Non scegliere solo gli assi canonici.
2	Studiare la variabile reale $\displaystyle a^T\mathbf X_n$	Applicare strumenti univariati: funzioni caratteristiche, TLC, Slutsky.
3	Trovare il limite $\displaystyle a^T\mathbf X$	Il limite deve valere per ogni $\displaystyle a$ .
4	Concludere la convergenza congiunta	Ottenere $\displaystyle \mathbf X_n\xrightarrow{d}\mathbf X$ .

Controllare solo le singole componenti equivale a usare i vettori canonici $e_1,\ldots,e_d$ . Cramér-Wold richiede tutte le direzioni $a$ , perché la dipendenza tra componenti può essere visibile solo lungo combinazioni lineari non coordinate.

Esempio: limite normale multivariato

Supponiamo di voler dimostrare che

\mathbf X_n\xrightarrow{d}\mathcal N_d(\mu,\Sigma).

Per Cramér-Wold è sufficiente mostrare che, per ogni $a\in\mathbb R^d$ ,

a^T\mathbf X_n \xrightarrow{d} \mathcal N(a^T\mu,a^T\Sigma a).

Questo è spesso più semplice, perché $a^T\mathbf X_n$ è una statistica reale. Nei teoremi limite multivariati si dimostra quindi un teorema del limite centrale per ogni combinazione lineare e poi si ricostruisce il limite vettoriale.

Perché le marginali non bastano

La convergenza delle singole componenti

X_{n,j}\xrightarrow{d}X_j \qquad j=1,\ldots,d

non determina la distribuzione congiunta del vettore. Mancano le informazioni sulla dipendenza asintotica.

Il criterio di Cramér-Wold aggiunge esattamente ciò che serve: le proiezioni $a^T\mathbf X_n$ vedono covarianze, correlazioni e dipendenze lineari tra componenti. Nel caso gaussiano, ad esempio,

\operatorname{Var}(a^T\mathbf X)=a^T\Sigma a

contiene tutti i termini della matrice di covarianza $\Sigma$ , non solo le varianze marginali.

Collegamento con funzioni caratteristiche

Il teorema è strettamente legato alle funzioni caratteristiche. La funzione caratteristica multivariata di $\mathbf X$ è

\varphi_{\mathbf X}(t)=\mathbb E[e^{it^T\mathbf X}], \qquad t\in\mathbb R^d.

Ma $\varphi_{\mathbf X}(t)$ è proprio la funzione caratteristica della variabile reale $t^T\mathbf X$ . Per questo controllare tutte le proiezioni equivale a controllare tutta la funzione caratteristica multivariata.

Errori comuni

Controllare solo le marginali: verificare $X_{n,j}\xrightarrow{d}X_j$ per ogni componente non basta per ottenere la convergenza congiunta.
Usare poche direzioni arbitrarie: il criterio richiede ogni $a\in\mathbb R^d$ , non un sottoinsieme finito scelto a mano.
Dimenticare la dipendenza limite: due vettori possono avere le stesse marginali ma covarianze o dipendenze diverse.
Confondere il caso normale con il caso generale: per vettori gaussiani media e covarianza determinano tutto; fuori dal caso gaussiano servono le distribuzioni di tutte le proiezioni.

Vedi anche: convergenza congiunta, normale multivariata, funzione caratteristica multivariata, funzione caratteristica, teorema di continuità di Lévy, teorema portmanteau.