Teorema di Cramér-Wold

Indice dei contenuti

    Il teorema di Cramér-Wold è un criterio fondamentale per riconoscere la convergenza congiunta di vettori aleatori. L’idea è che la distribuzione di un vettore in \mathbb R^d è determinata da tutte le sue proiezioni lineari unidimensionali.

    Se \mathbf X è un vettore aleatorio e a\in\mathbb R^d, la proiezione lineare

    a^T\mathbf X

    è una variabile aleatoria reale. Il teorema afferma che, per controllare la convergenza in distribuzione di \mathbf X_n, è sufficiente controllare la convergenza in distribuzione di tutte queste proiezioni.

    Enunciato

    Siano \mathbf X_n e \mathbf X vettori aleatori in \mathbb R^d. Allora

    \mathbf X_n\xrightarrow{d}\mathbf X

    se e solo se, per ogni vettore a\in\mathbb R^d,

    a^T\mathbf X_n\xrightarrow{d}a^T\mathbf X.

    In altre parole, la convergenza congiunta è equivalente alla convergenza in distribuzione di ogni combinazione lineare delle componenti.

    Tavola di lettura

    OggettoFormulaSignificato
    Vettore aleatorio\displaystyle \mathbf X_n=(X_{n,1},\ldots,X_{n,d})Contiene le componenti da studiare congiuntamente.
    Proiezione lineare\displaystyle a^T\mathbf X_n=\sum_{j=1}^d a_jX_{n,j}Riduce il problema multivariato a una variabile reale.
    Criterio di convergenza\displaystyle a^T\mathbf X_n\xrightarrow{d}a^T\mathbf X\quad\forall a\in\mathbb R^dEquivale a \displaystyle \mathbf X_n\xrightarrow{d}\mathbf X.
    Caso normale\displaystyle a^T\mathbf X\sim\mathcal N(a^T\mu,a^T\Sigma a)Identifica la normale multivariata tramite proiezioni gaussiane.

    Schema operativo

    Il teorema è utile quando il vettore limite è difficile da trattare direttamente, ma le combinazioni lineari sono gestibili.

    PassoOperazioneControllo
    1Fissare un vettore deterministico \displaystyle a\in\mathbb R^dNon scegliere solo gli assi canonici.
    2Studiare la variabile reale \displaystyle a^T\mathbf X_nApplicare strumenti univariati: funzioni caratteristiche, TLC, Slutsky.
    3Trovare il limite \displaystyle a^T\mathbf XIl limite deve valere per ogni \displaystyle a.
    4Concludere la convergenza congiuntaOttenere \displaystyle \mathbf X_n\xrightarrow{d}\mathbf X.

    Controllare solo le singole componenti equivale a usare i vettori canonici e_1,\ldots,e_d. Cramér-Wold richiede tutte le direzioni a, perché la dipendenza tra componenti può essere visibile solo lungo combinazioni lineari non coordinate.

    Esempio: limite normale multivariato

    Supponiamo di voler dimostrare che

    \mathbf X_n\xrightarrow{d}\mathcal N_d(\mu,\Sigma).

    Per Cramér-Wold è sufficiente mostrare che, per ogni a\in\mathbb R^d,

    a^T\mathbf X_n \xrightarrow{d} \mathcal N(a^T\mu,a^T\Sigma a).

    Questo è spesso più semplice, perché a^T\mathbf X_n è una statistica reale. Nei teoremi limite multivariati si dimostra quindi un teorema del limite centrale per ogni combinazione lineare e poi si ricostruisce il limite vettoriale.

    Perché le marginali non bastano

    La convergenza delle singole componenti

    X_{n,j}\xrightarrow{d}X_j \qquad j=1,\ldots,d

    non determina la distribuzione congiunta del vettore. Mancano le informazioni sulla dipendenza asintotica.

    Il criterio di Cramér-Wold aggiunge esattamente ciò che serve: le proiezioni a^T\mathbf X_n vedono covarianze, correlazioni e dipendenze lineari tra componenti. Nel caso gaussiano, ad esempio,

    \operatorname{Var}(a^T\mathbf X)=a^T\Sigma a

    contiene tutti i termini della matrice di covarianza \Sigma, non solo le varianze marginali.

    Collegamento con funzioni caratteristiche

    Il teorema è strettamente legato alle funzioni caratteristiche. La funzione caratteristica multivariata di \mathbf X è

    \varphi_{\mathbf X}(t)=\mathbb E[e^{it^T\mathbf X}], \qquad t\in\mathbb R^d.

    Ma \varphi_{\mathbf X}(t) è proprio la funzione caratteristica della variabile reale t^T\mathbf X. Per questo controllare tutte le proiezioni equivale a controllare tutta la funzione caratteristica multivariata.

    Errori comuni

    • Controllare solo le marginali: verificare X_{n,j}\xrightarrow{d}X_j per ogni componente non basta per ottenere la convergenza congiunta.
    • Usare poche direzioni arbitrarie: il criterio richiede ogni a\in\mathbb R^d, non un sottoinsieme finito scelto a mano.
    • Dimenticare la dipendenza limite: due vettori possono avere le stesse marginali ma covarianze o dipendenze diverse.
    • Confondere il caso normale con il caso generale: per vettori gaussiani media e covarianza determinano tutto; fuori dal caso gaussiano servono le distribuzioni di tutte le proiezioni.

    Vedi anche: convergenza congiunta, normale multivariata, funzione caratteristica multivariata, funzione caratteristica, teorema di continuità di Lévy, teorema portmanteau.

    Pubblicato: