Vettori aleatori e covarianza: esercizi svolti

Indice dei contenuti

    Quando si studiano due o più variabili aleatorie insieme, la loro relazione è descritta dalla distribuzione congiunta. Da essa si ricavano le marginali, si verifica l’indipendenza e si misura il legame lineare tramite covarianza e correlazione. Questa scheda allena il passaggio congiunta → marginali e il calcolo dei legami.

    1. Distribuzione congiunta discreta e marginali

    Esercizio. Due variabili X,Y\in\{0,1\} hanno congiunta p(0,0)=0{,}3, p(0,1)=0{,}2, p(1,0)=0{,}1, p(1,1)=0{,}4. Trovare le marginali di X.

    La marginale si ottiene sommando sull’altra variabile:

    p_X(0)=p(0,0)+p(0,1)=0{,}3+0{,}2=0{,}5, p_X(1)=p(1,0)+p(1,1)=0{,}1+0{,}4=0{,}5.

    “Marginalizzare” significa sommare via la variabile che non interessa. Verifica: 0{,}5+0{,}5=1. ✓

    2. Verifica di indipendenza congiunta

    Esercizio. Per la congiunta del punto 1, X e Y sono indipendenti?

    Servono le marginali di Y: p_Y(0)=0{,}3+0{,}1=0{,}4, p_Y(1)=0{,}2+0{,}4=0{,}6.

    L’indipendenza richiede p(x,y)=p_X(x)\,p_Y(y) per ogni coppia. Test su (0,0):

    p_X(0)p_Y(0)=0{,}5\times0{,}4=0{,}20\ne0{,}30=p(0,0).

    Non sono indipendenti: la congiunta non si fattorizza nelle marginali.

    3. Covarianza

    Esercizio. Calcolare \operatorname{Cov}(X,Y) per la congiunta del punto 1.

    Passo 1 — valori attesi: E[X]=0\cdot0{,}5+1\cdot0{,}5=0{,}5; E[Y]=0\cdot0{,}4+1\cdot0{,}6=0{,}6.

    Passo 2 — E[XY] (solo il termine (1,1) contribuisce):

    E[XY]=1\cdot1\cdot p(1,1)=0{,}4.

    Passo 3 — covarianza:

    \operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0{,}4-0{,}5\times0{,}6=0{,}4-0{,}3=0{,}10.

    Covarianza positiva: X e Y tendono a crescere insieme. Il valore 0{,}1\ne0 conferma la dipendenza già vista al punto 2.

    4. Coefficiente di correlazione

    Esercizio. Per le stesse variabili, calcolare il coefficiente di correlazione \rho.

    Passo 1 — varianze (variabili di Bernoulli, \operatorname{Var}=p(1-p)):

    \operatorname{Var}(X)=0{,}5\times0{,}5=0{,}25,\qquad \operatorname{Var}(Y)=0{,}6\times0{,}4=0{,}24.

    Passo 2 — correlazione:

    \begin{aligned} \rho&=\dfrac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y}\\ &=\dfrac{0{,}10}{\sqrt{0{,}25}\sqrt{0{,}24}}\\ &=\dfrac{0{,}10}{0{,}5\times0{,}490} =\dfrac{0{,}10}{0{,}245}\\ &=0{,}41. \end{aligned}

    \rho=0{,}41: correlazione positiva moderata. Il coefficiente è adimensionale e sempre in [-1,1], a differenza della covarianza.

    5. Indipendenza implica covarianza nulla

    Esercizio. Se X e Y sono indipendenti, quanto vale \operatorname{Cov}(X,Y)? Vale l’implicazione inversa?

    Per variabili indipendenti E[XY]=E[X]E[Y], quindi:

    \operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0.

    L’implicazione inversa è falsa: covarianza nulla non implica indipendenza. La covarianza coglie solo il legame lineare; due variabili possono avere \rho=0 ma essere dipendenti in modo non lineare (es. Y=X^2 con X simmetrica).

    6. Densità congiunta continua e marginale

    Esercizio. Densità congiunta f(x,y)=x+y su [0,1]\times[0,1]. Trovare la marginale f_X(x).

    Si integra sull’altra variabile:

    f_X(x)=\int_0^1 (x+y)\,dy=\left[xy+\dfrac{y^2}{2}\right]_0^1=x+\dfrac{1}{2}.

    Per 0\le x\le1. Verifica normalizzazione:

    \int_0^1\left(x+\dfrac{1}{2}\right)dx =\dfrac{1}{2}+\dfrac{1}{2} =1.

    ✓ La marginale continua si ottiene integrando, l’analogo continuo della somma discreta.

    7. Valore atteso di una somma con covarianza

    Esercizio. Per due variabili con E[X]=2, E[Y]=3, \operatorname{Var}(X)=1, \operatorname{Var}(Y)=4, \operatorname{Cov}(X,Y)=-1, calcolare media e varianza di S=X+Y.

    E[S]=E[X]+E[Y]=2+3=5.

    \operatorname{Var}(S)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\operatorname{Cov}(X,Y)=1+4+2(-1)=3.

    La covarianza negativa riduce la varianza della somma (da 5 a 3): le due variabili si compensano. È il principio della diversificazione del rischio.

    8. Distribuzione condizionata discreta

    Esercizio. Per la congiunta del punto 1, calcolare P(X=1\mid Y=1).

    Per definizione:

    P(X=1\mid Y=1)=\dfrac{P(X=1,Y=1)}{P(Y=1)}.

    Dalla tabella:

    P(X=1,Y=1)=0{,}4,\qquad P(Y=1)=0{,}2+0{,}4=0{,}6.

    Quindi

    P(X=1\mid Y=1)=\dfrac{0{,}4}{0{,}6}=\dfrac{2}{3}.

    La probabilità marginale di X=1 era 0{,}5; sapere che Y=1 la porta a 2/3. Questo è un modo operativo per vedere la dipendenza.

    9. Indipendenza continua

    Esercizio. La densità congiunta f(x,y)=x+y su [0,1]^2 del punto 6 descrive variabili indipendenti?

    Abbiamo già trovato

    f_X(x)=x+\dfrac{1}{2}.

    Per simmetria:

    f_Y(y)=y+\dfrac{1}{2}.

    Se X e Y fossero indipendenti, dovrebbe valere

    f(x,y)=f_X(x)f_Y(y) =\left(x+\dfrac{1}{2}\right)\left(y+\dfrac{1}{2}\right).

    Ma, per esempio in (0,0):

    f(0,0)=0, \qquad f_X(0)f_Y(0)=\dfrac{1}{2}\cdot\dfrac{1}{2}=\dfrac{1}{4}.

    Non sono indipendenti. Nel caso continuo l’indipendenza si verifica fattorizzando la densità congiunta nelle marginali, non guardando solo il supporto.

    10. Covarianza nulla ma dipendenza

    Esercizio. Sia X uniforme su [-1,1] e Y=X^2. Mostrare che \operatorname{Cov}(X,Y)=0 ma X e Y non sono indipendenti.

    Per simmetria:

    E[X]=0.

    Inoltre

    E[XY]=E[X^3].

    La funzione x^3 è dispari e la distribuzione di X è simmetrica su [-1,1], quindi

    E[X^3]=0.

    Pertanto

    \operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0-0\cdot E[Y]=0.

    Ma Y è determinato da X: se si conosce X, si conosce esattamente Y=X^2. Le variabili sono quindi dipendenti. La covarianza nulla esclude solo dipendenza lineare, non dipendenza funzionale non lineare.

    11. Matrice di covarianza

    Esercizio. Per un vettore aleatorio (X,Y) con \operatorname{Var}(X)=4, \operatorname{Var}(Y)=9 e \rho=0{,}5, costruire la matrice di covarianza.

    La correlazione è

    \rho=\dfrac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y}.

    Qui \sigma_X=2 e \sigma_Y=3, quindi

    \operatorname{Cov}(X,Y)=\rho\sigma_X\sigma_Y=0{,}5\cdot2\cdot3=3.

    La matrice di covarianza è

    \Sigma= \begin{pmatrix} \operatorname{Var}(X) & \operatorname{Cov}(X,Y)\\ \operatorname{Cov}(X,Y) & \operatorname{Var}(Y) \end{pmatrix} = \begin{pmatrix} 4&3\\ 3&9 \end{pmatrix}.

    La matrice è simmetrica: la covarianza \operatorname{Cov}(X,Y) coincide con \operatorname{Cov}(Y,X).

    Errori comuni

    • Confondere congiunta e marginali. La marginale è la congiunta sommata/integrata sull’altra variabile; non si legge direttamente come una riga della tabella senza sommare.
    • Credere che covarianza nulla = indipendenza. Vale solo l’implicazione indipendenza ⇒ covarianza nulla, non il contrario.
    • Usare la covarianza per confrontare legami. La covarianza dipende dalle unità; per confrontare l’intensità del legame serve \rho, normalizzato in [-1,1].
    • Dimenticare il termine 2\operatorname{Cov}. Nella varianza della somma di variabili dipendenti il doppio prodotto è essenziale: ometterlo dà varianze sbagliate.
    • Confondere condizionata e marginale. La condizionata divide per la probabilità dell’evento condizionante; non è una semplice riga non normalizzata.
    • Verificare indipendenza continua su un solo punto favorevole. Serve la fattorizzazione su tutto il supporto; un controesempio puntuale basta solo per negarla.

    Ultimo aggiornamento: