Vettori aleatori e covarianza: esercizi svolti

Quando si studiano due o più variabili aleatorie insieme, la loro relazione è descritta dalla distribuzione congiunta. Da essa si ricavano le marginali, si verifica l’indipendenza e si misura il legame lineare tramite covarianza e correlazione. Questa scheda allena il passaggio congiunta → marginali e il calcolo dei legami.

1. Distribuzione congiunta discreta e marginali

Esercizio. Due variabili $X,Y\in\{0,1\}$ hanno congiunta $p(0,0)=0{,}3$ , $p(0,1)=0{,}2$ , $p(1,0)=0{,}1$ , $p(1,1)=0{,}4$ . Trovare le marginali di $X$ .

La marginale si ottiene sommando sull’altra variabile:

$p_X(0)=p(0,0)+p(0,1)=0{,}3+0{,}2=0{,}5,$ $p_X(1)=p(1,0)+p(1,1)=0{,}1+0{,}4=0{,}5.$

“Marginalizzare” significa sommare via la variabile che non interessa. Verifica: $0{,}5+0{,}5=1$ . ✓

2. Verifica di indipendenza congiunta

Esercizio. Per la congiunta del punto 1, $X$ e $Y$ sono indipendenti?

Servono le marginali di $Y$ : $p_Y(0)=0{,}3+0{,}1=0{,}4$ , $p_Y(1)=0{,}2+0{,}4=0{,}6$ .

L’indipendenza richiede $p(x,y)=p_X(x)\,p_Y(y)$ per ogni coppia. Test su $(0,0)$ :

$p_X(0)p_Y(0)=0{,}5\times0{,}4=0{,}20\ne0{,}30=p(0,0).$

Non sono indipendenti: la congiunta non si fattorizza nelle marginali.

3. Covarianza

Esercizio. Calcolare $\operatorname{Cov}(X,Y)$ per la congiunta del punto 1.

Passo 1 — valori attesi: $E[X]=0\cdot0{,}5+1\cdot0{,}5=0{,}5$ ; $E[Y]=0\cdot0{,}4+1\cdot0{,}6=0{,}6$ .

Passo 2 — $E[XY]$ (solo il termine $(1,1)$ contribuisce):

$E[XY]=1\cdot1\cdot p(1,1)=0{,}4.$

Passo 3 — covarianza:

$\operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0{,}4-0{,}5\times0{,}6=0{,}4-0{,}3=0{,}10.$

Covarianza positiva: $X$ e $Y$ tendono a crescere insieme. Il valore $0{,}1\ne0$ conferma la dipendenza già vista al punto 2.

4. Coefficiente di correlazione

Esercizio. Per le stesse variabili, calcolare il coefficiente di correlazione $\rho$ .

Passo 1 — varianze (variabili di Bernoulli, $\operatorname{Var}=p(1-p)$ ):

$\operatorname{Var}(X)=0{,}5\times0{,}5=0{,}25,\qquad \operatorname{Var}(Y)=0{,}6\times0{,}4=0{,}24.$

Passo 2 — correlazione:

\begin{aligned} \rho&=\dfrac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y}\\ &=\dfrac{0{,}10}{\sqrt{0{,}25}\sqrt{0{,}24}}\\ &=\dfrac{0{,}10}{0{,}5\times0{,}490} =\dfrac{0{,}10}{0{,}245}\\ &=0{,}41. \end{aligned}

$\rho=0{,}41$ : correlazione positiva moderata. Il coefficiente è adimensionale e sempre in $[-1,1]$ , a differenza della covarianza.

5. Indipendenza implica covarianza nulla

Esercizio. Se $X$ e $Y$ sono indipendenti, quanto vale $\operatorname{Cov}(X,Y)$ ? Vale l’implicazione inversa?

Per variabili indipendenti $E[XY]=E[X]E[Y]$ , quindi:

$\operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0.$

L’implicazione inversa è falsa: covarianza nulla non implica indipendenza. La covarianza coglie solo il legame lineare; due variabili possono avere $\rho=0$ ma essere dipendenti in modo non lineare (es. $Y=X^2$ con $X$ simmetrica).

6. Densità congiunta continua e marginale

Esercizio. Densità congiunta $f(x,y)=x+y$ su $[0,1]\times[0,1]$ . Trovare la marginale $f_X(x)$ .

Si integra sull’altra variabile:

$f_X(x)=\int_0^1 (x+y)\,dy=\left[xy+\dfrac{y^2}{2}\right]_0^1=x+\dfrac{1}{2}.$

Per $0\le x\le1$ . Verifica normalizzazione:

\int_0^1\left(x+\dfrac{1}{2}\right)dx =\dfrac{1}{2}+\dfrac{1}{2} =1.

✓ La marginale continua si ottiene integrando, l’analogo continuo della somma discreta.

7. Valore atteso di una somma con covarianza

Esercizio. Per due variabili con $E[X]=2$ , $E[Y]=3$ , $\operatorname{Var}(X)=1$ , $\operatorname{Var}(Y)=4$ , $\operatorname{Cov}(X,Y)=-1$ , calcolare media e varianza di $S=X+Y$ .

$E[S]=E[X]+E[Y]=2+3=5.$

$\operatorname{Var}(S)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\operatorname{Cov}(X,Y)=1+4+2(-1)=3.$

La covarianza negativa riduce la varianza della somma (da 5 a 3): le due variabili si compensano. È il principio della diversificazione del rischio.

8. Distribuzione condizionata discreta

Esercizio. Per la congiunta del punto 1, calcolare $P(X=1\mid Y=1)$ .

Per definizione:

P(X=1\mid Y=1)=\dfrac{P(X=1,Y=1)}{P(Y=1)}.

Dalla tabella:

P(X=1,Y=1)=0{,}4,\qquad P(Y=1)=0{,}2+0{,}4=0{,}6.

Quindi

P(X=1\mid Y=1)=\dfrac{0{,}4}{0{,}6}=\dfrac{2}{3}.

La probabilità marginale di $X=1$ era $0{,}5$ ; sapere che $Y=1$ la porta a $2/3$ . Questo è un modo operativo per vedere la dipendenza.

9. Indipendenza continua

Esercizio. La densità congiunta $f(x,y)=x+y$ su $[0,1]^2$ del punto 6 descrive variabili indipendenti?

Abbiamo già trovato

f_X(x)=x+\dfrac{1}{2}.

Per simmetria:

f_Y(y)=y+\dfrac{1}{2}.

Se $X$ e $Y$ fossero indipendenti, dovrebbe valere

f(x,y)=f_X(x)f_Y(y) =\left(x+\dfrac{1}{2}\right)\left(y+\dfrac{1}{2}\right).

Ma, per esempio in $(0,0)$ :

f(0,0)=0, \qquad f_X(0)f_Y(0)=\dfrac{1}{2}\cdot\dfrac{1}{2}=\dfrac{1}{4}.

Non sono indipendenti. Nel caso continuo l’indipendenza si verifica fattorizzando la densità congiunta nelle marginali, non guardando solo il supporto.

10. Covarianza nulla ma dipendenza

Esercizio. Sia $X$ uniforme su $[-1,1]$ e $Y=X^2$ . Mostrare che $\operatorname{Cov}(X,Y)=0$ ma $X$ e $Y$ non sono indipendenti.

Per simmetria:

E[X]=0.

Inoltre

E[XY]=E[X^3].

La funzione $x^3$ è dispari e la distribuzione di $X$ è simmetrica su $[-1,1]$ , quindi

E[X^3]=0.

Pertanto

\operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0-0\cdot E[Y]=0.

Ma $Y$ è determinato da $X$ : se si conosce $X$ , si conosce esattamente $Y=X^2$ . Le variabili sono quindi dipendenti. La covarianza nulla esclude solo dipendenza lineare, non dipendenza funzionale non lineare.

11. Matrice di covarianza

Esercizio. Per un vettore aleatorio $(X,Y)$ con $\operatorname{Var}(X)=4$ , $\operatorname{Var}(Y)=9$ e $\rho=0{,}5$ , costruire la matrice di covarianza.

La correlazione è

\rho=\dfrac{\operatorname{Cov}(X,Y)}{\sigma_X\sigma_Y}.

Qui $\sigma_X=2$ e $\sigma_Y=3$ , quindi

\operatorname{Cov}(X,Y)=\rho\sigma_X\sigma_Y=0{,}5\cdot2\cdot3=3.

La matrice di covarianza è

\Sigma= \begin{pmatrix} \operatorname{Var}(X) & \operatorname{Cov}(X,Y)\\ \operatorname{Cov}(X,Y) & \operatorname{Var}(Y) \end{pmatrix} = \begin{pmatrix} 4&3\\ 3&9 \end{pmatrix}.

La matrice è simmetrica: la covarianza $\operatorname{Cov}(X,Y)$ coincide con $\operatorname{Cov}(Y,X)$ .

Errori comuni

Confondere congiunta e marginali. La marginale è la congiunta sommata/integrata sull’altra variabile; non si legge direttamente come una riga della tabella senza sommare.
Credere che covarianza nulla = indipendenza. Vale solo l’implicazione indipendenza ⇒ covarianza nulla, non il contrario.
Usare la covarianza per confrontare legami. La covarianza dipende dalle unità; per confrontare l’intensità del legame serve $\rho$ , normalizzato in $[-1,1]$ .
Dimenticare il termine $2\operatorname{Cov}$ . Nella varianza della somma di variabili dipendenti il doppio prodotto è essenziale: ometterlo dà varianze sbagliate.
Confondere condizionata e marginale. La condizionata divide per la probabilità dell’evento condizionante; non è una semplice riga non normalizzata.
Verificare indipendenza continua su un solo punto favorevole. Serve la fattorizzazione su tutto il supporto; un controesempio puntuale basta solo per negarla.