Quando si studiano due o più variabili aleatorie insieme, la loro relazione è descritta dalla distribuzione congiunta. Da essa si ricavano le marginali, si verifica l’indipendenza e si misura il legame lineare tramite covarianza e correlazione. Questa scheda allena il passaggio congiunta → marginali e il calcolo dei legami.
1. Distribuzione congiunta discreta e marginali
Esercizio. Due variabili X,Y\in\{0,1\} hanno congiunta p(0,0)=0{,}3, p(0,1)=0{,}2, p(1,0)=0{,}1, p(1,1)=0{,}4. Trovare le marginali di X.
La marginale si ottiene sommando sull’altra variabile:
p_X(0)=p(0,0)+p(0,1)=0{,}3+0{,}2=0{,}5, p_X(1)=p(1,0)+p(1,1)=0{,}1+0{,}4=0{,}5.
“Marginalizzare” significa sommare via la variabile che non interessa. Verifica: 0{,}5+0{,}5=1. ✓
2. Verifica di indipendenza congiunta
Esercizio. Per la congiunta del punto 1, X e Y sono indipendenti?
Servono le marginali di Y: p_Y(0)=0{,}3+0{,}1=0{,}4, p_Y(1)=0{,}2+0{,}4=0{,}6.
L’indipendenza richiede p(x,y)=p_X(x)\,p_Y(y) per ogni coppia. Test su (0,0):
p_X(0)p_Y(0)=0{,}5\times0{,}4=0{,}20\ne0{,}30=p(0,0).
Non sono indipendenti: la congiunta non si fattorizza nelle marginali.
3. Covarianza
Esercizio. Calcolare \operatorname{Cov}(X,Y) per la congiunta del punto 1.
Passo 1 — valori attesi: E[X]=0\cdot0{,}5+1\cdot0{,}5=0{,}5; E[Y]=0\cdot0{,}4+1\cdot0{,}6=0{,}6.
Passo 2 — E[XY] (solo il termine (1,1) contribuisce):
E[XY]=1\cdot1\cdot p(1,1)=0{,}4.
Passo 3 — covarianza:
\operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0{,}4-0{,}5\times0{,}6=0{,}4-0{,}3=0{,}10.
Covarianza positiva: X e Y tendono a crescere insieme. Il valore 0{,}1\ne0 conferma la dipendenza già vista al punto 2.
4. Coefficiente di correlazione
Esercizio. Per le stesse variabili, calcolare il coefficiente di correlazione \rho.
Passo 1 — varianze (variabili di Bernoulli, \operatorname{Var}=p(1-p)):
\operatorname{Var}(X)=0{,}5\times0{,}5=0{,}25,\qquad \operatorname{Var}(Y)=0{,}6\times0{,}4=0{,}24.
Passo 2 — correlazione:
\rho=0{,}41: correlazione positiva moderata. Il coefficiente è adimensionale e sempre in [-1,1], a differenza della covarianza.
5. Indipendenza implica covarianza nulla
Esercizio. Se X e Y sono indipendenti, quanto vale \operatorname{Cov}(X,Y)? Vale l’implicazione inversa?
Per variabili indipendenti E[XY]=E[X]E[Y], quindi:
\operatorname{Cov}(X,Y)=E[XY]-E[X]E[Y]=0.
L’implicazione inversa è falsa: covarianza nulla non implica indipendenza. La covarianza coglie solo il legame lineare; due variabili possono avere \rho=0 ma essere dipendenti in modo non lineare (es. Y=X^2 con X simmetrica).
6. Densità congiunta continua e marginale
Esercizio. Densità congiunta f(x,y)=x+y su [0,1]\times[0,1]. Trovare la marginale f_X(x).
Si integra sull’altra variabile:
f_X(x)=\int_0^1 (x+y)\,dy=\left[xy+\dfrac{y^2}{2}\right]_0^1=x+\dfrac{1}{2}.
Per 0\le x\le1. Verifica normalizzazione:
✓ La marginale continua si ottiene integrando, l’analogo continuo della somma discreta.
7. Valore atteso di una somma con covarianza
Esercizio. Per due variabili con E[X]=2, E[Y]=3, \operatorname{Var}(X)=1, \operatorname{Var}(Y)=4, \operatorname{Cov}(X,Y)=-1, calcolare media e varianza di S=X+Y.
E[S]=E[X]+E[Y]=2+3=5.
\operatorname{Var}(S)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\operatorname{Cov}(X,Y)=1+4+2(-1)=3.
La covarianza negativa riduce la varianza della somma (da 5 a 3): le due variabili si compensano. È il principio della diversificazione del rischio.
8. Distribuzione condizionata discreta
Esercizio. Per la congiunta del punto 1, calcolare P(X=1\mid Y=1).
Per definizione:
Dalla tabella:
Quindi
La probabilità marginale di X=1 era 0{,}5; sapere che Y=1 la porta a 2/3. Questo è un modo operativo per vedere la dipendenza.
9. Indipendenza continua
Esercizio. La densità congiunta f(x,y)=x+y su [0,1]^2 del punto 6 descrive variabili indipendenti?
Abbiamo già trovato
Per simmetria:
Se X e Y fossero indipendenti, dovrebbe valere
Ma, per esempio in (0,0):
Non sono indipendenti. Nel caso continuo l’indipendenza si verifica fattorizzando la densità congiunta nelle marginali, non guardando solo il supporto.
10. Covarianza nulla ma dipendenza
Esercizio. Sia X uniforme su [-1,1] e Y=X^2. Mostrare che \operatorname{Cov}(X,Y)=0 ma X e Y non sono indipendenti.
Per simmetria:
Inoltre
La funzione x^3 è dispari e la distribuzione di X è simmetrica su [-1,1], quindi
Pertanto
Ma Y è determinato da X: se si conosce X, si conosce esattamente Y=X^2. Le variabili sono quindi dipendenti. La covarianza nulla esclude solo dipendenza lineare, non dipendenza funzionale non lineare.
11. Matrice di covarianza
Esercizio. Per un vettore aleatorio (X,Y) con \operatorname{Var}(X)=4, \operatorname{Var}(Y)=9 e \rho=0{,}5, costruire la matrice di covarianza.
La correlazione è
Qui \sigma_X=2 e \sigma_Y=3, quindi
La matrice di covarianza è
La matrice è simmetrica: la covarianza \operatorname{Cov}(X,Y) coincide con \operatorname{Cov}(Y,X).
Errori comuni
- Confondere congiunta e marginali. La marginale è la congiunta sommata/integrata sull’altra variabile; non si legge direttamente come una riga della tabella senza sommare.
- Credere che covarianza nulla = indipendenza. Vale solo l’implicazione indipendenza ⇒ covarianza nulla, non il contrario.
- Usare la covarianza per confrontare legami. La covarianza dipende dalle unità; per confrontare l’intensità del legame serve \rho, normalizzato in [-1,1].
- Dimenticare il termine 2\operatorname{Cov}. Nella varianza della somma di variabili dipendenti il doppio prodotto è essenziale: ometterlo dà varianze sbagliate.
- Confondere condizionata e marginale. La condizionata divide per la probabilità dell’evento condizionante; non è una semplice riga non normalizzata.
- Verificare indipendenza continua su un solo punto favorevole. Serve la fattorizzazione su tutto il supporto; un controesempio puntuale basta solo per negarla.