Variabili aleatorie discrete: esercizi svolti

Una variabile aleatoria discreta assume valori numerabili, ciascuno con una probabilità data dalla funzione di massa $p(x)=P(X=x)$ . Da essa si ricavano funzione di ripartizione, valore atteso e varianza, che riassumono il comportamento della variabile. Questa scheda allena la manipolazione di queste grandezze.

Vincoli della funzione di massa:

p(x)\ge0, \qquad \sum_x p(x)=1.

1. Normalizzazione di una funzione di massa

Esercizio. Una variabile $X$ assume i valori $1,2,3$ con $p(x)=c\,x$ . Trovare $c$ .

Imponendo la somma unitaria:

$\sum_x p(x)=c(1+2+3)=6c=1\ \Rightarrow\ c=\dfrac{1}{6}.$

Quindi $p(1)=1/6$ , $p(2)=2/6$ , $p(3)=3/6$ . La costante di normalizzazione si trova sempre dalla condizione $\displaystyle \sum p=1$ .

2. Funzione di ripartizione

Esercizio. Per la $X$ del punto 1, calcolare $F(x)=P(X\le x)$ e usarla per $P(X\le2)$ .

La ripartizione cumula le masse:

$F(x)=\begin{cases}0 & x<1\\ 1/6 & 1\le x<2\\ 3/6 & 2\le x<3\\ 1 & x\ge3\end{cases}$

$P(X\le2)=F(2)=\dfrac{1}{6}+\dfrac{2}{6}=\dfrac{3}{6}=0{,}5.$

La ripartizione di una discreta è una funzione a gradini, costante tra i valori e con salti pari alle masse.

3. Valore atteso

Esercizio. Calcolare il valore atteso di $X$ (punto 1).

$E[X]=\sum_x x\,p(x)=1\cdot\dfrac{1}{6}+2\cdot\dfrac{2}{6}+3\cdot\dfrac{3}{6}=\dfrac{1+4+9}{6}=\dfrac{14}{6}=2{,}33.$

Il valore atteso è la media pesata dai valori, baricentro della distribuzione. Non deve coincidere con un valore assunto da $X$ .

4. Varianza con la formula operativa

Esercizio. Calcolare la varianza di $X$ (punto 1).

Passo 1 — momento secondo:

$E[X^2]=1^2\cdot\dfrac{1}{6}+2^2\cdot\dfrac{2}{6}+3^2\cdot\dfrac{3}{6}=\dfrac{1+8+27}{6}=\dfrac{36}{6}=6.$

Passo 2 — varianza (formula $E[X^2]-E[X]^2$ ):

$\operatorname{Var}(X)=6-(2{,}33)^2=6-5{,}44=0{,}56.$

La formula operativa $E[X^2]-E[X]^2$ evita di calcolare gli scarti uno a uno. Deviazione standard: $\sigma=\sqrt{0{,}56}=0{,}75$ .

5. Valore atteso di una funzione

Esercizio. Per la $X$ del punto 1, calcolare $E[2X+1]$ .

Per la linearità del valore atteso:

$E[2X+1]=2E[X]+1=2\times2{,}33+1=5{,}67.$

La linearità vale sempre, anche senza indipendenza. Attenzione: la stessa proprietà non vale per funzioni non lineari, dove serve $\displaystyle E[g(X)]=\sum g(x)p(x)$ .

6. Valore atteso di una funzione non lineare

Esercizio. Per la stessa $X$ , calcolare $E[X^2]$ e confrontarlo con $E[X]^2$ .

Già calcolato: $E[X^2]=6$ , mentre $E[X]^2=(2{,}33)^2=5{,}44$ .

$E[X^2]=6\ne5{,}44=E[X]^2.$

In generale $E[g(X)]\ne g(E[X])$ : la differenza $E[X^2]-E[X]^2$ è proprio la varianza, sempre $\ge0$ (disuguaglianza di Jensen per $g$ convessa).

7. Gioco equo e valore atteso

Esercizio. In un gioco si paga 2 € per lanciare un dado e si riceve un importo pari al numero uscito (in €). Il gioco è conveniente?

Passo 1 — vincita attesa (dado equo):

$E[\text{vincita}]=\dfrac{1}{6}(1+2+3+4+5+6)=\dfrac{21}{6}=3{,}50.$

La vincita media è di 3,50 €.

Passo 2 — guadagno netto atteso:

$E[\text{netto}]=3{,}50-2{,}00=+1{,}50.$

Il guadagno netto atteso è +1,50 €.

Il gioco è conveniente per il giocatore: in media guadagna $1{,}50$ € a partita. Un gioco è equo quando il guadagno netto atteso è zero.

8. Distribuzione di una funzione non iniettiva

Esercizio. Sia $X$ uniforme su $\{-2,-1,0,1,2\}$ e sia $Y=X^2$ . Trovare la distribuzione di $Y$ .

I valori possibili di $Y$ sono $0,1,4$ . Poiché $X$ è uniforme, ogni valore di $X$ ha probabilità $1/5$ .

Raggruppiamo i valori di $X$ che producono lo stesso valore di $Y$ :

Y=0 \Longleftrightarrow X=0,

Y=1 \Longleftrightarrow X=-1\ \text{oppure}\ X=1,

Y=4 \Longleftrightarrow X=-2\ \text{oppure}\ X=2.

Quindi

P(Y=0)=\dfrac{1}{5},\qquad P(Y=1)=\dfrac{2}{5},\qquad P(Y=4)=\dfrac{2}{5}.

Quando la funzione non è iniettiva, bisogna sommare le probabilità di tutti i valori originari che confluiscono nello stesso risultato.

9. Somma di variabili indipendenti: convoluzione

Esercizio. Si lanciano due monete eque. Sia $X$ il numero di teste nella prima moneta e $Y$ nella seconda. Trovare la distribuzione di $S=X+Y$ .

Le variabili $X$ e $Y$ sono Bernoulli indipendenti con $P(1)=P(0)=1/2$ . La somma può valere $0,1,2$ .

P(S=0)=P(X=0,Y=0)=\dfrac{1}{2}\cdot\dfrac{1}{2}=\dfrac{1}{4}.

P(S=1)=P(X=1,Y=0)+P(X=0,Y=1) =\dfrac{1}{4}+\dfrac{1}{4}=\dfrac{1}{2}.

P(S=2)=P(X=1,Y=1)=\dfrac{1}{4}.

Quindi

S\sim B(2,1/2).

Questo è il caso più semplice di convoluzione discreta: le probabilità della somma si ottengono sommando tutti i modi compatibili con quel totale.

10. Valore atteso condizionato discreto

Esercizio. Una variabile $X$ assume $0,1,2$ con probabilità $0{,}2,\ 0{,}5,\ 0{,}3$ . Calcolare $E[X\mid X\ge1]$ .

Prima normalizziamo sull’evento condizionante:

P(X\ge1)=0{,}5+0{,}3=0{,}8.

Le probabilità condizionate sono

P(X=1\mid X\ge1)=\dfrac{0{,}5}{0{,}8}=0{,}625,

P(X=2\mid X\ge1)=\dfrac{0{,}3}{0{,}8}=0{,}375.

Quindi

E[X\mid X\ge1] =1\cdot0{,}625+2\cdot0{,}375 =1{,}375.

La media condizionata si calcola dopo aver rinormalizzato le probabilità sull’evento osservato.

Errori comuni

Funzione di massa non normalizzata. Dimenticare di imporre $\displaystyle \sum p=1$ lascia una costante indeterminata: il primo passo è sempre la normalizzazione.
Confondere $E[X^2]$ con $E[X]^2$ . Sono diversi e la loro differenza è la varianza; scambiarli dà varianze negative o nulle.
Applicare la linearità a funzioni non lineari. $E[g(X)]=g(E[X])$ è falso in generale; vale solo per $g$ affine ( $aX+b$ ).
Leggere male la ripartizione discreta. $F(x)=P(X\le x)$ include l’estremo; ai punti di salto il valore è quello “dopo” il gradino.
Non raggruppare gli esiti nelle trasformazioni. Se più valori di $X$ danno lo stesso $g(X)$ , le probabilità vanno sommate.
Dimenticare la normalizzazione condizionata. Dopo aver condizionato, le probabilità sull’evento devono sommare a $1$ .