Una variabile aleatoria discreta assume valori numerabili, ciascuno con una probabilità data dalla funzione di massa p(x)=P(X=x). Da essa si ricavano funzione di ripartizione, valore atteso e varianza, che riassumono il comportamento della variabile. Questa scheda allena la manipolazione di queste grandezze.
Vincoli della funzione di massa:
1. Normalizzazione di una funzione di massa
Esercizio. Una variabile X assume i valori 1,2,3 con p(x)=c\,x. Trovare c.
Imponendo la somma unitaria:
\sum_x p(x)=c(1+2+3)=6c=1\ \Rightarrow\ c=\dfrac{1}{6}.
Quindi p(1)=1/6, p(2)=2/6, p(3)=3/6. La costante di normalizzazione si trova sempre dalla condizione \displaystyle \sum p=1.
2. Funzione di ripartizione
Esercizio. Per la X del punto 1, calcolare F(x)=P(X\le x) e usarla per P(X\le2).
La ripartizione cumula le masse:
F(x)=\begin{cases}0 & x<1\\ 1/6 & 1\le x<2\\ 3/6 & 2\le x<3\\ 1 & x\ge3\end{cases}
P(X\le2)=F(2)=\dfrac{1}{6}+\dfrac{2}{6}=\dfrac{3}{6}=0{,}5.
La ripartizione di una discreta è una funzione a gradini, costante tra i valori e con salti pari alle masse.
3. Valore atteso
Esercizio. Calcolare il valore atteso di X (punto 1).
E[X]=\sum_x x\,p(x)=1\cdot\dfrac{1}{6}+2\cdot\dfrac{2}{6}+3\cdot\dfrac{3}{6}=\dfrac{1+4+9}{6}=\dfrac{14}{6}=2{,}33.
Il valore atteso è la media pesata dai valori, baricentro della distribuzione. Non deve coincidere con un valore assunto da X.
4. Varianza con la formula operativa
Esercizio. Calcolare la varianza di X (punto 1).
Passo 1 — momento secondo:
E[X^2]=1^2\cdot\dfrac{1}{6}+2^2\cdot\dfrac{2}{6}+3^2\cdot\dfrac{3}{6}=\dfrac{1+8+27}{6}=\dfrac{36}{6}=6.
Passo 2 — varianza (formula E[X^2]-E[X]^2):
\operatorname{Var}(X)=6-(2{,}33)^2=6-5{,}44=0{,}56.
La formula operativa E[X^2]-E[X]^2 evita di calcolare gli scarti uno a uno. Deviazione standard: \sigma=\sqrt{0{,}56}=0{,}75.
5. Valore atteso di una funzione
Esercizio. Per la X del punto 1, calcolare E[2X+1].
Per la linearità del valore atteso:
E[2X+1]=2E[X]+1=2\times2{,}33+1=5{,}67.
La linearità vale sempre, anche senza indipendenza. Attenzione: la stessa proprietà non vale per funzioni non lineari, dove serve \displaystyle E[g(X)]=\sum g(x)p(x).
6. Valore atteso di una funzione non lineare
Esercizio. Per la stessa X, calcolare E[X^2] e confrontarlo con E[X]^2.
Già calcolato: E[X^2]=6, mentre E[X]^2=(2{,}33)^2=5{,}44.
E[X^2]=6\ne5{,}44=E[X]^2.
In generale E[g(X)]\ne g(E[X]): la differenza E[X^2]-E[X]^2 è proprio la varianza, sempre \ge0 (disuguaglianza di Jensen per g convessa).
7. Gioco equo e valore atteso
Esercizio. In un gioco si paga 2 € per lanciare un dado e si riceve un importo pari al numero uscito (in €). Il gioco è conveniente?
Passo 1 — vincita attesa (dado equo):
E[\text{vincita}]=\dfrac{1}{6}(1+2+3+4+5+6)=\dfrac{21}{6}=3{,}50.
La vincita media è di 3,50 €.
Passo 2 — guadagno netto atteso:
E[\text{netto}]=3{,}50-2{,}00=+1{,}50.
Il guadagno netto atteso è +1,50 €.
Il gioco è conveniente per il giocatore: in media guadagna 1{,}50 € a partita. Un gioco è equo quando il guadagno netto atteso è zero.
8. Distribuzione di una funzione non iniettiva
Esercizio. Sia X uniforme su \{-2,-1,0,1,2\} e sia Y=X^2. Trovare la distribuzione di Y.
I valori possibili di Y sono 0,1,4. Poiché X è uniforme, ogni valore di X ha probabilità 1/5.
Raggruppiamo i valori di X che producono lo stesso valore di Y:
Quindi
Quando la funzione non è iniettiva, bisogna sommare le probabilità di tutti i valori originari che confluiscono nello stesso risultato.
9. Somma di variabili indipendenti: convoluzione
Esercizio. Si lanciano due monete eque. Sia X il numero di teste nella prima moneta e Y nella seconda. Trovare la distribuzione di S=X+Y.
Le variabili X e Y sono Bernoulli indipendenti con P(1)=P(0)=1/2. La somma può valere 0,1,2.
Quindi
Questo è il caso più semplice di convoluzione discreta: le probabilità della somma si ottengono sommando tutti i modi compatibili con quel totale.
10. Valore atteso condizionato discreto
Esercizio. Una variabile X assume 0,1,2 con probabilità 0{,}2,\ 0{,}5,\ 0{,}3. Calcolare E[X\mid X\ge1].
Prima normalizziamo sull’evento condizionante:
Le probabilità condizionate sono
Quindi
La media condizionata si calcola dopo aver rinormalizzato le probabilità sull’evento osservato.
Errori comuni
- Funzione di massa non normalizzata. Dimenticare di imporre \displaystyle \sum p=1 lascia una costante indeterminata: il primo passo è sempre la normalizzazione.
- Confondere E[X^2] con E[X]^2. Sono diversi e la loro differenza è la varianza; scambiarli dà varianze negative o nulle.
- Applicare la linearità a funzioni non lineari. E[g(X)]=g(E[X]) è falso in generale; vale solo per g affine (aX+b).
- Leggere male la ripartizione discreta. F(x)=P(X\le x) include l’estremo; ai punti di salto il valore è quello “dopo” il gradino.
- Non raggruppare gli esiti nelle trasformazioni. Se più valori di X danno lo stesso g(X), le probabilità vanno sommate.
- Dimenticare la normalizzazione condizionata. Dopo aver condizionato, le probabilità sull’evento devono sommare a 1.