Valore atteso, momenti e disuguaglianze: esercizi svolti

Il valore atteso e la varianza sono i due momenti che riassumono posizione e dispersione di una variabile aleatoria. Le loro proprietà — linearità, comportamento delle somme — e le disuguaglianze di Markov e Chebyshev permettono stime valide per qualunque distribuzione, anche ignota. Questa scheda allena queste proprietà generali.

1. Linearità del valore atteso

Esercizio. Se $E[X]=4$ ed $E[Y]=7$ , calcolare $E[3X-2Y+5]$ .

La linearità vale sempre, anche senza indipendenza:

$E[3X-2Y+5]=3E[X]-2E[Y]+5=3\times4-2\times7+5=12-14+5=3.$

È la proprietà più robusta del valore atteso: non richiede ipotesi sulle variabili.

2. Varianza di una trasformazione lineare

Esercizio. Se $\operatorname{Var}(X)=9$ , calcolare $\operatorname{Var}(2X+10)$ .

La costante additiva non altera la dispersione; il fattore moltiplicativo entra al quadrato:

$\operatorname{Var}(aX+b)=a^2\operatorname{Var}(X)=2^2\times9=36.$

Lo spostamento ( $+10$ ) trasla la distribuzione ma non la allarga; la scala ( $\times2$ ) raddoppia la deviazione standard, quindi quadruplica la varianza.

3. Varianza di una somma di variabili indipendenti

Esercizio. $X$ e $Y$ indipendenti con $\operatorname{Var}(X)=4$ , $\operatorname{Var}(Y)=9$ . Calcolare $\operatorname{Var}(X+Y)$ e $\operatorname{Var}(X-Y)$ .

Per variabili indipendenti le varianze si sommano (in entrambi i casi):

$\operatorname{Var}(X+Y)=\operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)=4+9=13.$

Attenzione: anche per la differenza le varianze si sommano, non si sottraggono. Il segno meno non riduce l’incertezza, la accumula.

4. Varianza con covarianza

Esercizio. Se $\operatorname{Var}(X)=4$ , $\operatorname{Var}(Y)=9$ , $\operatorname{Cov}(X,Y)=2$ , calcolare $\operatorname{Var}(X+Y)$ .

Senza indipendenza compare il termine di covarianza:

$\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\operatorname{Cov}(X,Y)=4+9+2\times2=17.$

La covarianza positiva amplifica la varianza della somma: le variabili “si muovono insieme”. Se fosse negativa, la ridurrebbe.

5. Media campionaria

Esercizio. Si media $n=25$ misure indipendenti, ciascuna con $\sigma=10$ . Qual è la deviazione standard della media campionaria $\bar X$ ?

La varianza della media di $n$ variabili indipendenti identiche è $\sigma^2/n$ :

$\operatorname{Var}(\bar X)=\dfrac{\sigma^2}{n}=\dfrac{100}{25}=4\ \Rightarrow\ \sigma_{\bar X}=\sqrt4=2.$

Mediando si riduce la dispersione: l’errore standard cala come $1/\sqrt n$ . Per dimezzarlo servono quattro volte più misure.

6. Disuguaglianza di Markov

Esercizio. Una variabile non negativa ha media $E[X]=5$ . Stimare $P(X\ge20)$ .

Markov dà un limite superiore con la sola media (variabile $\ge0$ ):

$P(X\ge a)\le\dfrac{E[X]}{a}=\dfrac{5}{20}=0{,}25.$

Al più il $25\%$ della massa sta oltre 20. È una stima grezza ma universale: non richiede di conoscere la distribuzione.

7. Disuguaglianza di Chebyshev

Esercizio. Una variabile ha $\mu=50$ e $\sigma=5$ . Stimare la probabilità che disti da $\mu$ più di $15$ .

Chebyshev limita le code usando media e varianza. Con $k\sigma=15\Rightarrow k=3$ :

$P(|X-\mu|\ge k\sigma)\le\dfrac{1}{k^2}=\dfrac{1}{9}=0{,}111.$

Al più l’ $11\%$ dista oltre $3\sigma$ dalla media, qualunque sia la distribuzione. Per una normale sarebbe lo $0{,}3\%$ : Chebyshev è conservativa ma generale.

8. Chebyshev per dimensionare un campione

Esercizio. Garantire che la media campionaria di misure con $\sigma=8$ disti dalla media vera meno di $1$ con probabilità $\ge0{,}95$ . Quante misure servono (via Chebyshev)?

Passo 1 — varianza della media: $\operatorname{Var}(\bar X)=\sigma^2/n=64/n$ .

Passo 2 — Chebyshev: vogliamo $P(|\bar X-\mu|\ge1)\le0{,}05$ . Con $\operatorname{Var}(\bar X)/a^2$ :

$\dfrac{64/n}{1^2}\le0{,}05\ \Rightarrow\ n\ge\dfrac{64}{0{,}05}=1280.$

Servono almeno $1280$ misure. Chebyshev sovrastima (con la normale ne basterebbero $\sim246$ ), ma dà una garanzia indipendente dalla forma della distribuzione.

9. Valore atteso e varianza da una distribuzione discreta

Esercizio. Una variabile $X$ assume i valori $0,1,2,3$ con probabilità $0{,}1,\ 0{,}3,\ 0{,}4,\ 0{,}2$ . Calcolare $E[X]$ , $E[X^2]$ e $\operatorname{Var}(X)$ .

Il valore atteso è

E[X]=0\cdot0{,}1+1\cdot0{,}3+2\cdot0{,}4+3\cdot0{,}2 =0+0{,}3+0{,}8+0{,}6=1{,}7.

Il secondo momento è

E[X^2]=0^2\cdot0{,}1+1^2\cdot0{,}3+2^2\cdot0{,}4+3^2\cdot0{,}2 =0+0{,}3+1{,}6+1{,}8=3{,}7.

Usiamo

\operatorname{Var}(X)=E[X^2]-(E[X])^2.

Quindi

\operatorname{Var}(X)=3{,}7-1{,}7^2=3{,}7-2{,}89=0{,}81.

La deviazione standard è $\sqrt{0{,}81}=0{,}9$ .

10. Variabili indicatrici e conteggi

Esercizio. Si effettuano $n$ prove indipendenti, ciascuna con probabilità di successo $p$ . Usare variabili indicatrici per ricavare media e varianza del numero totale di successi.

Definiamo

I_i= \begin{cases} 1 & \text{se la prova } i \text{ è un successo},\\ 0 & \text{altrimenti}. \end{cases}

Il numero totale di successi è

X=I_1+\cdots+I_n.

Per ogni indicatrice:

E[I_i]=p,\qquad \operatorname{Var}(I_i)=p(1-p).

Per linearità del valore atteso:

E[X]=\sum_{i=1}^n E[I_i]=np.

Se le prove sono indipendenti, anche le indicatrici lo sono, quindi le varianze si sommano:

\operatorname{Var}(X)=\sum_{i=1}^n \operatorname{Var}(I_i)=np(1-p).

Questa è la derivazione strutturale delle formule della binomiale: spesso contare con indicatrici è più semplice che lavorare direttamente con tutte le probabilità.

11. Valore atteso totale

Esercizio. Un pezzo proviene dalla linea A con probabilità $0{,}6$ e dalla linea B con probabilità $0{,}4$ . La probabilità di difetto è $0{,}02$ per A e $0{,}05$ per B. Calcolare la probabilità totale di difetto.

Sia $D$ l’evento “pezzo difettoso”. La formula del valore atteso totale, applicata all’indicatrice di $D$ , coincide con la probabilità totale:

P(D)=P(D\mid A)P(A)+P(D\mid B)P(B).

Quindi

P(D)=0{,}02\cdot0{,}6+0{,}05\cdot0{,}4 =0{,}012+0{,}020 =0{,}032.

La probabilità complessiva di difetto è $3{,}2\%$ .

L’idea generale è:

E[X]=E\!\left(E[X\mid Y]\right),

cioè si può calcolare una media globale mediando prima dentro i gruppi e poi sui gruppi.

Errori comuni

Sottrarre le varianze nella differenza. $\operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)$ per variabili indipendenti: il segno meno non sottrae le varianze.
Dimenticare il quadrato nel fattore di scala. $\operatorname{Var}(aX)=a^2\operatorname{Var}(X)$ , non $a\operatorname{Var}(X)$ .
Applicare Markov a variabili che cambiano segno. Markov richiede $X\ge0$ ; senza questa ipotesi il limite non vale.
Confondere $\sigma$ con $\sigma/\sqrt n$ . La deviazione della singola misura è $\sigma$ ; quella della media campionaria è $\sigma/\sqrt n$ , molto più piccola.
Dimenticare la formula computazionale della varianza. $\operatorname{Var}(X)=E[X^2]-(E[X])^2$ , non $E[X^2]$ .
Sommar varianze senza indipendenza. Le varianze si sommano solo se le covarianze sono nulle; altrimenti servono i termini $2\operatorname{Cov}$ .