Inferenza Statistica — ingegnerismo.it

L’inferenza statistica usa i dati di un campione per trarre conclusioni sulla popolazione da cui proviene.

Campionamento e Stimatori

Un campione casuale semplice $(X_1, \ldots, X_n)$ è formato da variabili i.i.d. con la stessa distribuzione della popolazione.

Uno stimatore $\hat{\theta} = g(X_1, \ldots, X_n)$ è una funzione del campione che approssima un parametro $\theta$ della popolazione. Le proprietà desiderabili sono:

Non distorsione: $E[\hat\theta] = \theta$
Consistenza: $\hat\theta \to \theta$ al crescere di $n$
Efficienza: varianza minima tra gli stimatori non distorti

Stimatori classici: media campionaria $\bar{X} = \frac{1}{n}\sum X_i$ (stimatore di $\mu$ ), varianza campionaria $S^2 = \frac{1}{n-1}\sum(X_i - \bar{X})^2$ (stimatore non distorto di $\sigma^2$ ).

Intervalli di Confidenza

Un intervallo di confidenza al livello $1-\alpha$ per $\theta$ è un intervallo aleatorio $[L, U]$ tale che: $P(L \leq \theta \leq U) = 1-\alpha$

Per la media $\mu$ di una popolazione normale con $\sigma$ nota (o $n$ grande per il TCL): $\bar{X} \pm z_{\alpha/2}\,\frac{\sigma}{\sqrt{n}}$

dove $z_{\alpha/2}$ è il quantile della distribuzione normale standard. Al crescere di $n$ l’intervallo si restringe.

Relazione con i Test di Ipotesi

Un parametro $\theta_0$ cade nell’intervallo di confidenza al livello $1-\alpha$ se e solo se il test di ipotesi $H_0: \theta = \theta_0$ non viene rifiutato al livello di significatività $\alpha$ .