L’inferenza statistica usa i dati di un campione per trarre conclusioni sulla popolazione da cui proviene.
Campionamento e Stimatori
Un campione casuale semplice (X_1, \ldots, X_n) è formato da variabili i.i.d. con la stessa distribuzione della popolazione.
Uno stimatore \hat{\theta} = g(X_1, \ldots, X_n) è una funzione del campione che approssima un parametro \theta della popolazione. Le proprietà desiderabili sono:
- Non distorsione: E[\hat\theta] = \theta
- Consistenza: \hat\theta \to \theta al crescere di n
- Efficienza: varianza minima tra gli stimatori non distorti
Stimatori classici: media campionaria \bar{X} = \frac{1}{n}\sum X_i (stimatore di \mu), varianza campionaria S^2 = \frac{1}{n-1}\sum(X_i - \bar{X})^2 (stimatore non distorto di \sigma^2).
Intervalli di Confidenza
Un intervallo di confidenza al livello 1-\alpha per \theta è un intervallo aleatorio [L, U] tale che: P(L \leq \theta \leq U) = 1-\alpha
Per la media \mu di una popolazione normale con \sigma nota (o n grande per il TCL): \bar{X} \pm z_{\alpha/2}\,\frac{\sigma}{\sqrt{n}}
dove z_{\alpha/2} è il quantile della distribuzione normale standard. Al crescere di n l’intervallo si restringe.
Relazione con i Test di Ipotesi
Un parametro \theta_0 cade nell’intervallo di confidenza al livello 1-\alpha se e solo se il test di ipotesi H_0: \theta = \theta_0 non viene rifiutato al livello di significatività \alpha.