Una famiglia esponenziale è una classe di distribuzioni che può essere scritta in forma esponenziale naturale:
Qui \eta è il parametro naturale, T(x) la statistica naturale, h(x) il termine di base e A(\eta) la funzione log-partizione. La funzione A normalizza la densità o massa di probabilità:
nel caso continuo, con somma al posto dell’integrale nel caso discreto. Il dominio dei valori di \eta per cui A(\eta) è finita si chiama spazio naturale dei parametri.
Sufficienza
Per un campione indipendente X_1,\dots,X_n della stessa famiglia:
Per il teorema di fattorizzazione di Fisher-Neyman, la statistica
è sufficiente per \eta. Questa è una delle ragioni per cui le famiglie esponenziali sono centrali nella statistica inferenziale: comprimono l’informazione sul parametro in statistiche naturali di dimensione fissa.
Momenti e informazione
Quando la famiglia è regolare, le derivate della log-partizione generano i momenti della statistica naturale:
e
La curvatura di A è quindi collegata all’informazione di Fisher e alla precisione asintotica della massima verosimiglianza.
Esempi
| Distribuzione | Parametro naturale | Statistica naturale | Log-partizione |
|---|---|---|---|
| Bernoulli(p) | \displaystyle \eta=\log\dfrac{p}{1-p} | \displaystyle x | \displaystyle A(\eta)=\log(1+e^\eta) |
| Poisson(\lambda) | \displaystyle \eta=\log\lambda | \displaystyle x | \displaystyle A(\eta)=e^\eta |
| Normale(\mu,\sigma^2) con \sigma^2 nota | \displaystyle \eta=\dfrac{\mu}{\sigma^2} | \displaystyle x | \displaystyle A(\eta)=\dfrac{\sigma^2\eta^2}{2} |
| Esponenziale(\lambda) | \displaystyle \eta=-\lambda | \displaystyle x | \displaystyle A(\eta)=-\log(-\eta) |
La stessa distribuzione può ammettere parametrizzazioni diverse; la forma naturale è utile perché rende lineari i termini che coinvolgono il parametro.
Ruolo nei GLM
I modelli lineari generalizzati usano distribuzioni della famiglia esponenziale per collegare una media condizionata a un predittore lineare tramite una funzione link. Regressione logistica, regressione di Poisson e modelli gamma sono esempi tipici.
Errori comuni
- Confondere la famiglia esponenziale con la sola distribuzione esponenziale: quest’ultima è un caso particolare.
- Dimenticare il termine A(\eta): senza normalizzazione non si ha una distribuzione di probabilità.
- Pensare che ogni parametrizzazione sia naturale: spesso serve trasformare i parametri per ottenere la forma canonica.
- Assumere automaticamente completezza: la sufficienza è molto generale, mentre la completezza richiede condizioni aggiuntive.
Vedi anche: statistica sufficiente, statistica completa, massima verosimiglianza, informazione di Fisher, modello lineare generalizzato.