La matrice sandwich è una forma generale della varianza-covarianza asintotica di uno stimatore. Il nome deriva dalla struttura
dove una matrice centrale di variabilità empirica, detta meat, è racchiusa tra due matrici legate alla curvatura o sensibilità del modello, dette bread.
Significato dei termini
| Termine | Ruolo | Interpretazione |
|---|---|---|
| \displaystyle \widehat\theta | stimatore | Parametro stimato dal campione. |
| \displaystyle B | bread | Curvatura, informazione o sensibilità delle equazioni di stima. |
| \displaystyle M | meat | Variabilità empirica degli score, dei residui o dei momenti. |
| \displaystyle B^{-1}MB^{-1} | sandwich | Varianza-covarianza robusta o quasi-robusta. |
In molti modelli regolari correttamente specificati, la parte centrale e la curvatura sono legate in modo tale da recuperare la matrice di covarianza classica. Quando la varianza è specificata male, la forma sandwich conserva una stima dell’incertezza meno dipendente dall’ipotesi errata.
Caso degli errori standard robusti
Nel modello lineare stimato con minimi quadrati, la versione robusta all’eteroschedasticità è
Qui (X^TX)^{-1} svolge il ruolo del bread inverso, mentre X^T\widehat\Omega X raccoglie la variabilità empirica dei residui. Gli errori standard robusti sono la radice quadrata degli elementi diagonali di questa matrice:
Dove compare
| Contesto | Uso della matrice sandwich |
|---|---|
| Regressione lineare con eteroschedasticità | Correzione HC0, HC1, HC2, HC3 degli errori standard. |
| Cluster robust | Variabilità aggregata a livello di gruppo. |
| M-estimators | Covarianza asintotica quando la loss non è puramente quadratica. |
| GMM | Covarianza costruita su momenti campionari e matrice di pesi. |
| Quasi-likelihood | Inferenza quando media e varianza non sono entrambe specificate come in un modello pienamente parametrico. |
Errori comuni
- Pensare che la matrice sandwich corregga coefficienti distorti: corregge l’incertezza stimata, non una media specificata male.
- Usarla senza campione sufficiente: molte giustificazioni sono asintotiche.
- Confondere robustezza della covarianza con robustezza agli outlier: per gli outlier servono modelli o loss robuste.
- Dimenticare che con cluster pochi e sbilanciati la stima può essere instabile.
Vedi anche: Errori standard robusti, Eteroschedasticità, Regressione robusta, Teorema di Gauss-Markov.