Matrice sandwich

Indice dei contenuti

    La matrice sandwich è una forma generale della varianza-covarianza asintotica di uno stimatore. Il nome deriva dalla struttura

    \widehat V(\widehat\theta) = B^{-1}MB^{-1},

    dove una matrice centrale di variabilità empirica, detta meat, è racchiusa tra due matrici legate alla curvatura o sensibilità del modello, dette bread.

    Significato dei termini

    TermineRuoloInterpretazione
    \displaystyle \widehat\thetastimatoreParametro stimato dal campione.
    \displaystyle BbreadCurvatura, informazione o sensibilità delle equazioni di stima.
    \displaystyle MmeatVariabilità empirica degli score, dei residui o dei momenti.
    \displaystyle B^{-1}MB^{-1}sandwichVarianza-covarianza robusta o quasi-robusta.

    In molti modelli regolari correttamente specificati, la parte centrale e la curvatura sono legate in modo tale da recuperare la matrice di covarianza classica. Quando la varianza è specificata male, la forma sandwich conserva una stima dell’incertezza meno dipendente dall’ipotesi errata.

    Caso degli errori standard robusti

    Nel modello lineare stimato con minimi quadrati, la versione robusta all’eteroschedasticità è

    \widehat V_{\mathrm{HC}}(\widehat\beta) = (X^TX)^{-1}X^T\widehat\Omega X(X^TX)^{-1}.

    Qui (X^TX)^{-1} svolge il ruolo del bread inverso, mentre X^T\widehat\Omega X raccoglie la variabilità empirica dei residui. Gli errori standard robusti sono la radice quadrata degli elementi diagonali di questa matrice:

    \widehat{\operatorname{se}}_{\mathrm{rob}}(\widehat\beta_j) = \sqrt{\widehat V_{\mathrm{HC},jj}}.

    Dove compare

    ContestoUso della matrice sandwich
    Regressione lineare con eteroschedasticitàCorrezione HC0, HC1, HC2, HC3 degli errori standard.
    Cluster robustVariabilità aggregata a livello di gruppo.
    M-estimatorsCovarianza asintotica quando la loss non è puramente quadratica.
    GMMCovarianza costruita su momenti campionari e matrice di pesi.
    Quasi-likelihoodInferenza quando media e varianza non sono entrambe specificate come in un modello pienamente parametrico.

    Errori comuni

    • Pensare che la matrice sandwich corregga coefficienti distorti: corregge l’incertezza stimata, non una media specificata male.
    • Usarla senza campione sufficiente: molte giustificazioni sono asintotiche.
    • Confondere robustezza della covarianza con robustezza agli outlier: per gli outlier servono modelli o loss robuste.
    • Dimenticare che con cluster pochi e sbilanciati la stima può essere instabile.

    Vedi anche: Errori standard robusti, Eteroschedasticità, Regressione robusta, Teorema di Gauss-Markov.

    Pubblicato: