I test del chi-quadro confrontano frequenze osservate con frequenze attese sotto un’ipotesi. Servono per due scopi: verificare se i dati seguono una distribuzione teorica (bontà di adattamento) e verificare se due caratteri sono indipendenti (tabelle di contingenza). Questa scheda allena entrambi.
Statistica test: \;\chi^2=\displaystyle\sum\dfrac{(O-E)^2}{E}, con O osservate ed E attese.
1. Calcolo delle frequenze attese
Esercizio. Si lancia un dado 120 volte. Se fosse equo, quante volte ci si aspetta ogni faccia?
Sotto H_0 (dado equo) ogni faccia ha probabilità 1/6:
E_i=n\,p_i=120\times\dfrac{1}{6}=20\ \text{per ogni faccia}.
Le frequenze attese sono il numero di prove per la probabilità ipotizzata. Devono sommare a n=120.
2. Test di bontà di adattamento
Esercizio. Lanciando il dado 120 volte si osservano: 18,\ 23,\ 16,\ 21,\ 26,\ 16. Il dado è equo? (\alpha=0{,}05)
Passo 1 — statistica chi-quadro (attese tutte 20):
\chi^2=\dfrac{(18-20)^2}{20}+\dfrac{(23-20)^2}{20}+\cdots=\dfrac{4+9+16+1+36+16}{20}=\dfrac{82}{20}=4{,}1.
Passo 2 — gradi di libertà: k-1=6-1=5.
Passo 3 — valore critico: \chi^2_{0{,}05,5}=11{,}07.
Passo 4 — decisione: 4{,}1<11{,}07 → non si rifiuta H_0. Le deviazioni sono compatibili col caso: nessuna evidenza che il dado sia truccato.
3. Gradi di libertà nell’adattamento
Esercizio. Spiegare i gradi di libertà di un test di adattamento con k categorie e m parametri stimati.
I gradi di libertà sono:
\nu=k-1-m.
Si sottrae 1 per il vincolo che le frequenze sommino a n, e m per ogni parametro stimato dai dati (es. la media di una Poisson). Nel punto 2, k=6 categorie, m=0 parametri stimati → \nu=5.
4. Adattamento con parametro stimato
Esercizio. Si testa se dei conteggi seguono una Poisson, raggruppando in k=5 classi e stimando \lambda dai dati. Quanti gradi di libertà?
Avendo stimato un parametro (\lambda):
\nu=k-1-m=5-1-1=3.
Stimare \lambda dai dati “consuma” un grado di libertà: il test diventa più conservativo. Dimenticarlo è un errore frequente.
5. Tabella di contingenza: frequenze attese
Esercizio. Tabella 2\times2: su 200 persone, fumatori/non fumatori contro malati/sani. Totali: 80 fumatori, 120 non fumatori, 50 malati, 150 sani. Frequenza attesa di “fumatori malati” sotto indipendenza?
Sotto indipendenza l’attesa di una cella è (totale riga × totale colonna)/totale:
E_{\text{fum,malato}}=\dfrac{(\text{tot riga})\times(\text{tot col})}{n}=\dfrac{80\times50}{200}=20.
Se fumare e ammalarsi fossero indipendenti, ci si aspetterebbero 20 fumatori malati. Si confronta con l’osservato.
6. Test di indipendenza
Esercizio. Completare il test: osservati O_{\text{fum,malato}}=30, e per le altre celle (calcolate dai margini) attese E. La tabella osservata è: fumatori [30\text{ malati},\ 50\text{ sani}], non fumatori [20,\ 100]. Verificare l’indipendenza a \alpha=0{,}05.
Passo 1 — attese (dai margini): fum-malato 20, fum-sano 60, nonfum-malato 30, nonfum-sano 90.
Passo 2 — chi-quadro:
\chi^2=\dfrac{(30-20)^2}{20}+\dfrac{(50-60)^2}{60}+\dfrac{(20-30)^2}{30}+\dfrac{(100-90)^2}{90}.
\chi^2=\dfrac{100}{20}+\dfrac{100}{60}+\dfrac{100}{30}+\dfrac{100}{90}=5+1{,}67+3{,}33+1{,}11=11{,}1.
Passo 3 — gradi di libertà: (r-1)(c-1)=(2-1)(2-1)=1. Critico \chi^2_{0{,}05,1}=3{,}84.
Passo 4 — decisione: 11{,}1>3{,}84 → si rifiuta l’indipendenza. C’è associazione significativa tra fumo e malattia.
7. Condizioni di validità
Esercizio. Quando il test del chi-quadro non è affidabile?
Il test si basa sull’approssimazione della distribuzione chi-quadro, valida se le frequenze attese non sono troppo piccole. Regola pratica:
E_i\ge5\ \text{in (quasi) tutte le celle.}
Se alcune attese sono <5, conviene accorpare categorie o usare test esatti (es. test esatto di Fisher per tabelle 2\times2). La condizione riguarda le frequenze attese, non le osservate.
8. Residui standardizzati
Esercizio. Per la tabella del punto 6, individuare quali celle contribuiscono di più alla statistica.
I residui standardizzati approssimati sono
Per le quattro celle:
La cella “fumatori malati” ha lo scostamento standardizzato più grande: è quella che spinge maggiormente verso il rifiuto dell’indipendenza. La statistica globale dice che c’è associazione; i residui aiutano a capire dove.
9. Correzione di Yates per tabelle 2\times2
Esercizio. Applicare la correzione di continuità di Yates alla tabella del punto 6.
Per tabelle 2\times2 si può usare
Nel punto 6 tutti gli scarti assoluti sono 10, quindi diventano 9{,}5. Allora:
Numericamente:
Anche con la correzione, 10{,}02>3{,}84, quindi si rifiuta l’indipendenza al 5\%. Yates rende il test più conservativo quando la tabella è piccola.
10. Misura dell’intensità: V di Cramér
Esercizio. Per la tabella del punto 6, calcolare la V di Cramér.
Il test chi-quadro dice se l’associazione è statisticamente significativa, ma non quanto è intensa. Una misura di effetto è
Nel punto 6, \chi^2=11{,}1, n=200, r=2, c=2, quindi
Il valore indica un’associazione presente ma non estrema. In campioni grandi anche effetti piccoli possono risultare significativi: per questo è utile affiancare sempre una misura di intensità.
Errori comuni
- Usare le osservate al denominatore. La statistica è \displaystyle \sum(O-E)^2/E: al denominatore vanno le attese, non le osservate.
- Sbagliare i gradi di libertà. Adattamento: k-1-m; indipendenza: (r-1)(c-1). Dimenticare i parametri stimati (m) è errore comune.
- Applicare il test con attese piccole. Con E<5 in molte celle l’approssimazione chi-quadro fallisce: accorpare o usare test esatti.
- Interpretare il rifiuto come causalità. Il test di indipendenza segnala associazione, non causa-effetto.
- Fermarsi alla sola significatività. Dopo il rifiuto conviene guardare residui e misure di effetto: spiegano quali celle pesano e quanto è forte l’associazione.
- Applicare Yates a qualunque tabella. La correzione di continuità è pensata per tabelle 2\times2, non per test generici con molte categorie.