Test del chi-quadro: bontà di adattamento e indipendenza, esercizi svolti

I test del chi-quadro confrontano frequenze osservate con frequenze attese sotto un’ipotesi. Servono per due scopi: verificare se i dati seguono una distribuzione teorica (bontà di adattamento) e verificare se due caratteri sono indipendenti (tabelle di contingenza). Questa scheda allena entrambi.

Statistica test: $\;\chi^2=\displaystyle\sum\dfrac{(O-E)^2}{E}$ , con $O$ osservate ed $E$ attese.

1. Calcolo delle frequenze attese

Esercizio. Si lancia un dado 120 volte. Se fosse equo, quante volte ci si aspetta ogni faccia?

Sotto $H_0$ (dado equo) ogni faccia ha probabilità $1/6$ :

$E_i=n\,p_i=120\times\dfrac{1}{6}=20\ \text{per ogni faccia}.$

Le frequenze attese sono il numero di prove per la probabilità ipotizzata. Devono sommare a $n=120$ .

2. Test di bontà di adattamento

Esercizio. Lanciando il dado 120 volte si osservano: $18,\ 23,\ 16,\ 21,\ 26,\ 16$ . Il dado è equo? ( $\alpha=0{,}05$ )

Passo 1 — statistica chi-quadro (attese tutte $20$ ):

$\chi^2=\dfrac{(18-20)^2}{20}+\dfrac{(23-20)^2}{20}+\cdots=\dfrac{4+9+16+1+36+16}{20}=\dfrac{82}{20}=4{,}1.$

Passo 2 — gradi di libertà: $k-1=6-1=5$ .

Passo 3 — valore critico: $\chi^2_{0{,}05,5}=11{,}07$ .

Passo 4 — decisione: $4{,}1<11{,}07$ → non si rifiuta $H_0$ . Le deviazioni sono compatibili col caso: nessuna evidenza che il dado sia truccato.

3. Gradi di libertà nell’adattamento

Esercizio. Spiegare i gradi di libertà di un test di adattamento con $k$ categorie e $m$ parametri stimati.

I gradi di libertà sono:

$\nu=k-1-m.$

Si sottrae $1$ per il vincolo che le frequenze sommino a $n$ , e $m$ per ogni parametro stimato dai dati (es. la media di una Poisson). Nel punto 2, $k=6$ categorie, $m=0$ parametri stimati → $\nu=5$ .

4. Adattamento con parametro stimato

Esercizio. Si testa se dei conteggi seguono una Poisson, raggruppando in $k=5$ classi e stimando $\lambda$ dai dati. Quanti gradi di libertà?

Avendo stimato un parametro ( $\lambda$ ):

$\nu=k-1-m=5-1-1=3.$

Stimare $\lambda$ dai dati “consuma” un grado di libertà: il test diventa più conservativo. Dimenticarlo è un errore frequente.

5. Tabella di contingenza: frequenze attese

Esercizio. Tabella $2\times2$ : su 200 persone, fumatori/non fumatori contro malati/sani. Totali: 80 fumatori, 120 non fumatori, 50 malati, 150 sani. Frequenza attesa di “fumatori malati” sotto indipendenza?

Sotto indipendenza l’attesa di una cella è (totale riga × totale colonna)/totale:

$E_{\text{fum,malato}}=\dfrac{(\text{tot riga})\times(\text{tot col})}{n}=\dfrac{80\times50}{200}=20.$

Se fumare e ammalarsi fossero indipendenti, ci si aspetterebbero 20 fumatori malati. Si confronta con l’osservato.

6. Test di indipendenza

Esercizio. Completare il test: osservati $O_{\text{fum,malato}}=30$ , e per le altre celle (calcolate dai margini) attese $E$ . La tabella osservata è: fumatori $[30\text{ malati},\ 50\text{ sani}]$ , non fumatori $[20,\ 100]$ . Verificare l’indipendenza a $\alpha=0{,}05$ .

Passo 1 — attese (dai margini): fum-malato $20$ , fum-sano $60$ , nonfum-malato $30$ , nonfum-sano $90$ .

Passo 2 — chi-quadro:

$\chi^2=\dfrac{(30-20)^2}{20}+\dfrac{(50-60)^2}{60}+\dfrac{(20-30)^2}{30}+\dfrac{(100-90)^2}{90}.$

$\chi^2=\dfrac{100}{20}+\dfrac{100}{60}+\dfrac{100}{30}+\dfrac{100}{90}=5+1{,}67+3{,}33+1{,}11=11{,}1.$

Passo 3 — gradi di libertà: $(r-1)(c-1)=(2-1)(2-1)=1$ . Critico $\chi^2_{0{,}05,1}=3{,}84$ .

Passo 4 — decisione: $11{,}1>3{,}84$ → si rifiuta l’indipendenza. C’è associazione significativa tra fumo e malattia.

7. Condizioni di validità

Esercizio. Quando il test del chi-quadro non è affidabile?

Il test si basa sull’approssimazione della distribuzione chi-quadro, valida se le frequenze attese non sono troppo piccole. Regola pratica:

$E_i\ge5\ \text{in (quasi) tutte le celle.}$

Se alcune attese sono $<5$ , conviene accorpare categorie o usare test esatti (es. test esatto di Fisher per tabelle $2\times2$ ). La condizione riguarda le frequenze attese, non le osservate.

8. Residui standardizzati

Esercizio. Per la tabella del punto 6, individuare quali celle contribuiscono di più alla statistica.

I residui standardizzati approssimati sono

r=\dfrac{O-E}{\sqrt E}.

Per le quattro celle:

r_{\text{fum,malato}}=\dfrac{30-20}{\sqrt{20}}=2{,}24,

r_{\text{fum,sano}}=\dfrac{50-60}{\sqrt{60}}=-1{,}29,

r_{\text{nonfum,malato}}=\dfrac{20-30}{\sqrt{30}}=-1{,}83,

r_{\text{nonfum,sano}}=\dfrac{100-90}{\sqrt{90}}=1{,}05.

La cella “fumatori malati” ha lo scostamento standardizzato più grande: è quella che spinge maggiormente verso il rifiuto dell’indipendenza. La statistica globale dice che c’è associazione; i residui aiutano a capire dove.

9. Correzione di Yates per tabelle $2\times2$

Esercizio. Applicare la correzione di continuità di Yates alla tabella del punto 6.

Per tabelle $2\times2$ si può usare

\chi^2_Y=\sum\dfrac{(\lvert O-E\rvert-0{,}5)^2}{E}.

Nel punto 6 tutti gli scarti assoluti sono $10$ , quindi diventano $9{,}5$ . Allora:

\chi^2_Y= \dfrac{9{,}5^2}{20} +\dfrac{9{,}5^2}{60} +\dfrac{9{,}5^2}{30} +\dfrac{9{,}5^2}{90}.

Numericamente:

\chi^2_Y=4{,}51+1{,}50+3{,}01+1{,}00=10{,}02.

Anche con la correzione, $10{,}02>3{,}84$ , quindi si rifiuta l’indipendenza al $5\%$ . Yates rende il test più conservativo quando la tabella è piccola.

10. Misura dell’intensità: V di Cramér

Esercizio. Per la tabella del punto 6, calcolare la V di Cramér.

Il test chi-quadro dice se l’associazione è statisticamente significativa, ma non quanto è intensa. Una misura di effetto è

V=\sqrt{\dfrac{\chi^2}{n\cdot\min(r-1,c-1)}}.

Nel punto 6, $\chi^2=11{,}1$ , $n=200$ , $r=2$ , $c=2$ , quindi

V=\sqrt{\dfrac{11{,}1}{200\cdot1}} =\sqrt{0{,}0555} =0{,}236.

Il valore indica un’associazione presente ma non estrema. In campioni grandi anche effetti piccoli possono risultare significativi: per questo è utile affiancare sempre una misura di intensità.

Errori comuni

Usare le osservate al denominatore. La statistica è $\displaystyle \sum(O-E)^2/E$ : al denominatore vanno le attese, non le osservate.
Sbagliare i gradi di libertà. Adattamento: $k-1-m$ ; indipendenza: $(r-1)(c-1)$ . Dimenticare i parametri stimati ( $m$ ) è errore comune.
Applicare il test con attese piccole. Con $E<5$ in molte celle l’approssimazione chi-quadro fallisce: accorpare o usare test esatti.
Interpretare il rifiuto come causalità. Il test di indipendenza segnala associazione, non causa-effetto.
Fermarsi alla sola significatività. Dopo il rifiuto conviene guardare residui e misure di effetto: spiegano quali celle pesano e quanto è forte l’associazione.
Applicare Yates a qualunque tabella. La correzione di continuità è pensata per tabelle $2\times2$ , non per test generici con molte categorie.