Questo formulario raccoglie gli strumenti principali di Probabilità e Statistica per un corso di ingegneria. L’obiettivo è dare formule utilizzabili, ma anche commentarle con le ipotesi e il significato operativo: una formula statistica senza modello, campione, livello di rischio e unità di misura è facile da applicare male.
La probabilità descrive l’incertezza prima dell’osservazione: eventi, variabili aleatorie, distribuzioni, dipendenze e limiti asintotici. La statistica usa dati osservati per stimare parametri, confrontare ipotesi, costruire modelli e quantificare l’incertezza residua. In ingegneria queste idee entrano in affidabilità, controllo qualità, misure sperimentali, simulazione, data analysis, manutenzione, rischio, reti, code, sistemi produttivi e sicurezza.
Le formule vanno lette sempre insieme a tre domande: quali dati ho, quale modello sto assumendo, quale decisione devo prendere. La stessa media può essere un valore atteso teorico, una media campionaria, una previsione di modello o una stima incerta; confonderle porta a conclusioni fragili.
1. Richiami iniziali: insiemi, somme e funzioni
Spazio degli esiti
contiene tutti gli esiti elementari che il modello considera possibili. In un lancio di dado ideale, . In una misura continua, può essere un intervallo o uno spazio più complesso. Scegliere correttamente è il primo atto di modellazione.
Evento
Un evento è un insieme di esiti. Dire che l’evento si verifica significa dire che l’esito osservato appartiene ad . Per esempio, nel dado l’evento “numero pari” è .
Complementare
Il complementare è l’evento “non ”. Se è l’evento guasto entro un certo tempo, è sopravvivenza oltre quel tempo. In probabilità, complementare e differenza tra insiemi permettono spesso di calcolare eventi difficili tramite eventi più semplici.
Unione e intersezione
L’unione rappresenta il verificarsi di almeno uno dei due eventi. L’intersezione rappresenta il verificarsi simultaneo. In affidabilità, se e sono guasti di componenti, descrive “almeno un componente guasto”, mentre descrive “entrambi guasti”.
Eventi disgiunti
Due eventi sono disgiunti se non possono verificarsi insieme. Non bisogna confondere disgiunzione e indipendenza: eventi disgiunti con probabilità positive non sono indipendenti, perché sapere che uno si è verificato esclude l’altro.
Partizione
Una partizione divide lo spazio degli esiti in casi alternativi e completi. Le formule di probabilità totale e di Bayes si basano su una partizione: prima si separano gli scenari possibili, poi si pesa il contributo di ciascuno.
Cardinalità
La cardinalità conta gli elementi di un insieme finito. Nella probabilità classica, quando tutti gli esiti sono equiprobabili, la probabilità si riduce a un rapporto tra cardinalità.
Sommatoria finita
La sommatoria abbrevia una somma finita. In probabilità discreta compare per normalizzare distribuzioni, calcolare valori attesi, varianze e probabilità marginali. L’indice è muto: può essere sostituito da un’altra lettera senza cambiare il significato.
Prodotto finito
Il prodotto finito compare in probabilità di eventi indipendenti, likelihood campionarie e densità congiunte di osservazioni indipendenti. Se i fattori sono probabilità, il prodotto può diventare molto piccolo; per questo in statistica computazionale si lavora spesso con logaritmi.
Indicatrice di un evento
La funzione indicatrice trasforma un evento in una variabile numerica. È utile perché permette di scrivere conteggi e frequenze come somme:
Questa idea collega direttamente probabilità, campionamento e statistica descrittiva.
Integrale come area ponderata
Nelle distribuzioni continue l’integrale sostituisce la somma. Una densità non dà direttamente probabilità puntuali, ma probabilità di intervalli tramite area. Per questo, nel continuo, di solito anche per valori possibili.
Funzione esponenziale e logaritmo
Esponenziale e logaritmo sono onnipresenti: distribuzione normale, esponenziale, Poisson, likelihood, modelli log-lineari e decadimento affidabilistico. Il logaritmo trasforma prodotti in somme, rendendo più stabile e interpretabile la stima di parametri.
2. Calcolo combinatorio
Fattoriale
Il fattoriale conta i modi di ordinare oggetti distinti. La convenzione rende coerenti molte formule combinatorie, come il coefficiente binomiale per .
Permutazioni semplici
Le permutazioni semplici sono gli ordinamenti di oggetti distinti. Se si devono ordinare componenti, lavorazioni o etichette senza ripetizioni, il numero di sequenze possibili è .
Disposizioni semplici
Le disposizioni contano i modi di scegliere e ordinare oggetti distinti tra . L’ordine conta e non sono ammesse ripetizioni. Si usano quando la posizione o la sequenza ha significato.
Disposizioni con ripetizione
Si scelgono elementi da possibilità, ammettendo ripetizioni e distinguendo l’ordine. È il modello tipico di codici, password ideali a lunghezza fissa e sequenze di prove indipendenti con lo stesso numero di esiti.
Combinazioni semplici
Le combinazioni contano i modi di scegliere oggetti tra senza considerare l’ordine. La simmetria:
dice che scegliere oggetti equivale a scegliere gli esclusi.
Combinazioni con ripetizione
Questa formula conta i modi di scegliere oggetti da tipi ammettendo ripetizioni e senza ordine. È il modello delle distribuzioni di unità indistinguibili in categorie.
Permutazioni con ripetizioni
Se tra oggetti ci sono gruppi indistinguibili di numerosità , il fattoriale totale sovraconta gli scambi interni ai gruppi. Si divide quindi per i fattoriali delle ripetizioni. Questa formula è alla base del coefficiente multinomiale.
Coefficiente multinomiale
Il coefficiente multinomiale conta i modi di ripartire prove in categorie con conteggi fissati. È l’estensione del coefficiente binomiale a più di due esiti.
Binomio di Newton
Il coefficiente conta in quanti modi si scelgono i fattori da cui prendere nel prodotto di parentesi. La formula è il fondamento combinatorio della distribuzione binomiale.
Multinomio
Ogni termine corrisponde a una distribuzione dei fattori tra categorie. In probabilità porta direttamente alla distribuzione multinomiale, usata quando ogni prova può produrre più di due risultati.
3. Probabilità elementare e assiomi
Probabilità classica con esiti equiprobabili
La formula vale solo quando lo spazio campionario è finito e tutti gli esiti elementari hanno la stessa probabilità. Non è la definizione generale di probabilità: è un caso particolare basato su simmetria o equiprobabilità ragionevole.
Assiomi di Kolmogorov
Ogni probabilità è non negativa. Inoltre:
L’evento certo ha probabilità uno. Infine, per eventi a due a due disgiunti:
Questo assioma di additività numerabile permette di calcolare probabilità di unioni disgiunte anche infinite.
Probabilità dell’evento impossibile
L’evento impossibile non contiene esiti e quindi non può verificarsi. La formula deriva dagli assiomi: poiché e sono disgiunti e , si ottiene .
Complementare
Evento e complementare sono disgiunti e la loro unione è . Questa formula è spesso il modo più semplice per calcolare probabilità di almeno un successo, almeno un guasto o almeno un errore: si calcola il contrario, cioè nessun successo, nessun guasto o nessun errore.
Monotonia
Se ogni esito che realizza realizza anche , allora non può essere meno probabile di . La probabilità rispetta l’inclusione tra eventi.
Differenza di eventi
è la parte di che resta escludendo . La formula è utile quando si vuole calcolare “A ma non B”. Richiede di sottrarre solo la parte di che cade effettivamente in , cioè l’intersezione.
Unione di due eventi
Sommare e conta due volte gli esiti comuni. Per correggere il doppio conteggio si sottrae . Se gli eventi sono disgiunti, l’intersezione è vuota e la formula diventa semplicemente additiva.
Unione di tre eventi
La formula alterna somme e sottrazioni per correggere i conteggi multipli. Dopo aver sottratto le intersezioni a due a due, l’intersezione tripla è stata tolta troppe volte e va riaggiunta.
Disuguaglianza di Boole
È un limite superiore semplice per la probabilità di almeno uno tra più eventi. Non richiede indipendenza. È utile quando le intersezioni sono difficili da calcolare e serve una stima conservativa del rischio complessivo.
Continuità crescente
Se gli eventi aumentano progressivamente, la probabilità del limite è il limite delle probabilità. Questa proprietà è importante nei modelli con eventi definiti come unioni infinite.
Continuità decrescente
Se gli eventi si restringono progressivamente, la probabilità dell’intersezione limite è il limite delle probabilità. La proprietà vale in particolare quando è finita, condizione sempre soddisfatta in uno spazio di probabilità.
4. Probabilità condizionata, indipendenza e Bayes
Probabilità condizionata
La probabilità condizionata misura la probabilità di dopo aver saputo che si è verificato. Il denominatore deve essere positivo: non si può condizionare su un evento impossibile. Il nuovo universo di riferimento diventa .
Regola del prodotto
La probabilità congiunta può essere scritta come probabilità del primo evento per probabilità del secondo dato il primo, o viceversa. La formula è la base per decomporre eventi complessi in passi successivi.
Regola del prodotto per più eventi
Questa catena scrive la probabilità di una sequenza di eventi come prodotto di probabilità condizionate. È utile in processi sequenziali, alberi di probabilità, catene di Markov e diagnostica.
Formula delle probabilità totali
Gli eventi devono formare una partizione di e avere probabilità positiva. La formula calcola la probabilità di sommando i contributi dei diversi scenari , pesati per la loro probabilità.
Teorema di Bayes
P(H_j\mid E)= \frac{P(E\mid H_j)P(H_j)} \sum_{i=1}^n P(E\mid H_i)P(H_i)}Bayes aggiorna la probabilità di un’ipotesi dopo aver osservato l’evidenza . Il numeratore contiene quanto l’ipotesi era plausibile prima e quanto rende probabile l’evidenza. Il denominatore normalizza su tutte le ipotesi alternative.
Odds bayesiani
Gli odds posteriori sono odds iniziali moltiplicati per il rapporto di verosimiglianza. Questa forma è molto chiara in diagnostica: un test cambia le probabilità in base a quanto l’evidenza è più probabile sotto un’ipotesi rispetto all’altra.
Indipendenza di due eventi
Due eventi sono indipendenti se il verificarsi di uno non cambia la probabilità dell’altro. Se , la stessa condizione equivale a:
Indipendenza non significa disgiunzione: eventi indipendenti possono verificarsi insieme.
Indipendenza a coppie
L’indipendenza a coppie richiede indipendenza per ogni coppia di eventi. Non basta però a garantire indipendenza collettiva. Questo punto è importante: molti errori nascono dal moltiplicare probabilità senza verificare l’indipendenza della famiglia intera.
Indipendenza mutua
La formula deve valere per ogni sottoinsieme finito di indici . L’indipendenza mutua è più forte dell’indipendenza a coppie. È l’ipotesi tipica per prove ripetute identiche, misure indipendenti e componenti guastabili indipendentemente.
Probabilità di almeno un evento indipendente
La formula vale se gli eventi sono indipendenti. Si calcola il complementare: nessun evento si verifica. È molto usata per “almeno un guasto”, “almeno un successo”, “almeno un errore”.
5. Variabili aleatorie
Variabile aleatoria
Una variabile aleatoria assegna un numero reale a ogni esito dell’esperimento. Non è una variabile nel senso deterministico: prima dell’osservazione il suo valore è incerto; dopo l’osservazione assume un valore numerico.
Funzione di ripartizione
La funzione di ripartizione accumula probabilità fino al valore . È definita per qualunque variabile aleatoria reale, discreta o continua. È crescente, assume valori tra e , tende a per e a per .
Probabilità di un intervallo tramite ripartizione
La formula vale in generale. La scelta di includere ed escludere è coerente con la definizione . Nel caso continuo le inclusioni degli estremi non cambiano il valore; nel caso discreto possono contare.
Variabile discreta
Una variabile aleatoria discreta assume valori in un insieme finito o numerabile. La funzione assegna probabilità ai singoli valori. Deve valere:
La somma totale delle probabilità di tutti i valori possibili deve essere uno.
Variabile continua
La densità non è una probabilità puntuale. È una funzione che, integrata su un intervallo, restituisce probabilità. Deve essere non negativa e normalizzata:
Nel continuo, la probabilità di un singolo punto è in genere zero.
Densità e funzione di ripartizione
Se è continua con densità , la ripartizione è l’integrale cumulato della densità. Quando è derivabile:
Questa relazione collega area cumulata e densità locale.
Quantile
Il quantile di ordine è un valore sotto il quale cade probabilità . Per esempio, la mediana è il quantile con . Se la ripartizione non è strettamente crescente, si usa una definizione generalizzata:
I quantili sono fondamentali in intervalli di confidenza, test e soglie di progetto.
Funzione di sopravvivenza
La funzione di sopravvivenza è naturale quando rappresenta un tempo a guasto, una durata o una resistenza. In affidabilità si scrive spesso .
Trasformazione monotona crescente
Allora:
La monotonia crescente conserva l’ordine. La ripartizione di si ottiene riportando la soglia sulla scala di .
Trasformazione di densità
La formula vale quando è invertibile e derivabile con derivata non nulla. Il fattore derivativo corregge la compressione o dilatazione della scala. Senza questo fattore, la densità trasformata non sarebbe correttamente normalizzata.
6. Valore atteso, varianza e momenti
Valore atteso discreto
Il valore atteso è una media pesata dei valori possibili, con pesi pari alle probabilità. Non deve necessariamente essere un valore che la variabile può assumere. È un centro teorico della distribuzione, utile per previsioni medie e bilanci.
Valore atteso continuo
Nel caso continuo la somma pesata diventa un integrale. L’integrale deve convergere; non tutte le distribuzioni hanno valore atteso finito. La densità pesa i valori in base alla loro probabilità locale.
Valore atteso di una funzione
per variabili discrete, mentre nel caso continuo:
Non serve trovare prima la distribuzione di : si può mediare direttamente la funzione sui valori di . Questa formula è molto utile per calcolare momenti, costi attesi e trasformazioni.
Linearità del valore atteso
La linearità vale sempre quando i valori attesi esistono, anche senza indipendenza. È una delle proprietà più robuste della probabilità. Permette di calcolare attese di somme anche quando le variabili sono dipendenti.
Momento di ordine
I momenti grezzi descrivono la distribuzione rispetto all’origine. Il primo momento è il valore atteso. Momenti di ordine superiore contengono informazioni su dispersione, asimmetria e code.
Momento centrale di ordine
I momenti centrali misurano la distribuzione rispetto alla media. Il secondo momento centrale è la varianza. Il terzo è legato all’asimmetria, il quarto alla curtosi.
Varianza
La varianza misura la dispersione quadratica attorno alla media. Il quadrato penalizza maggiormente gli scostamenti grandi. L’unità di misura della varianza è il quadrato dell’unità di .
Formula computazionale della varianza
Questa forma è spesso più comoda per il calcolo. Deriva dallo sviluppo del quadrato:
Poiché , resta .
Deviazione standard
La deviazione standard riporta la dispersione alla stessa unità di misura di . Per questo è più interpretabile della varianza nelle applicazioni sperimentali.
Varianza di trasformazione affine
La traslazione non cambia la dispersione. Il fattore di scala moltiplica gli scostamenti dalla media, quindi la varianza viene moltiplicata per .
Disuguaglianza di Jensen
La formula vale per convessa. Dice che applicare una funzione convessa dopo aver mediato produce un valore non maggiore della media della funzione. È una disuguaglianza profonda: spiega perché la variabilità aumenta il valore atteso di costi convessi.
Disuguaglianza di Markov
Markov fornisce un limite superiore alla probabilità di code grandi usando solo il valore atteso. È generale ma spesso conservativa. Richiede che sia non negativa.
Disuguaglianza di Chebyshev
Chebyshev usa media e varianza, senza assumere normalità. Garantisce che la probabilità di stare lontani dalla media decresce almeno come . È utile quando la distribuzione non è nota.
Funzione generatrice dei momenti
Quando esiste in un intorno di zero, la funzione generatrice dei momenti determina la distribuzione e permette di ottenere i momenti derivando:
È comoda per somme di variabili indipendenti.
Funzione caratteristica
La funzione caratteristica esiste sempre, perché . È uno strumento teorico potente per convergenza in distribuzione e somme di variabili aleatorie.
7. Distribuzioni discrete notevoli
Bernoulli
La Bernoulli modella una prova con due esiti: successo e insuccesso. Il parametro è la probabilità di successo. Valore atteso e varianza sono:
La varianza è massima per e nulla se è zero o uno.
Binomiale
La variabile conta il numero di successi in prove Bernoulli indipendenti con la stessa probabilità . La massa di probabilità è:
Il coefficiente binomiale conta quali prove sono successi; gli altri fattori pesano la probabilità della sequenza.
Media e varianza della binomiale
La media è il numero atteso di successi. La varianza cresce con ma dipende anche da : se il risultato è quasi certo o quasi impossibile, la variabilità è bassa.
Geometrica
Questa convenzione fa rappresentare a il numero della prova in cui si osserva il primo successo. Le prove sono indipendenti e tutte con probabilità di successo. La media e la varianza sono:
Se il successo è raro, il tempo medio di attesa cresce.
Proprietà senza memoria della geometrica
La distribuzione geometrica non ricorda quante prove senza successo sono già avvenute. Dopo una lunga attesa, il numero di prove ulteriori da aspettare ha la stessa distribuzione iniziale. Questa proprietà richiede indipendenza e probabilità costante di successo.
Binomiale negativa
In questa parametrizzazione, è il numero della prova in cui si osserva il successo numero . Prima della prova devono esserci esattamente successi, e la prova deve essere un successo.
Ipergeometrica
La distribuzione ipergeometrica conta successi in un campione di ampiezza estratto senza reinserimento da una popolazione di elementi con successi. A differenza della binomiale, le prove non sono indipendenti: estrarre un elemento modifica la composizione residua.
Media e varianza dell’ipergeometrica
La media è analoga alla binomiale con . La varianza è:
Il fattore finale è la correzione per popolazione finita. Riduce la variabilità perché il campionamento senza reinserimento introduce dipendenza negativa.
Poisson
La Poisson modella conteggi di eventi rari in un intervallo di tempo, spazio o volume, quando gli eventi avvengono con intensità media e in modo indipendente su intervalli disgiunti.
Media e varianza della Poisson
Nella Poisson media e varianza coincidono. Se nei dati osservati la varianza è molto più grande della media, il modello di Poisson semplice può essere inadeguato.
Approssimazione Poisson della binomiale
L’approssimazione è efficace quando è grande e è piccolo, con moderato. Interpreta la binomiale come conteggio di eventi rari su molte prove.
Uniforme discreta
Tutti i valori hanno la stessa probabilità. La media e la varianza sono:
È il modello naturale per estrazioni simmetriche finite, come un dado ideale.
Multinomiale
La multinomiale estende la binomiale a categorie. I conteggi devono soddisfare e le probabilità . È il modello per classificazioni ripetute indipendenti.
8. Distribuzioni continue notevoli
Uniforme continua
La distribuzione uniforme assegna uguale densità a tutti i punti dell’intervallo. Non significa che ogni singolo punto abbia probabilità positiva, ma che intervalli di uguale lunghezza hanno uguale probabilità.
Media e varianza dell’uniforme continua
La media è il punto medio dell’intervallo. La varianza cresce con il quadrato della lunghezza dell’intervallo.
Esponenziale
La distribuzione esponenziale modella tempi di attesa senza memoria con tasso costante . È molto usata in affidabilità elementare e processi di Poisson.
Sopravvivenza esponenziale
La probabilità di sopravvivere oltre decresce esponenzialmente. La media e la varianza sono:
Un tasso maggiore implica tempi medi più brevi.
Proprietà senza memoria dell’esponenziale
L’esponenziale è l’analogo continuo della geometrica. Se un componente ha già funzionato per tempo , il tempo residuo ha la stessa distribuzione iniziale. Questa ipotesi è forte e corrisponde a un tasso di guasto costante.
Gamma
La gamma generalizza l’esponenziale. Può modellare il tempo necessario al verificarsi di più eventi in un processo di Poisson. Il parametro è di forma, è di tasso.
Media e varianza della gamma
Aumentare sposta la distribuzione verso valori maggiori e modifica la forma. Aumentare comprime la scala dei tempi.
Erlang
La distribuzione Erlang è una gamma con forma intera. Modella il tempo di attesa fino al k-esimo evento di un processo di Poisson. È utile in code, telecomunicazioni e affidabilità.
Normale
La densità è:
La normale è il modello fondamentale per errori di misura, somme di effetti piccoli e distribuzioni limite. Il parametro è la media, la varianza.
Standardizzazione normale
Standardizzare sottrae la media e divide per la deviazione standard. Così ogni probabilità normale può essere ricondotta alla normale standard:
dove è la funzione di ripartizione della normale standard.
Regola empirica della normale
Inoltre:
e:
Queste percentuali valgono per la normale, non per qualunque distribuzione. Sono utili per interpretare scostamenti standardizzati.
Lognormale
Allora è lognormale. È positiva e spesso asimmetrica a destra. Modella grandezze ottenute come prodotto di molti fattori casuali positivi, per esempio alcune durate, concentrazioni, tempi e dimensioni.
Media e varianza della lognormale
La media della lognormale non è , perché la trasformazione esponenziale è convessa. La variabilità su scala logaritmica aumenta la media sulla scala originale.
Weibull
La Weibull è molto usata in affidabilità. è un parametro di scala, mentre controlla la forma del tasso di guasto. Se , si ottiene il caso esponenziale.
Rayleigh
La Rayleigh compare come modulo di un vettore bidimensionale con componenti normali indipendenti a media zero e stessa varianza. È usata in segnali, vibrazioni, errori radiali e telecomunicazioni.
Beta
La beta modella variabili limitate tra zero e uno, come proporzioni e frazioni. I parametri e controllano forma e concentrazione. È importante anche in inferenza bayesiana per probabilità di successo.
Chi-quadro
La chi-quadro con gradi di libertà nasce come somma di quadrati di normali standard indipendenti. È centrale nella stima della varianza, nei test di bontà dell’adattamento e nei test su tabelle di contingenza.
t di Student
La t di Student compare quando si standardizza una media usando una varianza stimata dal campione. Ha code più pesanti della normale standard, soprattutto per pochi gradi di libertà.
F di Fisher
La distribuzione F è rapporto di due chi-quadro indipendenti normalizzate per i rispettivi gradi di libertà. È usata per confrontare varianze, in ANOVA e nei test globali di regressione.
9. Vettori aleatori e distribuzioni congiunte
Vettore aleatorio
Un vettore aleatorio raccoglie più variabili aleatorie nello stesso modello. Serve quando le grandezze osservate sono più di una: temperatura e pressione, carico e deformazione, tempo e costo, misure su più sensori.
Ripartizione congiunta
La ripartizione congiunta descrive simultaneamente tutte le componenti. Contiene informazione sulle distribuzioni marginali e sulla dipendenza tra variabili.
Massa congiunta discreta
La probabilità congiunta assegna probabilità a coppie di valori. Le marginali si ottengono sommando:
La somma elimina la variabile che non interessa.
Densità congiunta continua
La densità congiunta va integrata su regioni del piano. Le marginali si ottengono integrando:
Integrare su una variabile significa ignorarla, sommando tutti i suoi valori possibili.
Indipendenza di variabili aleatorie
Per variabili discrete, l’indipendenza equivale a:
Per variabili continue con densità:
L’indipendenza significa che conoscere una variabile non modifica la distribuzione dell’altra.
Densità condizionata
La formula vale quando . La densità condizionata descrive la distribuzione di fissato il valore di . È una versione continua della probabilità condizionata.
Valore atteso condizionato discreto
Il valore atteso condizionato è una media aggiornata dopo aver osservato . È una funzione del valore condizionante. In previsione statistica, è spesso la migliore previsione quadratica di usando l’informazione contenuta in .
Formula dell’attesa totale
La media complessiva si ottiene mediando le medie condizionate. È l’analogo per valori attesi della formula delle probabilità totali. Aiuta a decomporre problemi complessi in scenari.
Formula della varianza totale
La variabilità totale è somma di variabilità media interna agli scenari e variabilità tra le medie degli scenari. Questa decomposizione è utile in analisi della varianza, modelli gerarchici e simulazioni.
Covarianza
La covarianza misura la tendenza di due variabili a variare insieme. Se è positiva, valori sopra la media di una tendono ad associarsi a valori sopra la media dell’altra. Se è negativa, una tende ad aumentare quando l’altra diminuisce.
Formula computazionale della covarianza
Questa forma è spesso più comoda. Se e sono indipendenti e hanno attese finite, allora , quindi la covarianza è zero. Il contrario non è sempre vero: covarianza nulla non implica indipendenza in generale.
Coefficiente di correlazione
La correlazione è la covarianza normalizzata. È compresa tra e . Misura dipendenza lineare, non dipendenza generica. Valori vicini a zero indicano assenza di relazione lineare, non necessariamente assenza di relazione.
Varianza della somma
Il termine di covarianza corregge per la dipendenza. Se e sono incorrelate, il termine misto scompare. Per molte variabili:
Ignorare covarianze può sottostimare o sovrastimare molto l’incertezza totale.
Matrice di covarianza
La matrice di covarianza raccoglie varianze sulla diagonale e covarianze fuori diagonale. È simmetrica e positiva semidefinita. Descrive la dispersione multidimensionale di un vettore aleatorio.
Normale multivariata
La densità, quando è definita positiva, è:
La matrice determina forma, orientazione e scala degli ellissoidi di densità. La normale multivariata è fondamentale in stima, regressione, controllo qualità multivariato e modelli gaussiani.
10. Somme, convergenza e teoremi limite
Somma di variabili indipendenti
Se le variabili sono indipendenti, molte proprietà della somma si semplificano. In particolare:
e, se sono indipendenti:
La seconda formula richiede assenza di covarianze.
Media campionaria teorica
Se sono indipendenti e identicamente distribuite con media e varianza , allora:
La media campionaria ha la stessa media della popolazione ma varianza più piccola. Aumentare riduce l’incertezza media come in varianza, cioè come in deviazione standard.
Errore standard della media
L’errore standard misura la dispersione della media campionaria come stimatore della media vera. Non è la deviazione standard dei dati, ma della media dei dati. Questa distinzione è essenziale nell’inferenza.
Legge debole dei grandi numeri
La media campionaria converge in probabilità alla media teorica. Significa che, aumentando la dimensione del campione, diventa sempre meno probabile osservare una media lontana da . La legge giustifica l’uso delle frequenze e delle medie campionarie come stime.
Teorema centrale del limite
Se sono indipendenti e identicamente distribuite con media e varianza finite, la media standardizzata tende in distribuzione alla normale standard. Questo risultato spiega perché la normale compare in tanti problemi anche quando i dati originari non sono normali.
Approssimazione normale della media
Per campioni abbastanza grandi, la distribuzione della media può essere approssimata con una normale. La bontà dell’approssimazione dipende dalla distribuzione di partenza: code pesanti e forte asimmetria richiedono campioni più grandi.
Approssimazione normale della binomiale
L’approssimazione funziona quando e sono sufficientemente grandi. Per probabilità discrete si usa spesso la correzione di continuità:
Il termine corregge il passaggio da conteggi discreti a intervalli continui.
Convergenza in probabilità
Per ogni tolleranza positiva , la probabilità di errore maggiore di tende a zero. È la convergenza usata per definire consistenza degli stimatori.
Convergenza in distribuzione
Significa che le funzioni di ripartizione convergono nei punti di continuità della distribuzione limite. È più debole della convergenza in probabilità ed è il linguaggio naturale del teorema centrale del limite.
Delta method
Se è derivabile in , allora:
Il delta method propaga l’incertezza attraverso trasformazioni non lineari approssimate localmente con una derivata. È molto utile per stimare errori standard di funzioni di parametri.
11. Statistica descrittiva
Campione osservato
Un campione osservato è una sequenza di dati numerici. Prima dell’osservazione si può modellare come variabili aleatorie ; dopo l’osservazione diventa una lista di valori fissati. La distinzione tra variabile aleatoria e valore osservato è fondamentale.
Media campionaria
La media campionaria sintetizza il centro dei dati. È sensibile ai valori estremi: pochi dati molto grandi o molto piccoli possono spostarla sensibilmente.
Varianza campionaria corretta
Il denominatore corregge il bias nella stima della varianza della popolazione quando la media è stimata dallo stesso campione. La quantità è il numero di gradi di libertà residui dopo aver stimato .
Deviazione standard campionaria
Riporta la dispersione alla stessa unità di misura dei dati. È più leggibile della varianza, ma eredita la sensibilità ai valori estremi.
Formula computazionale per la varianza campionaria
La formula è algebricamente equivalente alla somma degli scarti quadratici. In calcolo numerico, però, per dati molto grandi e varianze piccole può soffrire cancellazione numerica; algoritmi stabili aggiornano media e varianza progressivamente.
Mediana campionaria
La formula vale in modo diretto per dispari dopo aver ordinato i dati. Per pari, si usa spesso la media dei due valori centrali:
La mediana è robusta rispetto agli estremi: dipende dalla posizione ordinata, non dalla grandezza dei valori lontani.
Quantili campionari
Il quantile campionario di ordine è un valore sotto cui cade circa la frazione dei dati. Esistono diverse convenzioni di interpolazione; bisogna dichiarare quella usata quando i risultati devono essere riproducibili.
Range
Il range è differenza tra massimo e minimo. È semplice ma molto sensibile agli outlier. In controllo qualità può dare un’indicazione rapida della dispersione in piccoli sottogruppi.
Intervallo interquartile
Misura l’ampiezza del 50 percento centrale dei dati. È più robusto del range e della deviazione standard in presenza di code o valori estremi.
Frequenza relativa
è il numero di osservazioni nella categoria o classe . La frequenza relativa è una stima empirica della probabilità della categoria. Le frequenze relative sommano a uno.
Funzione di ripartizione empirica
La ripartizione empirica conta la frazione di osservazioni non superiori a . È una stima non parametrica della funzione di ripartizione teorica. Cresce a gradini e salta in corrispondenza dei dati osservati.
Covarianza campionaria
Misura la variazione congiunta di due serie di dati osservati a coppie. Il segno indica l’orientamento della relazione lineare. La scala dipende dalle unità di misura delle due variabili.
Correlazione campionaria
La correlazione normalizza la covarianza e produce un numero tra e . Non misura causalità e non cattura necessariamente relazioni non lineari. Va sempre accompagnata da un grafico di dispersione quando possibile.
Asimmetria campionaria
L’asimmetria misura se la distribuzione empirica ha una coda più pronunciata a destra o a sinistra. Valori positivi indicano coda destra più lunga; valori negativi indicano coda sinistra più lunga.
Curtosi campionaria
La curtosi in eccesso confronta la pesantezza delle code con quella della normale, per cui il valore teorico è zero. Valori alti suggeriscono code pesanti o outlier frequenti.
12. Campionamento e distribuzioni campionarie
Campione casuale semplice
Questa ipotesi, spesso abbreviata come i.i.d., significa che le osservazioni hanno la stessa distribuzione e non si influenzano tra loro. Molte formule inferenziali classiche dipendono da questa ipotesi.
Media campionaria come stimatore
Prima di osservare i dati, la media campionaria è una variabile aleatoria. Dopo l’osservazione assume il valore numerico . Come stimatore di , ha:
quindi è non distorta.
Varianza campionaria come stimatore
Se le osservazioni sono i.i.d. con varianza , allora:
Il denominatore rende lo stimatore non distorto.
Distribuzione della media per popolazione normale
Se i dati sono normali, la media campionaria è esattamente normale per ogni , non solo asintoticamente. Questo rende esatti molti intervalli e test classici.
Distribuzione della varianza campionaria normale
La formula vale per campione da popolazione normale. È la base degli intervalli di confidenza per la varianza e dei test sulla varianza.
Statistica t per media con varianza ignota
La sostituzione di con introduce incertezza aggiuntiva, rappresentata dalla distribuzione t. Quando cresce, la t si avvicina alla normale standard.
Proporzione campionaria
Se , è la frequenza relativa di successi. Ha:
È lo stimatore naturale di una probabilità di successo.
Approssimazione normale della proporzione
L’approssimazione è ragionevole quando il numero atteso di successi e insuccessi è abbastanza grande. Se è vicino a zero o uno, possono servire metodi esatti o intervalli corretti.
13. Stima puntuale
Parametro e stimatore
Il parametro è una quantità del modello, fissa ma ignota. Lo stimatore è una funzione del campione, quindi una variabile aleatoria prima dell’osservazione. La stima è il valore numerico ottenuto sui dati osservati.
Bias
Il bias misura lo scostamento medio dello stimatore dal parametro vero. Uno stimatore è non distorto se il bias è zero. Non distorsione non significa automaticamente precisione: serve anche bassa varianza.
Errore quadratico medio
L’MSE combina bias e varianza:
Uno stimatore leggermente distorto può avere MSE minore di uno non distorto se riduce molto la varianza.
Consistenza
Uno stimatore è consistente se converge in probabilità al parametro vero al crescere del campione. La consistenza è una proprietà asintotica: non garantisce che per piccoli campioni la stima sia accurata.
Efficienza relativa
A parità di non distorsione, lo stimatore con varianza minore è più efficiente. La definizione può variare nelle convenzioni, quindi va sempre chiarito quale rapporto si usa.
Metodo dei momenti
Il metodo dei momenti uguaglia momenti teorici e momenti campionari:
Si ottiene un sistema di equazioni per stimare i parametri. È spesso semplice, ma non sempre ottimale in efficienza.
Verosimiglianza
Per dati indipendenti, la verosimiglianza è il prodotto delle densità o masse valutate nei dati osservati. Come funzione di , misura quanto il modello con quel parametro rende plausibili i dati osservati.
Log-verosimiglianza
Il log trasforma il prodotto in somma. Massimizzare equivale a massimizzare , perché il logaritmo è crescente. La log-verosimiglianza è più stabile numericamente e più facile da derivare.
Massima verosimiglianza
Lo stimatore di massima verosimiglianza sceglie il parametro che massimizza la plausibilità dei dati osservati. Spesso si trova risolvendo:
e verificando massimo, vincoli e bordo dello spazio parametrico.
Informazione di Fisher
L’informazione di Fisher misura quanta informazione sul parametro è contenuta in un’osservazione. Maggiore informazione implica, in linea di principio, stime più precise.
Limite di Cramér-Rao
Per stimatori non distorti sotto ipotesi regolari, la varianza non può scendere sotto questo limite. È un riferimento teorico per valutare l’efficienza di uno stimatore.
Sufficienza intuitiva
Una statistica è sufficiente per se conserva tutta l’informazione del campione riguardo a . In pratica, dopo aver conosciuto , il resto dei dati non aggiunge informazione sul parametro. È una nozione centrale per compressione statistica del campione.
14. Intervalli di confidenza
Forma generale
Un intervallo di confidenza combina stima puntuale, quantile della distribuzione di riferimento ed errore standard. Il livello non significa che il parametro casualmente cada nell’intervallo dopo aver osservato i dati; nel quadro frequentista, il metodo produce intervalli che coprono il parametro nel lungo periodo con frequenza .
Intervallo per media normale con varianza nota
La formula vale se la popolazione è normale o se è grande e è nota. Il quantile appartiene alla normale standard. Per il 95 percento, è circa .
Intervallo per media con varianza ignota
Quando è ignota, si usa la deviazione standard campionaria e il quantile t con gradi di libertà. È esatto per popolazione normale e spesso approssimato per campioni grandi.
Intervallo per proporzione
È l’intervallo normale approssimato per una proporzione. Può essere impreciso per campioni piccoli o proporzioni vicine a zero o uno. In quei casi sono preferibili intervalli più robusti, come Wilson o metodi esatti.
Intervallo di Wilson per proporzione
L’intervallo di Wilson corregge alcune debolezze dell’intervallo normale semplice, soprattutto con campioni piccoli o proporzioni estreme. È spesso più affidabile senza diventare troppo complesso.
Intervallo per varianza normale
La formula deriva dalla distribuzione chi-quadro della varianza campionaria per dati normali. I quantili appaiono invertiti perché la quantità ignota è al denominatore della statistica pivot.
Intervallo per differenza tra medie indipendenti con varianze note
La varianza della differenza è somma delle varianze delle due medie se i campioni sono indipendenti. La formula è utile per confrontare due processi, due materiali o due condizioni operative.
Intervallo per differenza tra proporzioni
Serve per confrontare due tassi di successo, difetto o guasto. Richiede campioni indipendenti e approssimazione normale ragionevole.
Ampiezza e dimensione campionaria per media
è il margine di errore desiderato. La formula dice che dimezzare l’errore richiede circa quadruplicare il campione. Se non è nota, si usa una stima preliminare.
Ampiezza e dimensione campionaria per proporzione
Se non è noto, la scelta conservativa è , che massimizza . Anche qui la dimensione cresce con il quadrato dell’inverso del margine di errore.
15. Test di ipotesi
Ipotesi nulla e alternativa
L’ipotesi nulla rappresenta il modello di riferimento da mettere alla prova. L’alternativa rappresenta ciò che si vuole rilevare. Un test non dimostra che sia vera: decide se i dati sono sufficientemente incompatibili con rispetto a una soglia di rischio.
Livello di significatività
è la probabilità massima tollerata di errore di primo tipo. Scegliere significa accettare un rischio del 5 percento di rifiutare una nulla vera, nel lungo periodo.
Errore di secondo tipo e potenza
La potenza è:
La potenza misura la capacità del test di rilevare un effetto reale. A parità di tutto il resto, aumenta con la dimensione campionaria e con l’entità dell’effetto.
Statistica test
La statistica test riassume i dati in una quantità confrontabile con una distribuzione nota sotto . La regione critica contiene i valori di considerati troppo estremi per essere compatibili con .
p-value
Il p-value è calcolato assumendo vera l’ipotesi nulla. Non è la probabilità che sia vera. Un p-value piccolo indica che i dati sarebbero rari sotto .
Regola decisionale
Se il p-value è sotto la soglia scelta, il risultato è statisticamente significativo al livello . La significatività statistica non coincide necessariamente con importanza pratica o ingegneristica.
Test z per media con varianza nota
Sotto , se le ipotesi sono soddisfatte, segue una normale standard. Si usa quando la varianza è nota o quando l’approssimazione normale è giustificata e può essere considerata nota.
Test t per media con varianza ignota
Sotto normalità della popolazione, segue una t con gradi di libertà. È il test più comune per la media di un singolo campione quando la varianza è stimata.
Test su proporzione
Nel denominatore si usa perché la distribuzione della statistica è calcolata sotto l’ipotesi nulla. L’approssimazione normale richiede conteggi attesi sufficientemente grandi.
Test chi-quadro per varianza
Sotto e normalità, la statistica segue una chi-quadro con gradi di libertà. È sensibile alla violazione dell’ipotesi di normalità.
Test F per confronto tra varianze
Se i due campioni sono indipendenti e normali, sotto uguaglianza delle varianze la statistica segue una F con gradi di libertà e . Spesso si mette al numeratore la varianza campionaria maggiore per lavorare nella coda destra.
Test t per due medie con varianze uguali
dove la varianza pooled è:
La formula assume varianze uguali nelle due popolazioni. Se l’ipotesi è dubbia, è spesso preferibile il test di Welch.
Test di Welch
Il test di Welch non assume varianze uguali. I gradi di libertà sono approssimati con la formula di Welch-Satterthwaite. È una scelta robusta per confronti tra due medie con varianze campionarie diverse.
Test per dati appaiati
Quando le osservazioni sono accoppiate, il confronto va fatto sulle differenze entro coppia. Questo elimina parte della variabilità tra unità e aumenta la potenza se l’appaiamento è informativo.
Test chi-quadro di bontà dell’adattamento
sono frequenze osservate, frequenze attese sotto il modello. La statistica misura discrepanza relativa tra dati e attese. Le frequenze attese dovrebbero essere sufficientemente grandi per giustificare l’approssimazione chi-quadro.
Test chi-quadro di indipendenza
In una tabella di contingenza, è il totale della riga , il totale della colonna . Sotto indipendenza, l’atteso nella cella è prodotto dei marginali diviso per il totale. La statistica è:
Misura quanto la tabella osservata si discosta da quella attesa sotto indipendenza.
16. Regressione lineare
Modello di regressione lineare semplice
è la risposta, il predittore, l’intercetta, la pendenza ed l’errore. Il modello assume che la media condizionata di sia una funzione lineare di .
Stime dei minimi quadrati
La pendenza stimata è covarianza campionaria divisa per varianza campionaria di , a fattori comuni cancellati. L’intercetta è scelta in modo che la retta passi per il punto medio .
Valori stimati e residui
Il valore stimato è la previsione del modello sul punto osservato. Il residuo è l’errore osservato. Analizzare i residui serve a controllare linearità, varianza costante, outlier e struttura non modellata.
Somma dei quadrati residui
I minimi quadrati scelgono i coefficienti che minimizzano SSE. Penalizzare i quadrati rende il problema derivabile e dà più peso agli errori grandi.
Decomposizione della variabilità
dove:
SST è variabilità totale della risposta, SSR è variabilità spiegata dal modello, SSE è variabilità residua. La decomposizione vale con intercetta nel modello.
Coefficiente di determinazione
misura la frazione di variabilità campionaria di spiegata dal modello lineare. Non garantisce causalità, correttezza del modello o buona capacità predittiva fuori dal dominio osservato.
Modello lineare multiplo
è la matrice del disegno, il vettore dei coefficienti, il vettore degli errori. Ogni riga di rappresenta un’osservazione, ogni colonna un predittore o un termine del modello.
Stima dei minimi quadrati multipla
La formula richiede che sia invertibile, cioè che le colonne di siano linearmente indipendenti. Se c’è multicollinearità perfetta, i coefficienti non sono identificabili in modo unico.
Equazioni normali
I residui sono ortogonali a tutte le colonne della matrice del disegno. Questa è la condizione geometrica dei minimi quadrati: la previsione è la proiezione ortogonale di sullo spazio generato dai predittori.
Stima della varianza degli errori
è il numero di parametri stimati, inclusa l’intercetta se presente. Il denominatore è il numero di gradi di libertà residui.
Varianza dei coefficienti stimati
Sotto le ipotesi classiche, questa matrice descrive l’incertezza dei coefficienti. In pratica viene sostituita da . Diagonali grandi indicano coefficienti stimati con scarsa precisione.
Test t su un coefficiente
Serve a verificare se un coefficiente differisce da un valore ipotizzato, spesso zero. Il test dipende dal modello completo: un coefficiente misura l’effetto del predittore mantenendo fissi gli altri predittori inclusi.
Test F globale di regressione
Nel modello con intercetta, il test globale verifica se almeno un predittore ha coefficiente non nullo. Confronta variabilità spiegata per grado di libertà e variabilità residua per grado di libertà.
Predizione
La previsione in un nuovo punto si ottiene applicando i coefficienti stimati. L’incertezza della previsione cresce quando è lontano dalla regione dei dati osservati. Interpolare è molto più affidabile che estrapolare.
17. ANOVA e confronto tra gruppi
Modello ANOVA a un fattore
indica il gruppo, l’osservazione nel gruppo. è la media generale, l’effetto del gruppo. L’obiettivo è capire se le medie dei gruppi possono essere considerate uguali o se almeno una differisce.
Ipotesi ANOVA
L’alternativa è che almeno una media sia diversa. Il test non dice automaticamente quali gruppi differiscono: per quello servono confronti post-hoc o contrasti pianificati.
Somma dei quadrati tra gruppi
Misura quanto le medie dei gruppi si discostano dalla media generale, pesando per le numerosità. Se le medie di gruppo sono molto diverse, SSB è grande.
Somma dei quadrati entro gruppi
Misura la variabilità interna ai gruppi. È la variabilità non spiegata dall’appartenenza al gruppo.
Statistica F dell’ANOVA
Il numeratore è la variabilità media tra gruppi; il denominatore è la variabilità media entro gruppi. Se è vera, queste due quantità dovrebbero essere comparabili. Valori grandi di indicano differenze tra medie più grandi di quanto atteso dalla variabilità interna.
Decomposizione ANOVA
La variabilità totale si separa in variabilità spiegata dal fattore e variabilità residua. Questa identità è analoga alla decomposizione della regressione lineare.
Dimensione dell’effetto eta quadrato
misura la quota di variabilità totale attribuibile al fattore. È una misura di importanza pratica, non solo di significatività statistica.
18. Affidabilità, rischio e tempi di guasto
Tempo al guasto
rappresenta la durata fino al guasto di un componente o sistema. È una variabile aleatoria non negativa. La sua distribuzione descrive il comportamento affidabilistico.
Funzione di affidabilità
è la probabilità che il sistema funzioni oltre il tempo . Decresce con e vale se il sistema è inizialmente funzionante con certezza.
Densità di guasto
Se la distribuzione è continua, la densità di guasto è la derivata negativa della sopravvivenza. La densità descrive dove si concentra probabilisticamente il tempo di guasto.
Tasso di guasto
Il tasso di guasto è una probabilità istantanea condizionata alla sopravvivenza fino a . Non è una probabilità pura, perché ha dimensione inversa del tempo. Interpreta il rischio residuo di guasto.
Affidabilità da tasso di guasto
Questa formula ricostruisce la sopravvivenza dal tasso di guasto. Se il tasso è costante , si ottiene:
cioè il modello esponenziale.
MTTF
Per variabili non negative, il valore atteso può essere calcolato integrando la funzione di sopravvivenza. MTTF significa mean time to failure ed è una misura media di durata fino al guasto.
Sistema in serie
La formula vale per componenti indipendenti quando il sistema funziona solo se tutti i componenti funzionano. Il sistema in serie è più fragile dei singoli componenti: basta un guasto per fermarlo.
Sistema in parallelo
Il sistema funziona se almeno un componente funziona. Si calcola il complementare: tutti i componenti sono guasti. La formula richiede indipendenza dei tempi di guasto.
Disponibilità stazionaria
La disponibilità considera sia guasti sia riparazioni. MTTR è il tempo medio di riparazione. Un sistema può avere guasti relativamente frequenti ma alta disponibilità se viene riparato molto rapidamente.
19. Processi stocastici essenziali
Processo stocastico
Un processo stocastico è una famiglia di variabili aleatorie indicizzate dal tempo o da un altro parametro. Se è discreto, si scrive spesso ; se è continuo, .
Processo di Bernoulli
Una successione di prove Bernoulli indipendenti con stessa probabilità genera conteggi binomiali. È il modello base per successi e insuccessi ripetuti.
Processo di Poisson
conta il numero di eventi avvenuti entro il tempo . Il parametro è l’intensità media per unità di tempo. Il processo ha incrementi indipendenti e stazionari.
Tempi interarrivo nel processo di Poisson
Nel processo di Poisson, i tempi tra eventi consecutivi sono esponenziali indipendenti con lo stesso tasso . Questo collega conteggi Poisson e tempi di attesa esponenziali.
Catena di Markov discreta
La proprietà di Markov dice che, dato lo stato presente, il futuro non dipende dal passato. È un modello di memoria corta, adatto a sistemi che evolvono per stati.
Matrice di transizione
Ogni riga della matrice di transizione contiene probabilità e quindi somma a uno:
La matrice descrive le probabilità di passaggio da uno stato all’altro in un passo.
Distribuzione dopo n passi
Se è la distribuzione iniziale sugli stati, moltiplicare per dà la distribuzione dopo passi. Le potenze della matrice di transizione descrivono l’evoluzione probabilistica.
Distribuzione stazionaria
Una distribuzione stazionaria resta invariata dopo una transizione. Se la catena parte da , mantiene la stessa distribuzione a ogni passo. In molte catene regolari, converge a indipendentemente dallo stato iniziale.
Processo stazionario in senso debole
La media è costante nel tempo e la covarianza dipende solo dal ritardo , non dall’istante assoluto . Questa è una nozione importante per serie temporali, segnali e rumore.
Autocorrelazione
L’autocorrelazione misura la dipendenza lineare tra il processo e sé stesso dopo un ritardo . Valori elevati indicano memoria temporale; valori vicini a zero indicano scarsa dipendenza lineare a quel ritardo.
20. Schemi operativi da esame
Impostare un problema di probabilità
Prima si definisce lo spazio degli esiti, poi l’evento richiesto, infine si sceglie il metodo di calcolo: conteggio, complementare, condizionamento, indipendenza o decomposizione per casi. Saltare la definizione degli eventi porta spesso a usare formule corrette nel contesto sbagliato.
Riconoscere il modello discreto
Se le prove sono indipendenti, identiche e con due esiti, il conteggio è binomiale. Se invece si campiona senza reinserimento da popolazione finita, il modello è ipergeometrico. Se si contano eventi rari in un intervallo, il modello può essere Poisson.
Riconoscere il modello continuo
Tempi di attesa con tasso costante suggeriscono l’esponenziale. Errori di misura come somma di molti contributi piccoli suggeriscono la normale. Tempi di vita con tasso non costante suggeriscono spesso Weibull o gamma.
Calcolare una probabilità continua
Nel continuo non si sommano probabilità puntuali. Si integra la densità sulla regione richiesta. Se la variabile è trasformata, bisogna correggere con il cambio di variabile.
Risolvere un problema con Bayes
P(H_j\mid E)= \frac{P(E\mid H_j)P(H_j)} \sum_i P(E\mid H_i)P(H_i)}Si individuano ipotesi alternative complete e disgiunte. Si calcolano probabilità iniziali e probabilità dell’evidenza sotto ciascuna ipotesi. Solo alla fine si normalizza con la probabilità totale dell’evidenza.
Costruire un intervallo di confidenza
Bisogna identificare il parametro, scegliere la distribuzione pivot corretta, stimare l’errore standard e usare il quantile coerente con il livello desiderato. La scelta tra normale, t, chi-quadro o F dipende dal parametro e dalle ipotesi.
Eseguire un test di ipotesi
Si dichiarano ipotesi, livello di significatività e statistica test prima di guardare la decisione. Poi si calcola il p-value o si confronta la statistica con la regione critica. La conclusione deve sempre essere espressa nel linguaggio del problema, non solo come “rifiuto” o “non rifiuto”.
Scegliere tra test indipendente e appaiato
Se ogni osservazione di un gruppo è naturalmente collegata a una dell’altro, si usa il test appaiato sulle differenze. Se i due campioni sono formati da unità diverse e indipendenti, si usa un test per campioni indipendenti. Confondere i due casi altera errore standard e potenza.
Interpretare una regressione
Si controllano segno, unità di misura e incertezza dei coefficienti. Un coefficiente in regressione multipla è un effetto condizionato agli altri predittori. Prima di fidarsi del modello, si guardano residui, outlier, linearità, varianza costante e collinearità.
Distinguere significatività e rilevanza
Con campioni molto grandi anche effetti minuscoli possono risultare significativi. Con campioni piccoli effetti importanti possono non essere rilevati. Per una decisione ingegneristica servono dimensione dell’effetto, intervallo di confidenza, costo dell’errore e contesto fisico.
Controllo finale di coerenza statistica
Ogni esercizio o analisi di Probabilità e Statistica va chiuso verificando questi cinque elementi. I dati dicono che cosa è stato osservato; il modello dice come viene rappresentata l’incertezza; le ipotesi dicono quando le formule sono valide; l’incertezza quantifica il margine di errore; la decisione traduce il risultato in linguaggio operativo.