Una catena di Markov a tempo discreto è un processo stocastico \{X_n\}_{n\ge 0} osservato in istanti discreti, con valori in uno spazio di stati finito o numerabile, in cui l’evoluzione futura dipende solo dallo stato presente e non dall’intera storia passata.
La proprietà di Markov si scrive:
In altre parole, lo stato corrente è una sintesi sufficiente del passato per prevedere probabilisticamente il passo successivo. La catena non è deterministica: da uno stesso stato possono partire più transizioni possibili, ciascuna con una probabilità assegnata.
Matrice di transizione
Nel caso omogeneo nel tempo, le probabilità di passaggio non dipendono dall’indice n e sono raccolte nella matrice di transizione P:
Ogni riga di P è una distribuzione di probabilità:
Se la distribuzione iniziale è il vettore riga \boldsymbol{\pi}_0, la distribuzione dopo un passo è:
Dopo n passi:
La potenza P^n contiene le probabilità di transizione in n passi. L’elemento (i,j) di P^n è:
Questa struttura rende le catene di Markov molto pratiche: molti problemi dinamici diventano problemi di algebra lineare su matrici stocastiche.
Stati, classi e ricorrenza
Gli stati di una catena non hanno tutti lo stesso ruolo. Uno stato j è raggiungibile da i se esiste un numero di passi n tale che p_{ij}^{(n)}>0. Due stati comunicano se ciascuno è raggiungibile dall’altro. Le classi di comunicazione raggruppano stati che, dal punto di vista della dinamica, appartengono alla stessa regione del grafo delle transizioni.
Una catena è irriducibile quando tutti gli stati comunicano tra loro. In questo caso non esistono sottosistemi probabilistici isolati: partendo da qualunque stato, ogni altro stato è raggiungibile con probabilità positiva in un numero opportuno di passi.
Altri concetti importanti sono:
- stato assorbente, se una volta raggiunto non viene più lasciato;
- stato transiente, se può essere visitato solo un numero finito di volte con probabilità positiva;
- stato ricorrente, se la catena ritorna allo stato con probabilità 1;
- periodo, legato ai possibili tempi di ritorno allo stesso stato;
- classe chiusa, se non esistono transizioni verso stati esterni alla classe.
In affidabilità, manutenzione e modellazione del degrado, gli stati assorbenti rappresentano spesso guasto, fermo impianto o completamento di una procedura.
Distribuzione stazionaria
Una distribuzione \boldsymbol{\pi} è stazionaria se resta invariata dopo una transizione:
La stazionarietà non significa che il singolo sistema rimane fermo nello stesso stato, ma che la distribuzione probabilistica complessiva non cambia nel tempo. In una catena regolare o ergodica, la distribuzione a lungo termine tende spesso alla distribuzione stazionaria indipendentemente dallo stato iniziale:
Le condizioni precise dipendono da irriducibilità, aperiodicità e ricorrenza positiva. Ignorare queste ipotesi è un errore comune: non ogni matrice stocastica ammette un comportamento limite semplice, e la presenza di stati assorbenti o classi chiuse multiple può rendere il limite dipendente dalla condizione iniziale.
Interpretazione ingegneristica
In ingegneria le catene discrete modellano sistemi che cambiano stato per cicli, lotti, campioni o iterazioni successive:
- degrado di componenti con stati “nuovo”, “usurato”, “critico”, “guasto”;
- code osservate a intervalli regolari, collegate alla teoria delle code;
- affidabilità di reti e sistemi ridondanti;
- algoritmi randomizzati e metodi Monte Carlo;
- controlli di qualità sequenziali;
- modelli di traffico, mobilità e disponibilità di risorse.
Il vantaggio è la semplicità: la dinamica è descritta da una matrice. Il limite è che la proprietà di Markov può essere troppo restrittiva. Se il futuro dipende da età, memoria accumulata, carico storico o tempo trascorso nello stato, occorre arricchire lo spazio degli stati oppure usare un modello diverso.
Vedi anche: Processo stocastico, Matrice di transizione, Stazionarietà, Teoria delle code.