Apprendimento Supervisionato

L’apprendimento supervisionato è il paradigma del machine learning in cui un modello $f_\theta: \mathcal{X} \to \mathcal{Y}$ viene addestrato su un insieme di coppie etichettate $\{(\vec{x}_i, y_i)\}_{i=1}^n$ per minimizzare una funzione di perdita $\mathcal{L}$ , approssimando la funzione di mappatura sottostante tra input e output.

Task Principali

Regressione: L’output è un valore numerico continuo. Esempio: prevedere la temperatura di un reattore chimico basandosi sulla pressione e sul tempo.
Classificazione: L’output è una categoria discreta (etichetta). Esempio: decidere se un pezzo meccanico è “conforme” o “difettoso” basandosi su una scansione laser.

Algoritmi Comuni

Regressione Lineare
Regressione Logistica
Alberi di Decisione
Random Forest
Support Vector Machines (SVM)
Reti Neurali Artificiali

Processo di Addestramento

L’obiettivo è minimizzare una funzione di perdita (Loss Function), che misura l’errore tra la previsione del modello e l’etichetta reale. Il modello viene poi validato su dati “mai visti” (Test Set) per verificarne la capacità di generalizzazione.

Funzioni di perdita fondamentali

Per la regressione: $\mathcal{L}_{MSE} = \frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2 \qquad \text{(Mean Squared Error)}$

Per la classificazione binaria: $\mathcal{L}_{BCE} = -\frac{1}{n}\sum_{i=1}^n \left[y_i \log \hat{p}_i + (1-y_i)\log(1-\hat{p}_i)\right] \qquad \text{(Binary Cross-Entropy)}$

La minimizzazione avviene tipicamente tramite discesa del gradiente stocastica (SGD) o sue varianti (Adam, RMSProp).

Significato Ingegneristico

Soft-Sensors: In ingegneria dei processi, si usano modelli supervisionati per stimare grandezze difficili da misurare in tempo reale (es. concentrazione chimica) a partire da grandezze facili da misurare (es. temperatura, flusso).
Visione Artificiale: Robot industriali che riconoscono e afferrano oggetti specifici su un nastro trasportatore dopo essere stati addestrati su migliaia di immagini etichettate.
Previsione dei Carichi Energetici: Gestione delle reti elettriche intelligenti (Smart Grids) prevedendo la domanda basandosi su dati storici e meteo.

Vedi anche: Apprendimento Non Supervisionato, Alberi di Decisione, Regressione Lineare, Matrice di Confusione.