Apprendimento Supervisionato

Indice dei contenuti

    L’apprendimento supervisionato è il paradigma del machine learning in cui un modello fθ:XYf_\theta: \mathcal{X} \to \mathcal{Y} viene addestrato su un insieme di coppie etichettate {(xi,yi)}i=1n\{(\vec{x}_i, y_i)\}_{i=1}^n per minimizzare una funzione di perdita L\mathcal{L}, approssimando la funzione di mappatura sottostante tra input e output.

    Task Principali

    1. Regressione: L’output è un valore numerico continuo. Esempio: prevedere la temperatura di un reattore chimico basandosi sulla pressione e sul tempo.
    2. Classificazione: L’output è una categoria discreta (etichetta). Esempio: decidere se un pezzo meccanico è “conforme” o “difettoso” basandosi su una scansione laser.

    Algoritmi Comuni

    Processo di Addestramento

    L’obiettivo è minimizzare una funzione di perdita (Loss Function), che misura l’errore tra la previsione del modello e l’etichetta reale. Il modello viene poi validato su dati “mai visti” (Test Set) per verificarne la capacità di generalizzazione.

    Funzioni di perdita fondamentali

    Per la regressione: LMSE=1ni=1n(yiy^i)2(Mean Squared Error)\mathcal{L}_{MSE} = \frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2 \qquad \text{(Mean Squared Error)}

    Per la classificazione binaria: LBCE=1ni=1n[yilogp^i+(1yi)log(1p^i)](Binary Cross-Entropy)\mathcal{L}_{BCE} = -\frac{1}{n}\sum_{i=1}^n \left[y_i \log \hat{p}_i + (1-y_i)\log(1-\hat{p}_i)\right] \qquad \text{(Binary Cross-Entropy)}

    La minimizzazione avviene tipicamente tramite discesa del gradiente stocastica (SGD) o sue varianti (Adam, RMSProp).

    Significato Ingegneristico

    • Soft-Sensors: In ingegneria dei processi, si usano modelli supervisionati per stimare grandezze difficili da misurare in tempo reale (es. concentrazione chimica) a partire da grandezze facili da misurare (es. temperatura, flusso).
    • Visione Artificiale: Robot industriali che riconoscono e afferrano oggetti specifici su un nastro trasportatore dopo essere stati addestrati su migliaia di immagini etichettate.
    • Previsione dei Carichi Energetici: Gestione delle reti elettriche intelligenti (Smart Grids) prevedendo la domanda basandosi su dati storici e meteo.

    Vedi anche: Apprendimento Non Supervisionato, Alberi di Decisione, Regressione Lineare, Matrice di Confusione.

    Ultimo aggiornamento: