Regola della Catena — ingegnerismo.it

La regola della catena (chain rule) è la regola di derivazione per le funzioni composte. Nel contesto di più variabili, essa mette in relazione le derivate della funzione risultante con le derivate (o i gradienti) delle funzioni componenti.

Formulazione Generale

Data una funzione composta $h(\mathbf{t}) = f(\mathbf{g}(\mathbf{t}))$ , la sua matrice Jacobiana è il prodotto delle matrici Jacobiane delle funzioni componenti: $J_h(\mathbf{t}) = J_f(\mathbf{g}(\mathbf{t})) \cdot J_{\mathbf{g}}(\mathbf{t})$

Caso Particolare: Derivata lungo una curva

Se $f(x, y)$ è una funzione scalare e $x(t), y(t)$ sono le equazioni di una curva, la derivata totale di $f$ rispetto al tempo $t$ è: $\frac{df}{dt} = \frac{\partial f}{\partial x} \frac{dx}{dt} + \frac{\partial f}{\partial y} \frac{dy}{dt} = \nabla f \cdot \mathbf{v}(t)$ dove $\nabla f$ è il gradiente e $\mathbf{v}(t)$ è il vettore velocità della curva.

Significato Ingegneristico

Controlli Automatici: È fondamentale per calcolare la sensibilità di un’uscita rispetto a una variazione dei parametri interni in sistemi a cascata.
Dinamica: Calcolo delle accelerazioni e velocità in meccanismi complessi (es. robot manipolatori) dove la posizione è funzione di angoli che a loro volta variano nel tempo.
Ottimizzazione (Backpropagation): L’addestramento delle reti neurali si basa interamente sulla regola della catena per calcolare il gradiente della funzione di errore rispetto ai pesi dei vari strati.