La regola della catena (chain rule) è la regola di derivazione per le funzioni composte. Nel contesto di più variabili, essa mette in relazione le derivate della funzione risultante con le derivate (o i gradienti) delle funzioni componenti.
Formulazione Generale
Data una funzione composta h(\mathbf{t}) = f(\mathbf{g}(\mathbf{t})), la sua matrice Jacobiana è il prodotto delle matrici Jacobiane delle funzioni componenti: J_h(\mathbf{t}) = J_f(\mathbf{g}(\mathbf{t})) \cdot J_{\mathbf{g}}(\mathbf{t})
Caso Particolare: Derivata lungo una curva
Se f(x, y) è una funzione scalare e x(t), y(t) sono le equazioni di una curva, la derivata totale di f rispetto al tempo t è: \frac{df}{dt} = \frac{\partial f}{\partial x} \frac{dx}{dt} + \frac{\partial f}{\partial y} \frac{dy}{dt} = \nabla f \cdot \mathbf{v}(t) dove \nabla f è il gradiente e \mathbf{v}(t) è il vettore velocità della curva.
Significato Ingegneristico
- Controlli Automatici: È fondamentale per calcolare la sensibilità di un’uscita rispetto a una variazione dei parametri interni in sistemi a cascata.
- Dinamica: Calcolo delle accelerazioni e velocità in meccanismi complessi (es. robot manipolatori) dove la posizione è funzione di angoli che a loro volta variano nel tempo.
- Ottimizzazione (Backpropagation): L’addestramento delle reti neurali si basa interamente sulla regola della catena per calcolare il gradiente della funzione di errore rispetto ai pesi dei vari strati.