Uno spazio di Hilbert a kernel riproducente, indicato spesso con RKHS (reproducing kernel Hilbert space), è uno spazio di Hilbert formato da funzioni in cui valutare una funzione in un punto è un’operazione continua. Questa continuità permette di rappresentare ogni valutazione tramite un kernel.
Se \mathcal H è uno spazio di funzioni su un insieme S, la proprietà chiave è che per ogni x\in S esiste una funzione K_x\in\mathcal H tale che
La funzione K:S\times S\to\mathbb C definita da K_x(y)=K(y,x) è il kernel riproducente dello spazio.
Proprietà riproducente
La parola “riproducente” indica che il valore puntuale f(x) viene riprodotto da un prodotto scalare nello spazio di funzioni.
| Concetto | Formula | Ruolo |
|---|---|---|
| Valutazione puntuale | \displaystyle L_x(f)=f(x) | Trasforma una funzione in un numero. |
| Rappresentante di Riesz | \displaystyle K_x\in\mathcal H | Rappresenta il funzionale di valutazione. |
| Proprietà riproducente | \displaystyle f(x)=\langle f,K_x\rangle_{\mathcal H} | Recupera il valore della funzione con un prodotto scalare. |
| Kernel | \displaystyle K(x,y)=\langle K_y,K_x\rangle_{\mathcal H} | Codifica la geometria dello spazio. |
La convenzione sul lato complesso del prodotto scalare può cambiare tra testi diversi. Il contenuto matematico resta lo stesso: il kernel rappresenta i funzionali di valutazione e ricostruisce i valori puntuali delle funzioni.
Kernel positivo-definito
Ogni kernel riproducente è una funzione positiva-definita. Infatti, per punti x_1,\ldots,x_n\in S e coefficienti c_1,\ldots,c_n,
Il risultato inverso è altrettanto importante: ogni kernel positivo-definito genera un unico RKHS, a meno di isometrie naturali. Questa corrispondenza è il motivo per cui i metodi kernel possono lavorare con prodotti scalari impliciti senza costruire esplicitamente lo spazio delle feature.
| Direzione | Ipotesi | Conclusione |
|---|---|---|
| Da RKHS a kernel | \displaystyle \mathcal H ha valutazioni puntuali continue | Il kernel riproducente è positivo-definito. |
| Da kernel a RKHS | \displaystyle K è positivo-definito | Esiste un RKHS con kernel \displaystyle K. |
| Geometria implicita | \displaystyle K(x,y)=\langle K_y,K_x\rangle_{\mathcal H} | Il kernel agisce come prodotto scalare tra feature. |
Feature map e kernel trick
Un modo operativo di leggere un RKHS è attraverso la mappa di feature
Allora il kernel è un prodotto scalare implicito:
Nelle support vector machine, questa identità permette di sostituire prodotti scalari tra vettori trasformati con valori del kernel. È il kernel trick: si lavora in uno spazio di funzioni potenzialmente infinito-dimensionale senza rappresentare direttamente tutte le coordinate.
| Oggetto | Formula | Interpretazione |
|---|---|---|
| Feature implicita | \displaystyle \Phi(x)=K_x | Punto del dominio visto come funzione nello spazio RKHS. |
| Prodotto scalare implicito | \displaystyle K(x,y)=\langle \Phi(y),\Phi(x)\rangle_{\mathcal H} | Similarità calcolata senza coordinate esplicite. |
| Modello lineare nello spazio feature | \displaystyle f(x)=\langle w,K_x\rangle_{\mathcal H} | Diventa una funzione non lineare nel dominio originale. |
| Regolarizzazione | \displaystyle \lVert f\rVert_{\mathcal H}^2 | Penalizza complessità e oscillazioni nello spazio indotto dal kernel. |
Esempi di kernel
| Kernel | Formula | Uso tipico |
|---|---|---|
| Lineare | \displaystyle K(x,y)=x^Ty | Modelli lineari e margini in spazi vettoriali finiti. |
| Polinomiale | \displaystyle K(x,y)=(x^Ty+c)^p | Interazioni tra feature fino al grado \displaystyle p. |
| Gaussiano RBF | \displaystyle K(x,y)=\exp(-\gamma\lVert x-y\rVert^2) | Frontiere lisce e non lineari. |
| Covarianza gaussiana | \displaystyle K(s,t)=\operatorname{Cov}(X_s,X_t) | Processi gaussiani e campi aleatori. |
Questi kernel non hanno tutti lo stesso RKHS: cambiare kernel significa cambiare geometria, nozione di regolarità e classe di funzioni preferite dal modello.
Schema operativo
| Passo | Controllo | Esito |
|---|---|---|
| 1 | Scegliere un kernel \displaystyle K | Definisce la similarità tra punti. |
| 2 | Verificare positiva-definitezza | Garantisce che esista un RKHS associato. |
| 3 | Usare \displaystyle K(x,y) al posto di un prodotto scalare | Evita di costruire feature esplicite. |
| 4 | Regolarizzare con \displaystyle \lVert f\rVert_{\mathcal H}^2 | Controlla la complessità della funzione stimata. |
| 5 | Interpretare il modello nel dominio originale | Una regola lineare in RKHS può essere non lineare nei dati. |
Errori comuni
- Pensare che ogni funzione di similarità sia un kernel valido: per generare un RKHS serve positiva-definitezza.
- Confondere il kernel informatico con il kernel matematico: qui “kernel” significa funzione di similarità o nucleo integrale, non nucleo di sistema operativo.
- Credere che lo spazio feature sia sempre finito-dimensionale: molti RKHS, come quelli associati al kernel RBF, sono infinito-dimensionali.
- Separare troppo kernel e regolarizzazione: la norma RKHS dipende dal kernel e determina quali funzioni sono considerate semplici.
Vedi anche: mappa di feature, kernel trick, Random Fourier features, funzione positiva-definita, spazi di Hilbert, support vector machine, processo gaussiano, teorema di Bochner.