La normalizzazione è una tecnica di progettazione di basi di dati relazionali che mira a organizzare le tabelle in modo da minimizzare la ridondanza dei dati e prevenire anomalie durante le operazioni di inserimento, aggiornamento e cancellazione.
Il processo si articola in diverse tappe chiamate Forme Normali (NF):
- Prima Forma Normale (1NF): richiede che ogni cella contenga un solo valore atomico e che non ci siano gruppi ripetuti.
- Seconda Forma Normale (2NF): richiede che tutti gli attributi non chiave dipendano interamente dall’intera chiave primaria.
- Terza Forma Normale (3NF): richiede che non ci siano dipendenze transitive tra attributi non chiave.
Ingegneristicamente, un database ben normalizzato è più facile da mantenere, occupa meno spazio e garantisce l’integrità referenziale. Tuttavia, in contesti di grandi moli di dati (Big Data) o data warehousing, si può ricorrere alla “denormalizzazione” per migliorare le prestazioni in lettura a scapito della ridondanza.