La formula di Stirling è l’approssimazione asintotica fondamentale del fattoriale. Per n\to\infty:
Il simbolo \sim indica un’equivalenza asintotica: il rapporto tra il fattoriale e il termine a destra tende a 1:
Questa formula non dice che i due membri siano uguali per un valore finito di n. Dice che l’errore relativo della stima principale tende a zero. È quindi molto più informativa di un semplice confronto di ordine di grandezza: conserva il fattore \sqrt{2\pi n}, indispensabile quando si vogliono stime relative corrette di coefficienti combinatori, probabilità discrete, normalizzazioni statistiche e grandezze che contengono fattoriali enormi.
Significato della formula
Il fattoriale è un prodotto di n fattori:
Prendendo il logaritmo si ottiene una somma:
La formula di Stirling può essere letta come una stima raffinata di questa somma. L’idea intuitiva è sostituire la somma dei logaritmi con l’area sotto la curva \ln x, poi correggere l’errore dovuto al fatto che la somma è discreta. Il termine dominante n\ln n-n viene dall’integrale:
Il fattore \sqrt{2\pi n} nasce dalla correzione di ordine successivo e non è decorativo: senza di esso la stima avrebbe un errore relativo che cresce come una potenza di n, invece di tendere a zero.
Forma logaritmica principale
Prendendo il logaritmo:
La forma logaritmica è spesso quella realmente usata nei calcoli. Evita overflow, trasforma prodotti enormi in somme e permette di confrontare quantità che, in scala ordinaria, sarebbero troppo grandi per essere rappresentate.
In molte applicazioni è importante distinguere tre livelli di approssimazione:
Il primo livello dà solo la crescita dominante. Il secondo è adatto quando l’errore di ordine n conta, per esempio in stime esponenziali. Il terzo conserva anche il termine logaritmico e corrisponde alla formula classica di Stirling con errore relativo tendente a zero sul fattoriale.
Correzioni e stima dell’errore
Una forma più accurata include il primo termine di correzione:
Spingendo lo sviluppo asintotico più avanti:
Equivalentemente, in scala ordinaria:
Una forma utile per valutare l’errore, valida per n\geq1, è la disuguaglianza:
Questa stima mostra perché il primo termine di correzione è circa 1/(12n) nella scala logaritmica. Per n grande l’intervallo si stringe rapidamente; per n piccolo, invece, la formula va usata con attenzione o sostituita dal calcolo esatto.
Legame con la funzione gamma
La formula di Stirling non riguarda solo gli interi. Poiché la funzione gamma soddisfa:
la versione continua è:
In forma logaritmica:
Questa è la base teorica della log-gamma: nei software scientifici non si calcola quasi mai prima \Gamma(x) e poi il logaritmo. Si valuta direttamente \ln\Gamma(x), perché la gamma cresce troppo rapidamente e produrrebbe overflow anche quando il logaritmo è perfettamente rappresentabile.
Coefficienti binomiali
Uno degli usi più importanti di Stirling è stimare il coefficiente binomiale quando n è grande. Per il coefficiente centrale:
Applicando Stirling al numeratore e al denominatore:
Questo risultato mostra un fatto tipico della combinatoria asintotica: il termine esponenziale 4^n dà la crescita principale, ma il fattore \sqrt{\pi n} corregge la scala in modo essenziale.
Più in generale, per 0<p<1 e k\approx pn, la forma logaritmica porta alla funzione entropia:
dove:
Questa formula compare in probabilità, teoria dell’informazione, stime di code binomiali, codici correttori, campionamento e analisi di algoritmi.
Uso in probabilità e statistica
Molte distribuzioni discrete contengono fattoriali o coefficienti combinatori. Per esempio, nella distribuzione binomiale:
Quando n è grande, calcolare direttamente \binom{n}{k} può essere inutile o numericamente instabile. Si lavora allora su:
stimando il termine combinatorio con Stirling o con funzioni log-gamma. Lo stesso schema appare in log-verosimiglianze multinomiali, modelli bayesiani con costanti di normalizzazione, entropia empirica, statistica delle code e meccanica statistica.
Nel caso della distribuzione di Poisson:
la formula di Stirling dà, per k grande:
Questa forma chiarisce come decadono le probabilità di eventi rari e perché la scala logaritmica sia naturale.
Sintesi operativa
| Situazione | Forma utile | Osservazione |
|---|---|---|
| Stima relativa di n! | \displaystyle n!\sim\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n | È la forma classica; include il fattore di normalizzazione. |
| Calcoli numerici | \displaystyle \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1) | Evita overflow e rende confrontabili quantità enormi. |
| Precisione maggiore | \displaystyle +\dfrac{1}{12n}-\dfrac{1}{360n^3}+\cdots | I termini successivi migliorano la stima, ma lo sviluppo resta asintotico. |
| Coefficienti binomiali | \displaystyle \binom{2n}{n}\sim\dfrac{4^n}{\sqrt{\pi n}} | Il fattore sub-esponenziale è decisivo per la scala corretta. |
| Gamma e log-gamma | \displaystyle \ln\Gamma(x)\approx\left(x-\dfrac{1}{2}\right)\ln x-x+\dfrac{1}{2}\ln(2\pi) | Utile per parametri non interi e modelli statistici. |
Quando non basta
Stirling è potente, ma non sostituisce il calcolo esatto quando n è piccolo o quando l’errore assoluto conta più dell’errore relativo. Per esempio, se si devono contare configurazioni con pochi elementi, usare il fattoriale esatto è più semplice e più sicuro.
Occorre inoltre scegliere la forma in base allo scopo. Se si confrontano due coefficienti enormi, conviene lavorare con i logaritmi e semplificare prima possibile. Se si cerca una probabilità normalizzata, il valore approssimato di un singolo fattoriale può non bastare: gli errori nei numeratori e nei denominatori possono accumularsi o cancellarsi.
Infine, lo sviluppo con molti termini non va interpretato come una serie convergente ordinaria. È uno sviluppo asintotico: aggiungere termini migliora la stima fino a un certo punto, poi può diventare controproducente se si va oltre il termine ottimale.
Errori comuni
Il primo errore è usare n!\approx(n/e)^n dimenticando il fattore \sqrt{2\pi n}. Questa semplificazione può bastare per intuire la crescita, ma non per una stima relativa corretta.
Il secondo errore è confondere i livelli logaritmici. Dire \ln(n!)\sim n\ln n è molto più grezzo che usare:
Le due formule possono essere entrambe vere, ma rispondono a domande diverse.
Il terzo errore è applicare Stirling per valori piccoli di n senza controllare l’errore. Per n=3 o n=5 la formula è già orientativa, ma il valore esatto è spesso disponibile e preferibile.
Il quarto errore è calcolare prima fattoriali giganteschi e poi approssimarli. Nei problemi numerici seri si lavora direttamente con logaritmi, differenze di log-gamma o semplificazioni simboliche.
Il quinto errore è usare la formula fuori dal suo regime: l’approssimazione classica riguarda n\to\infty o argomenti gamma grandi. Per parametri complessi, rami del logaritmo o zone vicine ai poli della gamma servono versioni più attente.