Formula di Stirling

La formula di Stirling è l’approssimazione asintotica fondamentale del fattoriale. Per $n\to\infty$ :

n!\sim \sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n

Il simbolo $\sim$ indica un’equivalenza asintotica: il rapporto tra il fattoriale e il termine a destra tende a $1$ :

\dfrac{n!}{\sqrt{2\pi n}(n/e)^n}\to1

Questa formula non dice che i due membri siano uguali per un valore finito di $n$ . Dice che l’errore relativo della stima principale tende a zero. È quindi molto più informativa di un semplice confronto di ordine di grandezza: conserva il fattore $\sqrt{2\pi n}$ , indispensabile quando si vogliono stime relative corrette di coefficienti combinatori, probabilità discrete, normalizzazioni statistiche e grandezze che contengono fattoriali enormi.

Significato della formula

Il fattoriale è un prodotto di $n$ fattori:

n!=1\cdot2\cdot3\cdots n.

Prendendo il logaritmo si ottiene una somma:

\ln(n!)=\sum_{k=1}^{n}\ln k.

La formula di Stirling può essere letta come una stima raffinata di questa somma. L’idea intuitiva è sostituire la somma dei logaritmi con l’area sotto la curva $\ln x$ , poi correggere l’errore dovuto al fatto che la somma è discreta. Il termine dominante $n\ln n-n$ viene dall’integrale:

\int_1^n \ln x\,dx=n\ln n-n+1.

Il fattore $\sqrt{2\pi n}$ nasce dalla correzione di ordine successivo e non è decorativo: senza di esso la stima avrebbe un errore relativo che cresce come una potenza di $n$ , invece di tendere a zero.

Forma logaritmica principale

Prendendo il logaritmo:

\ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1)

La forma logaritmica è spesso quella realmente usata nei calcoli. Evita overflow, trasforma prodotti enormi in somme e permette di confrontare quantità che, in scala ordinaria, sarebbero troppo grandi per essere rappresentate.

In molte applicazioni è importante distinguere tre livelli di approssimazione:

\ln(n!)\sim n\ln n,

\ln(n!)=n\ln n-n+o(n),

\ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1).

Il primo livello dà solo la crescita dominante. Il secondo è adatto quando l’errore di ordine $n$ conta, per esempio in stime esponenziali. Il terzo conserva anche il termine logaritmico e corrisponde alla formula classica di Stirling con errore relativo tendente a zero sul fattoriale.

Correzioni e stima dell’errore

Una forma più accurata include il primo termine di correzione:

\ln(n!)= n\ln n-n+\dfrac{1}{2}\ln(2\pi n) +\dfrac{1}{12n} +O\!\left(\dfrac{1}{n^3}\right)

Spingendo lo sviluppo asintotico più avanti:

\ln(n!)= n\ln n-n+\dfrac{1}{2}\ln(2\pi n) +\dfrac{1}{12n} -\dfrac{1}{360n^3} +\dfrac{1}{1260n^5} +O\!\left(\dfrac{1}{n^7}\right).

Equivalentemente, in scala ordinaria:

n!=\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n \left(1+\dfrac{1}{12n}+O\!\left(\dfrac{1}{n^2}\right)\right).

Una forma utile per valutare l’errore, valida per $n\geq1$ , è la disuguaglianza:

\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n e^{1/(12n+1)} < n! < \sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n e^{1/(12n)}.

Questa stima mostra perché il primo termine di correzione è circa $1/(12n)$ nella scala logaritmica. Per $n$ grande l’intervallo si stringe rapidamente; per $n$ piccolo, invece, la formula va usata con attenzione o sostituita dal calcolo esatto.

Legame con la funzione gamma

La formula di Stirling non riguarda solo gli interi. Poiché la funzione gamma soddisfa:

\Gamma(n+1)=n!,

la versione continua è:

\Gamma(x)\sim \sqrt{2\pi}\,x^{x-\dfrac{1}{2}}e^{-x}, \qquad x\to+\infty.

In forma logaritmica:

\ln\Gamma(x)= \left(x-\dfrac{1}{2}\right)\ln x-x+\dfrac{1}{2}\ln(2\pi) +O\!\left(\dfrac{1}{x}\right).

Questa è la base teorica della log-gamma: nei software scientifici non si calcola quasi mai prima $\Gamma(x)$ e poi il logaritmo. Si valuta direttamente $\ln\Gamma(x)$ , perché la gamma cresce troppo rapidamente e produrrebbe overflow anche quando il logaritmo è perfettamente rappresentabile.

Coefficienti binomiali

Uno degli usi più importanti di Stirling è stimare il coefficiente binomiale quando $n$ è grande. Per il coefficiente centrale:

\binom{2n}{n} = \dfrac{(2n)!}{(n!)^2}.

Applicando Stirling al numeratore e al denominatore:

\binom{2n}{n} \sim \dfrac{4^n}{\sqrt{\pi n}}.

Questo risultato mostra un fatto tipico della combinatoria asintotica: il termine esponenziale $4^n$ dà la crescita principale, ma il fattore $\sqrt{\pi n}$ corregge la scala in modo essenziale.

Più in generale, per $0<p<1$ e $k\approx pn$ , la forma logaritmica porta alla funzione entropia:

\ln\binom{n}{pn} = nH(p)-\dfrac{1}{2}\ln\!\bigl(2\pi n p(1-p)\bigr)+O\!\left(\dfrac{1}{n}\right),

dove:

H(p)=-p\ln p-(1-p)\ln(1-p).

Questa formula compare in probabilità, teoria dell’informazione, stime di code binomiali, codici correttori, campionamento e analisi di algoritmi.

Uso in probabilità e statistica

Molte distribuzioni discrete contengono fattoriali o coefficienti combinatori. Per esempio, nella distribuzione binomiale:

P(X=k)= \binom{n}{k}p^k(1-p)^{n-k}.

Quando $n$ è grande, calcolare direttamente $\binom{n}{k}$ può essere inutile o numericamente instabile. Si lavora allora su:

\ln P(X=k) = \ln\binom{n}{k} +k\ln p +(n-k)\ln(1-p),

stimando il termine combinatorio con Stirling o con funzioni log-gamma. Lo stesso schema appare in log-verosimiglianze multinomiali, modelli bayesiani con costanti di normalizzazione, entropia empirica, statistica delle code e meccanica statistica.

Nel caso della distribuzione di Poisson:

P(X=k)=e^{-\lambda}\dfrac{\lambda^k}{k!},

la formula di Stirling dà, per $k$ grande:

\ln P(X=k) \approx -\lambda+k\ln\lambda-k\ln k+k-\dfrac{1}{2}\ln(2\pi k).

Questa forma chiarisce come decadono le probabilità di eventi rari e perché la scala logaritmica sia naturale.

Sintesi operativa

Situazione	Forma utile	Osservazione
Stima relativa di $n!$	$\displaystyle n!\sim\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n$	È la forma classica; include il fattore di normalizzazione.
Calcoli numerici	$\displaystyle \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1)$	Evita overflow e rende confrontabili quantità enormi.
Precisione maggiore	$\displaystyle +\dfrac{1}{12n}-\dfrac{1}{360n^3}+\cdots$	I termini successivi migliorano la stima, ma lo sviluppo resta asintotico.
Coefficienti binomiali	$\displaystyle \binom{2n}{n}\sim\dfrac{4^n}{\sqrt{\pi n}}$	Il fattore sub-esponenziale è decisivo per la scala corretta.
Gamma e log-gamma	$\displaystyle \ln\Gamma(x)\approx\left(x-\dfrac{1}{2}\right)\ln x-x+\dfrac{1}{2}\ln(2\pi)$	Utile per parametri non interi e modelli statistici.

Quando non basta

Stirling è potente, ma non sostituisce il calcolo esatto quando $n$ è piccolo o quando l’errore assoluto conta più dell’errore relativo. Per esempio, se si devono contare configurazioni con pochi elementi, usare il fattoriale esatto è più semplice e più sicuro.

Occorre inoltre scegliere la forma in base allo scopo. Se si confrontano due coefficienti enormi, conviene lavorare con i logaritmi e semplificare prima possibile. Se si cerca una probabilità normalizzata, il valore approssimato di un singolo fattoriale può non bastare: gli errori nei numeratori e nei denominatori possono accumularsi o cancellarsi.

Infine, lo sviluppo con molti termini non va interpretato come una serie convergente ordinaria. È uno sviluppo asintotico: aggiungere termini migliora la stima fino a un certo punto, poi può diventare controproducente se si va oltre il termine ottimale.

Errori comuni

Il primo errore è usare $n!\approx(n/e)^n$ dimenticando il fattore $\sqrt{2\pi n}$ . Questa semplificazione può bastare per intuire la crescita, ma non per una stima relativa corretta.

Il secondo errore è confondere i livelli logaritmici. Dire $\ln(n!)\sim n\ln n$ è molto più grezzo che usare:

\ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1).

Le due formule possono essere entrambe vere, ma rispondono a domande diverse.

Il terzo errore è applicare Stirling per valori piccoli di $n$ senza controllare l’errore. Per $n=3$ o $n=5$ la formula è già orientativa, ma il valore esatto è spesso disponibile e preferibile.

Il quarto errore è calcolare prima fattoriali giganteschi e poi approssimarli. Nei problemi numerici seri si lavora direttamente con logaritmi, differenze di log-gamma o semplificazioni simboliche.

Il quinto errore è usare la formula fuori dal suo regime: l’approssimazione classica riguarda $n\to\infty$ o argomenti gamma grandi. Per parametri complessi, rami del logaritmo o zone vicine ai poli della gamma servono versioni più attente.