Formula di Stirling

Indice dei contenuti

    La formula di Stirling è l’approssimazione asintotica fondamentale del fattoriale. Per n\to\infty:

    n!\sim \sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n

    Il simbolo \sim indica un’equivalenza asintotica: il rapporto tra il fattoriale e il termine a destra tende a 1:

    \dfrac{n!}{\sqrt{2\pi n}(n/e)^n}\to1

    Questa formula non dice che i due membri siano uguali per un valore finito di n. Dice che l’errore relativo della stima principale tende a zero. È quindi molto più informativa di un semplice confronto di ordine di grandezza: conserva il fattore \sqrt{2\pi n}, indispensabile quando si vogliono stime relative corrette di coefficienti combinatori, probabilità discrete, normalizzazioni statistiche e grandezze che contengono fattoriali enormi.

    Significato della formula

    Il fattoriale è un prodotto di n fattori:

    n!=1\cdot2\cdot3\cdots n.

    Prendendo il logaritmo si ottiene una somma:

    \ln(n!)=\sum_{k=1}^{n}\ln k.

    La formula di Stirling può essere letta come una stima raffinata di questa somma. L’idea intuitiva è sostituire la somma dei logaritmi con l’area sotto la curva \ln x, poi correggere l’errore dovuto al fatto che la somma è discreta. Il termine dominante n\ln n-n viene dall’integrale:

    \int_1^n \ln x\,dx=n\ln n-n+1.

    Il fattore \sqrt{2\pi n} nasce dalla correzione di ordine successivo e non è decorativo: senza di esso la stima avrebbe un errore relativo che cresce come una potenza di n, invece di tendere a zero.

    Forma logaritmica principale

    Prendendo il logaritmo:

    \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1)

    La forma logaritmica è spesso quella realmente usata nei calcoli. Evita overflow, trasforma prodotti enormi in somme e permette di confrontare quantità che, in scala ordinaria, sarebbero troppo grandi per essere rappresentate.

    In molte applicazioni è importante distinguere tre livelli di approssimazione:

    \ln(n!)\sim n\ln n,
    \ln(n!)=n\ln n-n+o(n),
    \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1).

    Il primo livello dà solo la crescita dominante. Il secondo è adatto quando l’errore di ordine n conta, per esempio in stime esponenziali. Il terzo conserva anche il termine logaritmico e corrisponde alla formula classica di Stirling con errore relativo tendente a zero sul fattoriale.

    Correzioni e stima dell’errore

    Una forma più accurata include il primo termine di correzione:

    \ln(n!)= n\ln n-n+\dfrac{1}{2}\ln(2\pi n) +\dfrac{1}{12n} +O\!\left(\dfrac{1}{n^3}\right)

    Spingendo lo sviluppo asintotico più avanti:

    \ln(n!)= n\ln n-n+\dfrac{1}{2}\ln(2\pi n) +\dfrac{1}{12n} -\dfrac{1}{360n^3} +\dfrac{1}{1260n^5} +O\!\left(\dfrac{1}{n^7}\right).

    Equivalentemente, in scala ordinaria:

    n!=\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n \left(1+\dfrac{1}{12n}+O\!\left(\dfrac{1}{n^2}\right)\right).

    Una forma utile per valutare l’errore, valida per n\geq1, è la disuguaglianza:

    \sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n e^{1/(12n+1)} < n! < \sqrt{2\pi n}\left(\dfrac{n}{e}\right)^n e^{1/(12n)}.

    Questa stima mostra perché il primo termine di correzione è circa 1/(12n) nella scala logaritmica. Per n grande l’intervallo si stringe rapidamente; per n piccolo, invece, la formula va usata con attenzione o sostituita dal calcolo esatto.

    Legame con la funzione gamma

    La formula di Stirling non riguarda solo gli interi. Poiché la funzione gamma soddisfa:

    \Gamma(n+1)=n!,

    la versione continua è:

    \Gamma(x)\sim \sqrt{2\pi}\,x^{x-\dfrac{1}{2}}e^{-x}, \qquad x\to+\infty.

    In forma logaritmica:

    \ln\Gamma(x)= \left(x-\dfrac{1}{2}\right)\ln x-x+\dfrac{1}{2}\ln(2\pi) +O\!\left(\dfrac{1}{x}\right).

    Questa è la base teorica della log-gamma: nei software scientifici non si calcola quasi mai prima \Gamma(x) e poi il logaritmo. Si valuta direttamente \ln\Gamma(x), perché la gamma cresce troppo rapidamente e produrrebbe overflow anche quando il logaritmo è perfettamente rappresentabile.

    Coefficienti binomiali

    Uno degli usi più importanti di Stirling è stimare il coefficiente binomiale quando n è grande. Per il coefficiente centrale:

    \binom{2n}{n} = \dfrac{(2n)!}{(n!)^2}.

    Applicando Stirling al numeratore e al denominatore:

    \binom{2n}{n} \sim \dfrac{4^n}{\sqrt{\pi n}}.

    Questo risultato mostra un fatto tipico della combinatoria asintotica: il termine esponenziale 4^n dà la crescita principale, ma il fattore \sqrt{\pi n} corregge la scala in modo essenziale.

    Più in generale, per 0<p<1 e k\approx pn, la forma logaritmica porta alla funzione entropia:

    \ln\binom{n}{pn} = nH(p)-\dfrac{1}{2}\ln\!\bigl(2\pi n p(1-p)\bigr)+O\!\left(\dfrac{1}{n}\right),

    dove:

    H(p)=-p\ln p-(1-p)\ln(1-p).

    Questa formula compare in probabilità, teoria dell’informazione, stime di code binomiali, codici correttori, campionamento e analisi di algoritmi.

    Uso in probabilità e statistica

    Molte distribuzioni discrete contengono fattoriali o coefficienti combinatori. Per esempio, nella distribuzione binomiale:

    P(X=k)= \binom{n}{k}p^k(1-p)^{n-k}.

    Quando n è grande, calcolare direttamente \binom{n}{k} può essere inutile o numericamente instabile. Si lavora allora su:

    \ln P(X=k) = \ln\binom{n}{k} +k\ln p +(n-k)\ln(1-p),

    stimando il termine combinatorio con Stirling o con funzioni log-gamma. Lo stesso schema appare in log-verosimiglianze multinomiali, modelli bayesiani con costanti di normalizzazione, entropia empirica, statistica delle code e meccanica statistica.

    Nel caso della distribuzione di Poisson:

    P(X=k)=e^{-\lambda}\dfrac{\lambda^k}{k!},

    la formula di Stirling dà, per k grande:

    \ln P(X=k) \approx -\lambda+k\ln\lambda-k\ln k+k-\dfrac{1}{2}\ln(2\pi k).

    Questa forma chiarisce come decadono le probabilità di eventi rari e perché la scala logaritmica sia naturale.

    Sintesi operativa

    SituazioneForma utileOsservazione
    Stima relativa di n!\displaystyle n!\sim\sqrt{2\pi n}\left(\dfrac{n}{e}\right)^nÈ la forma classica; include il fattore di normalizzazione.
    Calcoli numerici\displaystyle \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1)Evita overflow e rende confrontabili quantità enormi.
    Precisione maggiore\displaystyle +\dfrac{1}{12n}-\dfrac{1}{360n^3}+\cdotsI termini successivi migliorano la stima, ma lo sviluppo resta asintotico.
    Coefficienti binomiali\displaystyle \binom{2n}{n}\sim\dfrac{4^n}{\sqrt{\pi n}}Il fattore sub-esponenziale è decisivo per la scala corretta.
    Gamma e log-gamma\displaystyle \ln\Gamma(x)\approx\left(x-\dfrac{1}{2}\right)\ln x-x+\dfrac{1}{2}\ln(2\pi)Utile per parametri non interi e modelli statistici.

    Quando non basta

    Stirling è potente, ma non sostituisce il calcolo esatto quando n è piccolo o quando l’errore assoluto conta più dell’errore relativo. Per esempio, se si devono contare configurazioni con pochi elementi, usare il fattoriale esatto è più semplice e più sicuro.

    Occorre inoltre scegliere la forma in base allo scopo. Se si confrontano due coefficienti enormi, conviene lavorare con i logaritmi e semplificare prima possibile. Se si cerca una probabilità normalizzata, il valore approssimato di un singolo fattoriale può non bastare: gli errori nei numeratori e nei denominatori possono accumularsi o cancellarsi.

    Infine, lo sviluppo con molti termini non va interpretato come una serie convergente ordinaria. È uno sviluppo asintotico: aggiungere termini migliora la stima fino a un certo punto, poi può diventare controproducente se si va oltre il termine ottimale.

    Errori comuni

    Il primo errore è usare n!\approx(n/e)^n dimenticando il fattore \sqrt{2\pi n}. Questa semplificazione può bastare per intuire la crescita, ma non per una stima relativa corretta.

    Il secondo errore è confondere i livelli logaritmici. Dire \ln(n!)\sim n\ln n è molto più grezzo che usare:

    \ln(n!)=n\ln n-n+\dfrac{1}{2}\ln(2\pi n)+o(1).

    Le due formule possono essere entrambe vere, ma rispondono a domande diverse.

    Il terzo errore è applicare Stirling per valori piccoli di n senza controllare l’errore. Per n=3 o n=5 la formula è già orientativa, ma il valore esatto è spesso disponibile e preferibile.

    Il quarto errore è calcolare prima fattoriali giganteschi e poi approssimarli. Nei problemi numerici seri si lavora direttamente con logaritmi, differenze di log-gamma o semplificazioni simboliche.

    Il quinto errore è usare la formula fuori dal suo regime: l’approssimazione classica riguarda n\to\infty o argomenti gamma grandi. Per parametri complessi, rami del logaritmo o zone vicine ai poli della gamma servono versioni più attente.

    Voci correlate

    Ultimo aggiornamento: