機率分布動物園 · 5 個你會反覆遇到的分布

📖 5 個分布，5 個故事

身高、考試分數、感測器讀數的誤差 — 任何「很多個小因素加起來」的東西，分布都會長這個鐘形。

這不是巧合，是 中央極限定理（下一頁） 在背後撐著：獨立隨機量相加，無論單一分布長怎樣，加起來的形狀都會收斂到常態。

f (x) = \frac{1}{σ 2 π} exp (- \frac{( x - μ ) ^{2}}{2 σ ^{2}})

固定試驗次數 $n$ 、每次成功率 $p$ ，問成功幾次。A/B 測試、品管檢驗、垃圾信件判斷都是這個形狀。

把 $n$ 拉大、 $p$ 維持不動 — 形狀會越來越像常態。再次 — 中央極限定理。

P (X = k) = (k n) p^{k} (1 - p)^{n - k}

客服電話、伺服器請求、放射線粒子、棒球場上的全壘打 — 這些「稀疏、獨立、發生率穩定」的事件，每單位時間的次數會服從 Poisson。

它和指數分布是同一件事的兩面：Poisson 算「次數」，指數算「兩次之間的等待時間」。

P (X = k) = \frac{λ ^{k} e ^{- λ}}{k !}

無記憶（memoryless）的等待時間分布。已經等了 5 分鐘、跟剛開始等的「再等多久」期望值，居然一樣。

這個「無記憶」是它最神奇的性質，也是它最常被誤用的地方 — 真實世界的人類耐心、機械疲勞，都不是無記憶的。

f (x) = λ e^{- λ x}, x \geq 0

所有結果機率相等。看起來最「無聊」，但在貝氏分析裡是非常重要的「無知先驗」(uninformative prior)。

它也是亂數產生器的起點 — 大部分隨機程式庫的核心其實就是「Math.random() 產生 Uniform(0,1)」，所有其他分布都從它變換出來。

f (x) = \frac{1}{b - a}, a \leq x \leq b