← 回機率統計專區

Chapter 1 · 基礎

📦 機率分布動物園

每個分布都有「自己的故事」。挑一個、拉參數、同時看 PDF/PMF 跟累積分布 — 它們不是孤立的公式,是描述世界的一種詞彙。

機率密度 / 質量 累積分布 (CDF) 期望值 E[X]
🦒 選分布
0.00
1.00
🧮 統計量

📖 5 個分布,5 個故事

📊 常態分布 Normal — 「測量誤差會這樣分布」

身高、考試分數、感測器讀數的誤差 — 任何「很多個小因素加起來」的東西,分布都會長這個鐘形。

這不是巧合,是 中央極限定理(下一頁) 在背後撐著:獨立隨機量相加,無論單一分布長怎樣,加起來的形狀都會收斂到常態。

🎯 二項分布 Binomial — 「n 次硬幣裡,幾次正面」

固定試驗次數 、每次成功率 ,問成功幾次。A/B 測試、品管檢驗、垃圾信件判斷都是這個形狀。

拉大、 維持不動 — 形狀會越來越像常態。再次 — 中央極限定理。

📬 Poisson 分布 — 「單位時間發生幾次」

客服電話、伺服器請求、放射線粒子、棒球場上的全壘打 — 這些「稀疏、獨立、發生率穩定」的事件,每單位時間的次數會服從 Poisson。

它和指數分布是同一件事的兩面:Poisson 算「次數」,指數算「兩次之間的等待時間」。

⏱️ 指數分布 Exponential — 「下一通電話什麼時候來」

無記憶(memoryless)的等待時間分布。已經等了 5 分鐘、跟剛開始等的「再等多久」期望值,居然一樣。

這個「無記憶」是它最神奇的性質,也是它最常被誤用的地方 — 真實世界的人類耐心、機械疲勞,都不是無記憶的。

📏 均勻分布 Uniform — 「我什麼都不知道」

所有結果機率相等。看起來最「無聊」,但在貝氏分析裡是非常重要的「無知先驗」(uninformative prior)。

它也是亂數產生器的起點 — 大部分隨機程式庫的核心其實就是「Math.random() 產生 Uniform(0,1)」,所有其他分布都從它變換出來。

🎮 動手試試

  1. 切到 Binomial,把 固定 0.5、 從 5 拉到 40 — 看形狀越來越「鐘形」。
  2. 切到 Poisson 從 0.5 拉到 15 — 小 λ 是右偏的、大 λ 又變鐘形。
  3. 切到 Normal,注意 。把 σ 加倍,曲線變矮兩倍、變寬兩倍、面積守恆。
  4. 切到 Exponential,注意 — λ 越大、「平均等待時間」越短。

🚀 之後會用到

  • 大數法則 / 中央極限定理(下一頁)— Binomial 變鐘形、樣本均值變鐘形,都是同一件事
  • 最大似然估計(後面幾頁)— 「假設資料來自常態」就會推出最小平方
  • 熵與 KL 散度 — 用熵衡量「這個分布有多不確定」、用 KL 衡量「兩個分布差多遠」

留言 0

留言載入中…