機率統計專區

機率統計 · 動手玩版本

從分布、抽樣到貝氏與資訊論 — 不背公式、不查表。每個概念都先動手丟一次,再上符號。

🎲 熱身:擲骰子

先看「丟越多次,經驗分布越貼近理論分布」這件事

經驗相對次數 理論機率 剛擲到的點數

模式

已擲次數

0

手動擲

自動 / 重設

🎯 看 1 顆骰子:理論上每面 1/6(均勻分布)。 剛開始擲幾下,柱狀圖會起伏亂跳;擲到幾千次,每根柱子都會壓到那條紅線上。
📊 切到 2 顆骰子:兩個均勻分布相加,結果是 三角形。這就是中央極限定理的小型版本 — 獨立隨機變數相加,分布會往對稱、像山的形狀靠

📍 為什麼學機率統計?

機器學習 — Cross-entropy loss、KL divergence 都直接出自資訊論

A/B 測試 — 信賴區間、貝氏更新都是日常會用到的工具

強化學習 — MCMC、隨機過程是策略最佳化的基礎

系統設計 — Queueing、Poisson 到達率、tail latency

資安 / 密碼學 — 機率估計與隨機性是攻擊與防禦的核心

產品決策 — 期望值、效用函式、不確定性下的決策

Chapter 1 · 基礎

📦 機率分布動物園

常態、二項、Poisson、指數、均勻 — 拉滑桿改參數,PMF / PDF 跟 CDF 即時跟著動。一頁看清「分布長什麼樣」。

Chapter 1 · 基礎

🎯 大數法則與中央極限

抽樣均值會收斂到母體均值(LLN),而且收斂的速度和形狀,本身又是常態分布(CLT)— 兩個 demo 同台演示。

Chapter 2 · 推論

🔮 貝氏定理

Beta–Binomial 共軛先驗:拉先驗、按按鈕加觀測,後驗即時更新。看「資料怎麼修正信念」。

Chapter 2 · 推論

📏 最大似然估計

線性迴歸的「最小平方」其實是「假設誤差是常態」下的 MLE。拖資料點,看 NLL 等高線怎麼移動,最佳擬合線怎麼追上去。

Chapter 3 · 模擬與資訊

🚶 馬可夫鏈與 MCMC

Metropolis–Hastings 一步一步把點丟到目標分布上。可暫停、可加速 — 看「亂走也能畫出機率密度」。

Chapter 3 · 模擬與資訊

🔥 熵與 KL 散度

熵是「平均驚訝度」、KL 是「用錯分布要多付的 bits」— 兩條分布並排可動,直接看 cross-entropy loss 在算什麼。

對標 Seeing Theory · Brown University — 看視覺化建直覺,回這裡動手玩。

留言 0

留言載入中…