Chapter 3 · 分解與譜論

🔱 奇異值分解 SVD

任何矩陣 $A = U Σ V^{⊤}$ — 不必方陣、不必可逆、不必對稱。三個步驟：先旋轉、再沿軸拉伸、再旋轉。

🎬 變換階段

🧪 低秩近似 (Low-Rank Approximation)

捨掉最小的奇異值，看 A 被「壓縮」後的近似 — 影像壓縮與推薦系統的核心。

🎯 預設矩陣

點按鈕，或直接編輯下面的矩陣。

任意矩陣

A

🌟 奇異值 (大→小)

秩 (rank)3

條件數

κ = σ_{1} / σ_{3}

🔍 展開看 U 與 V 矩陣

U =

V =

📖 任何矩陣 = 旋轉 → 拉伸 → 旋轉

奇異值分解（Singular Value Decomposition）說的是一個驚人的事實：任何矩陣（不必方陣、不必可逆、不必對稱）都能拆成三步

A = U Σ V^{⊤}

其中：

$V$ 、 $U$ 是正交矩陣（純旋轉/反射，不會改變長度）
$Σ$ 是對角矩陣，對角線上是奇異值（singular values） $σ_{1} \geq σ_{2} \geq σ_{3} \geq 0$

按上面的「變換階段」按鈕，看單位球被 $A$ 變形的過程：

SVD 是特徵分解的進階推廣：

數學上的關係： $σ_{i}^{2}$ 是 $A^{⊤} A$ 的特徵值。也就是說，SVD 本質上是「先把矩陣弄成對稱的（乘上 $A^{⊤}$ ），再做特徵分解」。

奇異值是按重要性排序的： $σ_{1}$ 抓最多「能量」、 $σ_{2}$ 第二多… 最小的 $σ_{k}$ 可能比 $σ_{1}$ 小幾百倍。

把小的奇異值設成 0，就得到 $A$ 的「低秩近似」：

A_{k} = i = 1 \sum k σ_{i} u_{i} v_{i}^{⊤} (k < n)

Eckart-Young 定理說這個 $A_{k}$ 是「保留 k 個成分下，最接近原矩陣的近似」。試試上面的低秩近似按鈕，看橢球變形 — 失去最小的軸幾乎看不出差別。

影像壓縮：把影像當成矩陣，丟掉小的奇異值。保留前 10% 的 σ 就能還原 90% 的視覺內容。JPEG 的 DCT 是這個思路的近親。
推薦系統：用戶 × 電影評分矩陣做 SVD，前幾個奇異值對應「潛在因子」（動作片偏好、文藝片偏好...）。Netflix Prize 的核心。
PCA (主成分分析)：對中心化的資料矩陣做 SVD，左奇異向量就是主成分。比直接算 covariance 矩陣的特徵分解數值上更穩定。
LSA (潛在語意分析)：文件 × 詞彙矩陣 SVD，奇異向量代表潛在的「主題」。
偽反矩陣 (pseudoinverse)：當 A 不是方陣或不可逆時， $A^{+} = V Σ^{+} U^{⊤}$ （把 σᵢ 取倒數，0 保留 0）給出最小平方意義下的「最佳解」。
條件數判斷數值穩定性： $κ (A) = σ_{1} / σ_{n}$ 。κ 大代表矩陣「近乎奇異」，數值計算會放大誤差。

💡 演算法細節

這頁的 SVD 用「 $A^{⊤} A$ 路線」：對 $A^{⊤} A$ （對稱正半定）做特徵分解得到 V 跟 σ²，再用 $u_{i} = A v_{i} / σ_{i}$ 算 U。實務上的 SVD 庫（LAPACK 等）用更穩定的雙對角化 + QR 迭代，但思路一樣。