Chapter 2 · 核心工具
在牆上拉一個影子。投影就是找「最接近的影子」— 線性回歸與壓縮演算法的幾何核心。
平面模式:n 是平面的法向量 — 平面垂直於這個方向。
↑ 應該永遠是 0:投影向量與殘差互相垂直。
想像太陽從正上方照下來,你站在地上 — 影子就是你的投影。投影是「把一個向量壓到一個比它低維的空間(直線、平面)上」,而且要「壓得最接近」— 也就是殘差(影子到原點的距離)要最小。
幾何上有個關鍵性質:殘差永遠垂直於目標子空間。換句話說, 跟 是直角關係(你可以在右邊看到正交性數值永遠是 0)。
投影到一條直線(方向為單位向量 ):
意思是:「v 在 方向上的長度」乘以「 本身」。
投影到一個平面(法向量為單位向量 ):
意思是:「把 v 沿著 方向那個分量扣掉」 — 剩下的就是躺在平面上的部分。
(0, 5, 0)(純 Y 方向)→ 投影完全變 0!因為 v 完全垂直於目標平面,影子是「一個點」(原點)。當你在 Excel 點「加入趨勢線」,背後的數學就是把資料投影到一條直線。給定一堆 資料點,要找一條 最接近所有點 — 這就是把目標向量 投影到「 的 column space」。一般公式:
看到這個公式不要慌 — 它就是上面平面/直線公式的一般化。 是用來「歸一化」 的多欄(如果欄之間不正交), 那部分跟前面 同樣是「在 column space 內」。