梯度提升的直覺：逐步糾錯｜梯度提升與集成學習

「梯度提升」這名字嚇退很多人,但核心其實一句話:每棵新樹,專門去擬合前面所有樹加起來還沒修好的「殘差」。把這句話看懂,XGBoost 就不再是黑魔法。

這堂課你會學到

預覽圖就是核心:先用「全體平均」當最爛的預測,看殘差;種一棵淺樹去擬合殘差、加回去;再看新的殘差……重複。每加一棵淺樹,紅線就更貼合資料一點、誤差就掉一點。

這就是 boosting——一群弱樹,靠接力修正,疊成一個強模型。

而 learning rate 控制每棵樹採納多少修正。學習率小(如 0.1)→ 每步更保守、需要更多棵樹,但通常更不容易過擬合、最終更準。這是 boosting 最重要的旋鈕,後面每一課都會遇到。

👉 在 Colab 裡把學習率改成 0.1 和 1.0,比較三輪後的誤差與紅線的樣子,親手體會這個取捨。