← 回微積分專區

Chapter 1 · 導數

🔗 鏈式法則

把兩個函式串起來變一個 — 它的斜率不是相加,而是相乘。把 x 拖看看,上下兩條切線的斜率對著看。

函式曲線 該點切線 共享 x 標線
— 內層
— 外層
1.00
🧮 兩個斜率相乘

下圖的切線斜率 = 上面兩個數字的乘積。

📖 為什麼是相乘,不是相加?

當你把兩個函式串起來 — 先把 變成 再把 變成 — 想知道整體 的變化率,憑直覺應該是把兩段「比例」乘起來:

萊布尼茲的記號刻意這樣寫,就是要讓這條規則看起來像「分數消去」。但它不是真的分數消去 — 兩個比值是兩個獨立極限,但結果剛好就是相乘。

🎮 動手試試

  1. 預設:,所以 。在 時,,所以複合斜率 ≈ 1.08。對照看下面的數字。
  2. 滑到 。不管 在那邊斜率是多少,乘 0 就是 0 — 下面的切線會變水平。這就是為什麼「 卡住」會讓整個複合也卡住。
  3. :複合是 ,斜率是 — 增長速度爆炸。試著拖 看數字怎麼瘋掉。
  4. :複合是 。隨著 變大, 快速增長,餵進 sin 後變成超快速振盪 — 上面的曲線單調,下面卻在抖動。

🚀 為什麼這麼重要

鏈式法則是反向傳播(backpropagation)的核心。神經網路就是一長串函式合成 — 輸入經過很多層線性 + 非線性變換,得到輸出。要算「損失對某個權重的梯度」,就是不斷套鏈式法則,從輸出層一路乘回去:

整個「向後傳播」其實只是把這條規則重複應用很多次。下一章看完梯度後,你會看到這個更具體。

💡 為什麼順序很重要

注意公式裡寫的是 — 是 的導數在 這個位置算出來的值,不是在 算的。也就是說, 不知道 是什麼,它只看到 餵進來的那個值。

右邊面板中間那個 數字 — 不是 ,那是不同的東西。試著切換 不換 ,看這個值怎麼跟著 一起變。

留言 0

留言載入中…