Chapter 1 · 導數
把兩個函式串起來變一個 — 它的斜率不是相加,而是相乘。把 x 拖看看,上下兩條切線的斜率對著看。
下圖的切線斜率 = 上面兩個數字的乘積。
當你把兩個函式串起來 — 先把 變成 , 再把 變成 — 想知道整體 對 的變化率,憑直覺應該是把兩段「比例」乘起來:
萊布尼茲的記號刻意這樣寫,就是要讓這條規則看起來像「分數消去」。但它不是真的分數消去 — 兩個比值是兩個獨立極限,但結果剛好就是相乘。
鏈式法則是反向傳播(backpropagation)的核心。神經網路就是一長串函式合成 — 輸入經過很多層線性 + 非線性變換,得到輸出。要算「損失對某個權重的梯度」,就是不斷套鏈式法則,從輸出層一路乘回去:
整個「向後傳播」其實只是把這條規則重複應用很多次。下一章看完梯度後,你會看到這個更具體。
注意公式裡寫的是 — 是 的導數在 這個位置算出來的值,不是在 算的。也就是說, 不知道 是什麼,它只看到 餵進來的那個值。
右邊面板中間那個 數字 — 不是 ,那是不同的東西。試著切換 不換 ,看這個值怎麼跟著 一起變。
留言 0
留言載入中…