從 tool calling、ReAct 迴圈、記憶,到 RAG 與多代理協作——零框架,全部親手刻
01 入門 Agent = LLM + 工具 + 迴圈。LLM 是推理引擎,自己不會查時間、不會算數、碰不到外面的世界。這堂課建立心智模型,並在免費 Colab 上用 4-bit 量化載入一個真正能用的 Qwen。
02 入門 「模型呼叫工具」聽起來很神奇,拆穿了其實是:模型吐出一段結構化文字,我們自己解析、執行 Python 函式、把結果餵回去。沒有魔法,沒有框架——你親手寫這四步。
03 進階 Thought → Action → Observation,反覆進行直到收斂——這就是 agent 的靈魂。把上一課的「一輪」一般化成一個會自己多步推理、自己決定何時停的迴圈。整條軌道最核心的一課。
04 進階 給 agent 一整個工具箱,讓模型自己選用哪一支。手刻 tool registry,自動把工具描述塞進 prompt,並處理模型幻覺出不存在的工具時的錯誤回復——真實 agent 的健壯性從這裡開始。
05 進階 Agent 預設是金魚腦——每次呼叫都從零開始。這課給它記憶:跨回合保留對話、用 scratchpad 記下中間結果,並在 context window 快爆時自動摘要壓縮。讓 agent 記得住、撐得久。
06 進階 LLM 會自信地瞎掰它沒學過的事。RAG(檢索增強生成)給它一個外部知識庫,先檢索相關資料、再根據資料回答。這課手刻 embedding 檢索,做一個會在需要時自己去查資料的 agent。
07 專題 複雜任務一個 agent 容易迷路。拆成兩個角色:planner 先把任務切成步驟,executor 逐步用工具執行,再彙整成答案。學會編排多次 LLM 呼叫——以及反思(self-reflection)這個近親。
08 專題 把前七課全部組起來,做一個迷你研究助理:會查資料、會算數、記得住對話、會規劃多步任務。最後一個選修 sidebar:只改一個函式,就把本地 Qwen 換成 Gemini/Groq 免費 API。整條學習線的終點。
留言 0
留言載入中…