[AI 演進史 Part 3] 語言與代理：LLM 引領的 AI Agent 時代

2026年1月11日 · wemee

AI LLM Transformer AI Agent Antigravity 機器學習

在上一篇我們見證了 AI 如何學會了「視覺創造」。但人類智慧的皇冠，始終是「語言」與「邏輯」。

這是 AI 演進史的最後一塊拼圖，也是我們現在正身處其中的巨浪。

Transformer：關注你需要的一切

故事的轉折點發生在 2017 年 Google 發表的論文《Attention Is All You Need》。這篇論文提出了一個全新的架構：Transformer。

在這個架構之前，我們用 RNN / LSTM 處理語言，像是一步一步地閱讀，讀到後面常常忘了前面。 Transformer 引入了 Self-Attention (自注意力機制)，它讓 AI 可以「同時」看到整篇文章的每一個字，並且計算字與字之間的關聯強度。

這就像是給了 AI 一雙「上帝之眼」，它能瞬間理解上下文的複雜關係。這個架構，成為了後來所有 LLM (Large Language Model) 的基石。

Self-Attention God's Eye

接下來的故事就是「大」。 OpenAI 發現了一個簡單粗暴的真理：只要把模型做大，把數據量加倍，AI 就會湧現 (Emerge) 出意想不到的能力。

GPT-1, GPT-2, GPT-3… 參數量從幾億爆增到幾千億。我們驚訝地發現，當模型大到一定程度時，它不只能接龍寫作，它竟然學會了寫程式、翻譯、甚至做數學題目。

Emergence of Intelligence at Scale

但就算 GPT-3 很強，它講話還是像個機器人，或者像個未經世事的瘋子。直到 ChatGPT 出現，引入了 RLHF (Reinforcement Learning from Human Feedback)。

簡單說，就是找真人來給 AI 的回答打分數：「這個回答有禮貌，+1分。」「這個回答在胡說八道，-1分。」

透過這種強化學習，AI 終於學會了如何「像個人類一樣對話」。這就是所謂的 Alignment (對齊)。

現在，我們每天都在研究這些術語：

如果說 LLM 是一個超級大腦，那它現在還缺什麼？它缺「手」和「腳」。它只能在對話框裡打字，不能真的幫你做事。

這就是現在 Google Antigravity 團隊正在做的事情，也是目前 AI 研究的最前線：AI Agent (人工智慧代理)。

我們給 LLM 裝上了工具 (Tools)：

AI 不再只是一個陪聊的機器人，它變成了一個能感知 (Perceive)、規劃 (Plan) 並 執行 (Execute) 的數位員工。

這就是我現在每天在做的事情。

AI Agent with Tools

回首這 20 年。從那個在實驗室裡用 SVM 慢慢切分數據點的研究生，到被 CNN 貓狗大戰震撼的工程師，再到現在每天和 AI Agent 協作開發的自己。

SVM -> CNN -> GAN -> Transformer -> Agent

技術的浪潮就像大江東去，一波未平一波又起。當你以為站上了浪頭，下一個更大的浪已經打過來了。這讓人感到渺小，但也讓人感到無比興奮。

下一個 20 年，AI 會變成什麼樣子？我不知道，但我會繼續看下去。

(全文完)