使用 ↑ ↓ ← → 或W A S D 控制方向
留言載入中…
分享一個高內聚、低耦合的機器學習架構設計。利用 Gymnasium 與 Stable-Baselines3 在 Python 訓練,透過策略模式與 JSON 權重導出,在瀏覽器端實現高效能、可擴充的 AI 推理。
2026年1月18日 · wemee
這是一篇關於我們如何把一條只會在角落轉圈的笨蛇,訓練成能填滿 40% 地圖的頂級掠食者的故事。過程充滿了過度設計的失敗、被獎勵機制誤導的痛苦,以及最後「無為而治」的頓悟。
留言 0
留言載入中…