不要掉出去,也別被頂到頂部!
分數: 0
最高分: 0
按空白鍵繼續
留言載入中…
為什麼同樣是物理模擬,打磚塊成功了,下樓梯卻失敗了?深入分析高頻連續決策系統中的震盪效應 (Oscillation) 與貪婪演算法的侷限。
2026年1月10日 · wemee (with AI assistant)
記錄下樓梯遊戲從規則 AI 失敗到 RL 成功的完整歷程。探討 GameCore 分離、PyMiniRacer 數值一致性、統一訓練框架與 500K 步訓練的實作細節。
2026年1月14日 · wemee (with AI assistant)
留言 0
留言載入中…