context length exceeded 怎麼解?

context length exceeded 的官方解法:先用 /compress 壓縮目前 session,用 /usage 看用量;長期解法是在 config.yaml 的 model.context_length 明確設定模型實際上限。

這頁適合誰:長對話或大量工具輸出後撞到 context 上限的人。

步驟

  1. 壓縮目前 session

    在對話中輸入斜線指令。

    /compress
  2. 檢查用量與偵測到的上限

    啟動時會顯示偵測到的 context 上限,對話中可查。

    /usage
  3. 在 config.yaml 明確設定

    特別是自架 / 本地模型,要把 context_length 設成伺服器實際能力。

    model:
      context_length: 131072

完成後怎麼驗證

常見問題

本地模型特別容易撞到?

官方 FAQ 提醒用 Custom endpoint(如 Ollama)時要把 context length 設成伺服器實際能力,偵測值不一定正確。

相關頁