#2706 已修復

模型回應因輸出長度上限被截斷

回報者指出當模型輸出達到 max output tokens 上限時,回應會被截斷並顯示 finish_reason='length' 的錯誤,接著自動回滾到上一個完整的 assistant 回合;此問題在對話變長、模型產出較長內容時較常出現。