模型回應因輸出長度上限被截斷

#2706 已修復

回報者指出當模型輸出達到 max output tokens 上限時，回應會被截斷並顯示 finish_reason='length' 的錯誤，接著自動回滾到上一個完整的 assistant 回合；此問題在對話變長、模型產出較長內容時較常出現。