[Feature] 建議加入「先驗證才能宣稱完成」的行為規範與未驗證完成宣稱偵測器
目前 agent 常在沒有實際驗證的情況下就宣稱任務完成或可運作,缺乏引導 agent 先驗證再宣稱完成的機制,也沒有偵測器能標記出沒有紀錄支持的完成宣稱。提案新增系統提示引導與一個預設只記錄不阻擋的影子偵測器;作者提到此功能已在另一個 PR(#54576)實作並運作中。
目前 agent 常在沒有實際驗證的情況下就宣稱任務完成或可運作,缺乏引導 agent 先驗證再宣稱完成的機制,也沒有偵測器能標記出沒有紀錄支持的完成宣稱。提案新增系統提示引導與一個預設只記錄不阻擋的影子偵測器;作者提到此功能已在另一個 PR(#54576)實作並運作中。