你的 AI 團隊為什麼越跑越慢？因為上下文太重了

很多管理者都遇過同一個現象：AI 團隊剛開始上線時很快，回應乾脆、產出也有感；但跑一陣子之後，速度開始下滑，成本往上，連簡單任務都拖泥帶水。這時很多人直覺會怪模型不夠強、提示詞失效，或工具組合選錯。其實更常見的問題不是 AI 能力下降，而是它背著越來越重的上下文在工作。

所謂上下文重量，說白了就是：每次啟動都讀太多不必要的東西。明明只要處理一個客服分類任務，卻順手掃進一堆舊專案筆記、過期規則、沒人維護的資料夾，甚至把上週就失效的狀態一起帶進來。這些內容不只讓 agent 變慢，也會直接燒掉 token、增加判斷噪音，最後讓輸出品質一起下滑。AI 不是看得越多越厲害；對管理來說，關鍵是它每次看的是不是剛好夠用。

要幫團隊減重，先抓 3 件事。

第一，工作目錄只留正在用的。正在跑的流程、當前版本的規則、最近會被引用的文件留下；結案資料、舊草稿、廢棄流程搬走。很多團隊把工作區當倉庫，結果 agent 每次開工都像在舊辦公室翻箱倒櫃。

第二，啟動讀取範圍要固定，而且越小越好。不要讓每個 agent 一上來就自由掃描整個專案。你應該明確定義：這個任務只讀哪些檔、哪些目錄、哪些規則。範圍固定，速度才穩，錯誤才好追。

第三，超過 50 個檔的目錄，通常就該清了。這不是美感問題，是管理訊號。檔案一多，命名開始重複、版本開始混亂、規則開始分散，agent 讀取成本一定上升。只要一個目錄已經大到沒人能快速說清楚每份檔案的用途，那它對 AI 也不會友善。

管理者怎麼判斷自己團隊是不是中了這個問題？你不用先看模型參數，先看三個數字。

第一，agent 啟動時到底讀了幾個檔？如果每次任務都要先讀十幾二十個檔，還包含大量背景材料，速度慢幾乎是必然。

第二，有多少檔是 3 天沒動過，卻還留在核心工作區？這些檔案如果不會被當前流程實際使用，就不該繼續占據上下文。

第三，有沒有重複規則散在不同檔裡？同一件事如果在 A 文件寫一次、B 筆記改一次、C 指南又補一次，agent 很容易讀到互相衝突的版本。這種混亂，比模型本身還容易造成失誤。

結論其實很硬：上下文輕量化不是整理癖，也不是工程師潔癖，而是管理紀律。你不是在幫 AI 收桌面，你是在控制成本、縮短延遲、降低噪音，讓團隊維持穩定產能。AI 團隊跑得快，不是因為塞了最多資訊，而是因為每次都只帶著最必要的資訊上場。

你的 AI 團隊為什麼越跑越慢？因為上下文太重了

延伸閱讀