一份好的 AGENTS.md 等同於模型升級，壞的則比完全沒文件更糟

Hacker News·大約 5 小時前

我們針對數十份 AGENTS.md 文件進行了系統性研究，發現優質的文件能讓 AI 編碼代理的表現大幅提升，其效果相當於從 Haiku 升級到 Opus 模型，但設計不良的文件反而會導致過度探索並降低程式碼品質。

背景

隨著 AI 編碼助手成為開發流程的核心，如何撰寫有效的機器人指令文件（AGENTS.md）成為提升生產力的關鍵。這篇文章透過內部的 AuggieBench 評估系統，量化研究了不同撰寫模式對 AI 代理生成的程式碼品質影響，發現一份優質的引導文件能讓模型表現從 Haiku 等級躍升至 Opus，但若撰寫不當，反而會導致模型過度探索或產生錯誤抽象，其效果甚至比完全沒有文件更糟。

社群觀點

針對這項研究，Hacker News 社群展開了多維度的討論。部分開發者認為這反映了軟體工程中長久以來的真理，即針對 AI 撰寫的文件本質上與針對人類撰寫的 README 或開發手冊並無二致，只是現在我們擁有了「合成程式設計師」作為基準，能夠量化這些過去被視為理論性的軟體工程實踐。這種量化能力讓開發者能更精準地觀察文件如何影響開發品質，而不僅僅是憑感覺行事。

然而，社群中也出現了關於「過度適應」的批評。有觀點認為，如果開發者必須為了防止 AI 犯錯而提前替它們思考並撰寫詳盡的引導文件，這本質上是一種「應對行為」而非真正的技術升級。這類意見指出，當前的模型在處理複雜邏輯時仍顯脆弱，才需要人類介入進行精細的提示工程。對此，支持者反駁道，這種邏輯同樣適用於人類工程師，撰寫清晰的規範與流程本就是為了減少人為錯誤，將其應用於 AI 代理只是延續了良好的工程傳統。

在技術實作層面，討論聚焦於文件的組織結構與讀取機制。有開發者分享經驗指出，在重要的子目錄中分散放置更具針對性的 AGENTS.md，比僅在根目錄放置一份龐大的文件更有效，這種做法能像「重點摘要」一樣在 AI 接觸特定系統時提供即時上下文。不過，也有人提醒，目前的工具（如 VS Code Copilot）在自動偵測與讀取巢狀文件時仍不夠穩定，這可能導致精心撰寫的文件被遺漏。因此，有討論提議應將這些引導機制抽象化，由底層框架自動管理，而非依賴開發者手動維護。

最後，社群也探討了 AI 自我優化的可能性。開發者們好奇 LLM 是否能透過反饋循環進行自我反思，根據前一次任務的失敗經驗自動修改其使用的引導文件。雖然目前已有如 DSPy 等工具嘗試進行自動化提示優化，但要將這種「爬坡式」的改進推廣到通用的開發場景中，仍面臨不小的挑戰。

你的個人知識庫

一份好的 AGENTS.md 等同於模型升級，壞的則比完全沒文件更糟

背景

社群觀點

延伸閱讀