反對感覺流：生成式模型何時才真正有用

Hacker News·26 天前

我提出了一個科學框架，根據編碼與驗證成本而非主觀感覺或炒作來評估生成式模型。我認為當提示與驗證輸出的成本低於手動創作時，這些模型才最有效，特別是針對複雜度較低的任務。

against vibes when is a generative model useful

背景

本文探討生成式模型在實際應用中的效用評估，批評當前科技圈過度依賴「感覺」（Vibes）而非科學論證的現象。作者提出了一個分析框架，主張生成式模型的價值應取決於「描述任務的成本」與「驗證結果的成本」之間的比例，並質疑在複雜工程任務中，這些模型是否真能提升生產力，還是僅僅製造了看似正確的幻覺。

社群觀點

在 Hacker News 的討論中，社群成員對於作者提出的科學框架表示認同，特別是關於「描述任務」與「檢查輸出」之間的難度對比。支持者認為，這正是工程思維的體現，若要成功運用這些模型，使用者必須具備獨立於模型之外的評估能力與執行機制。然而，對於「編碼成本」的理解，留言者之間存在有趣的歧見。有人認為新一代模型之所以顯得更強大，本質上是因為它們更擅長「讀心」，即透過機率預測來補足人類自然語言中的模糊地帶，從而降低了使用者表達意圖的門檻。

針對軟體開發的本質，討論區出現了兩極化的看法。部分觀點認為，對於大多數人來說，撰寫程式碼本身是一種繁瑣的勞動，而 AI 正好消滅了這部分工作；未來手寫程式碼可能會像手工藝一樣變成一種純粹的愛好，而非職業競爭力的核心。但另一派觀點則從知識創造的角度反駁，認為軟體開發的過程本身就是一種研究與設計，開發者在親手實作的過程中才能提煉出核心抽象概念。如果過早依賴 AI 生成，雖然速度加快，卻可能導致開發者在錯誤的設計路徑上走得太遠，反而錯失了真正優雅的解決方案。

此外，也有留言者指出「難度」具有主觀性。如果一位開發者熱愛寫程式但討厭程式碼審查，那麼即便 AI 能代勞寫作，對該使用者而言，這種工具可能反而降低了工作的樂趣。這種觀點將作者的客觀成本模型延伸到了心理層面，認為工具的效用不僅在於節省時間，也在於它如何改變使用者的工作體驗。整體而言，社群共識傾向於認為生成式模型是強大的輔助工具，但其價值高度取決於使用者的領域專業知識，因為缺乏驗證能力的初學者，終究無法確保複雜產出物的品質。

反對感覺流：生成式模型何時才真正有用

背景

社群觀點

延伸閱讀