反對感覺流:生成式模型何時才真正有用
我提出了一個科學框架,根據編碼與驗證成本而非主觀感覺或炒作來評估生成式模型。我認為當提示與驗證輸出的成本低於手動創作時,這些模型才最有效,特別是針對複雜度較低的任務。
背景
本文探討生成式模型在實際應用中的效用評估,批評當前科技圈過度依賴「感覺」(Vibes)而非科學論證的現象。作者提出了一個分析框架,主張生成式模型的價值應取決於「描述任務的成本」與「驗證結果的成本」之間的比例,並質疑在複雜工程任務中,這些模型是否真能提升生產力,還是僅僅製造了看似正確的幻覺。
社群觀點
在 Hacker News 的討論中,社群成員對於作者提出的科學框架表示認同,特別是關於「描述任務」與「檢查輸出」之間的難度對比。支持者認為,這正是工程思維的體現,若要成功運用這些模型,使用者必須具備獨立於模型之外的評估能力與執行機制。然而,對於「編碼成本」的理解,留言者之間存在有趣的歧見。有人認為新一代模型之所以顯得更強大,本質上是因為它們更擅長「讀心」,即透過機率預測來補足人類自然語言中的模糊地帶,從而降低了使用者表達意圖的門檻。
針對軟體開發的本質,討論區出現了兩極化的看法。部分觀點認為,對於大多數人來說,撰寫程式碼本身是一種繁瑣的勞動,而 AI 正好消滅了這部分工作;未來手寫程式碼可能會像手工藝一樣變成一種純粹的愛好,而非職業競爭力的核心。但另一派觀點則從知識創造的角度反駁,認為軟體開發的過程本身就是一種研究與設計,開發者在親手實作的過程中才能提煉出核心抽象概念。如果過早依賴 AI 生成,雖然速度加快,卻可能導致開發者在錯誤的設計路徑上走得太遠,反而錯失了真正優雅的解決方案。
此外,也有留言者指出「難度」具有主觀性。如果一位開發者熱愛寫程式但討厭程式碼審查,那麼即便 AI 能代勞寫作,對該使用者而言,這種工具可能反而降低了工作的樂趣。這種觀點將作者的客觀成本模型延伸到了心理層面,認為工具的效用不僅在於節省時間,也在於它如何改變使用者的工作體驗。整體而言,社群共識傾向於認為生成式模型是強大的輔助工具,但其價值高度取決於使用者的領域專業知識,因為缺乏驗證能力的初學者,終究無法確保複雜產出物的品質。
延伸閱讀
- Claude Code:留言中提到的開發工具,被用來討論 AI 如何改變軟體開發的節奏與思考過程。