
大型語言模型預測我的咖啡溫度
我測試了大型語言模型是否能準確預測陶瓷馬克杯中沸水的冷卻曲線,並將它們給出的數學公式與我實際實驗得到的數據進行了對比。
背景
本文作者進行了一項有趣的實驗,測試大型語言模型(LLM)是否能預測物理世界的動態現象。他要求模型給出一段時間內,倒入陶瓷杯中沸水的溫度變化方程式,並親自測量數據進行對比。實驗發現,雖然模型能捕捉到溫度下降的趨勢,但在初始階段的劇烈降溫與後期的緩慢冷卻上,預測值與實際觀測仍存在落差。
社群觀點
在 Hacker News 的討論中,許多具備工程與物理背景的網友指出,這類問題在熱力學中屬於經典案例,並非如作者想像中那般「不可預測」。多數留言者認為,LLM 展現出的結果其實是訓練數據中大量物理教科書與科學論文的體現。最核心的物理機制是「牛頓冷卻定律」,即物體散熱速率與環境溫差成正比。網友們觀察到,表現較佳的模型(如 Claude 4.6 Opus)給出的方程式包含了兩個指數衰減項,這反映了物理學上的雙重時間尺度:一個是熱量從水傳導至冷杯子的快速降溫期,另一個則是杯子與水共同向空氣散熱的緩慢冷卻期。
然而,對於 LLM 是否真的「理解」物理,社群中存在分歧。部分評論者批評作者過於神化這個問題,認為這就像是驚訝於模型能畫出高爾夫球的彈道曲線一樣,實際上這只是基礎物理公式的擬合。他們指出,模型之所以能給出合理的參數,是因為它在海量數據中見過類似的實驗設定。但也有人持正面態度,認為模型能自動識別出需要兩個時間尺度來建模,並給出大致正確的係數,這在實務上確實具有參考價值。
關於實驗數據與模型預測的落差,網友們提出了多種物理補償因素。例如,蒸發冷卻在接近沸點時效率極高,這解釋了初始階段溫度驟降的原因;此外,水的黏度會隨溫度變化,進而影響對流效率,這些複雜的非線性因素通常需要更精密的流體力學模型才能精確描述。有網友戲稱,這類實驗其實是另一種形式的「咖啡版圖靈測試」,考驗模型在面對缺乏具體參數(如杯子材質、形狀、環境濕度)時,能否展現出合理的「物理直覺」或品味。
此外,討論也延伸到了實際應用層面。有開發者分享自己正在開發利用機器學習預測濃縮咖啡萃取參數的應用程式,試圖將這類熱力學與流體力學的預測應用於提升生活品質。整體而言,社群共識傾向於認為 LLM 在這類問題上表現出的「常識」令人印象深刻,但對於嚴謹的科學預測,仍無法取代真正的物理建模與實驗觀測。
延伸閱讀
- Grind Finer App:一款利用機器學習協助調整咖啡研磨度與預測萃取結果的工具。
- HomeAssistant 咖啡自動化:網友分享如何透過藍牙秤與咖啡機整合,實現自動化的數據採集與分析。