
Cloudflare 第 13 代伺服器:以快取換取核心數,實現 2 倍邊緣運算效能
我們推出了搭載 AMD EPYC Turin 處理器的第 13 代伺服器,透過將核心請求處理層以 Rust 重寫為 FL2,成功克服了快取減少的限制,並實現了 2 倍的邊緣運算效能提升。
背景
Cloudflare 近期發表了第 13 代伺服器的架構更新,宣布全面採用 AMD EPYC 5th Gen Turin 處理器。這項硬體升級的核心挑戰在於,雖然核心數翻倍至 192 核,但每核心分配到的 L3 快取卻大幅縮減至前代的六分之一。為了克服快取減少帶來的延遲懲罰,Cloudflare 透過將核心請求處理層從基於 NGINX 與 LuaJIT 的 FL1 遷移至以 Rust 重寫的 FL2,成功在降低快取依賴的同時,實現了兩倍的邊緣運算效能提升。
社群觀點
在 Hacker News 的討論中,社群對於這項技術演進展現了兩極化的反應。部分開發者對 Cloudflare 選擇將軟體重寫與硬體升級掛鉤的做法感到困惑,認為文章並未充分解釋 Rust 究竟如何解決快取不足的問題。有觀點指出,從動態語言與指標密集的資料結構轉向具有靜態類型、更佳記憶體佈局控制的 Rust,自然能減少記憶體足跡並降低對頻寬的需求,這在 DRAM 價格高漲的當下顯得尤為重要。然而,也有評論者持保留態度,認為這項數據混淆了軟體優化與硬體升級的貢獻,若沒有提供 FL2 在舊硬體上的對比基準,很難判斷效能翻倍究竟歸功於 Rust 的效率,還是單純靠核心數堆疊出來的結果。
有趣的是,這篇文章的寫作風格意外引發了一場關於人工智慧生成內容的爭論。部分讀者批評文章充滿了典型的行銷術語與 AI 筆觸,認為這種過於刻意的起承轉合與轉折語句降低了技術文章的可讀性,甚至讓人懷疑這是否為 Cloudflare 為了配合 AMD 宣傳而強行湊合的專案。但也有支持者反駁,認為 Cloudflare 長年以來的技術部落格本就維持這種深入淺出的風格,不應將所有流暢的技術敘述都歸類為 AI 產出的垃圾內容。
此外,硬體愛好者們則從歷史角度切入,將此次快取與核心數的權衡比作早年 Celeron 與 Pentium 處理器之間的競爭,或是 AMD Phenom 時期的架構策略。有評論分析指出,隨著半導體製程演進,邏輯電路持續縮小但 SRAM 尺寸卻停滯不前,每核心快取減少已成為現代晶片設計的必然趨勢。在這種背景下,Cloudflare 的案例實際上反映了軟體架構必須主動適應硬體物理限制的現實。最後,也有人感嘆 LuaJIT 的強大,認為即便在快取受限的極端環境下,原本基於 LuaJIT 的舊系統依然能與高度優化的 Rust 系統相提並論,側面證明了這款即時編譯器的卓越性能。