newsence
歡迎

你的個人知識庫

從開放網路上發現值得讀的內容,收藏真正重要的。AI 為你摘要、串連、整理你所知道的一切。

AI 可能讓科技界最寶貴的資源走向民主化

AI 可能讓科技界最寶貴的資源走向民主化

Wired - AI·大約 6 小時前

人工智慧正讓晶片設計與針對不同矽晶片的軟體優化變得更加容易。一些新創公司預見這將引發一場晶片製造革命。

Nvidia 是 AI 晶片領域無可爭議的王者。但多虧了它協助打造的 AI,這位冠軍可能很快就會面臨日益激烈的競爭。

現代 AI 運行在 Nvidia 的設計之上,這種動態已將該公司的市值推升至遠超 4 兆美元。每一代新的 Nvidia 晶片都讓企業能夠利用大型數據中心內成百上千個聯網處理器,來訓練更強大的 AI 模型。Nvidia 成功的原因之一在於它提供了軟體來協助為每一代新晶片編寫程式。而這項技能可能很快就不再是如此獨特的優勢。

一家名為 Wafer 的新創公司正在訓練 AI 模型來執行 AI 領域中最困難且最重要的工作之一:優化程式碼,使其在特定的矽晶片上運行得盡可能高效。

Wafer 的共同創辦人兼執行長 Emilio Andere 表示,公司對開源模型進行強化學習,教導它們編寫核心程式碼(kernel code),即作業系統中直接與硬體互動的軟體。Andere 表示,Wafer 還為現有的編碼模型(如 Anthropic 的 Claude 和 OpenAI 的 GPT)添加了「代理導向架構」(agentic harnesses),以增強它們編寫直接在晶片上運行的程式碼的能力。

許多知名的科技公司現在都有自己的晶片。蘋果等公司多年來一直使用客製化矽晶片來提高筆記型電腦、平板電腦和智慧型手機上軟體的性能和效率。在另一端,Google 和 Amazon 等公司則鑄造自己的矽晶片,以提升其雲端運算平台的性能。Meta 最近表示,將利用與 Broadcom 共同開發的新晶片部署 1 十億瓦(gigawatt)的運算能力。部署客製化矽晶片還涉及編寫大量程式碼,以便在新的處理器上順暢且高效地運行。

Wafer 正在與 AMD 和 Amazon 等公司合作,協助優化軟體以在其硬體上高效運行。這家新創公司目前已從 Google 的 Jeff Dean、OpenAI 的 Wojciech Zaremba 等人手中籌集了 400 萬美元的種子輪資金。

Andere 認為,他公司以 AI 為導向的方法有潛力挑戰 Nvidia 的主導地位。目前許多高端晶片提供的原始浮點運算性能(衡量晶片執行簡單計算能力的關鍵行業基準)已與 Nvidia 最好的矽晶片不相上下。

「最好的 AMD 硬體、最好的 [Amazon] Trainium 硬體、最好的 [Google] TPU,都能提供與 Nvidia GPU 相同的理論浮點運算量,」Andere 最近告訴我。「我們希望最大化每瓦特的智能。」

Andere 表示,具備優化程式碼使其在這些晶片上可靠且高效運行所需技能的性能工程師價格昂貴且需求量大,而 Nvidia 的軟體生態系統使得為其晶片編寫和維護程式碼變得更加容易。這使得即使是最大的科技公司也很難獨自完成。

例如,當 Anthropic 與 Amazon 合作在 Trainium 上構建其 AI 模型時,它必須從頭重寫模型的程式碼,以使其在硬體上盡可能高效地運行,Andere 說。

當然,Anthropic 的 Claude 現在是眾多在編寫程式碼方面達到超人類水平的 AI 模型之一。因此 Andere 認為,AI 開始蠶食 Nvidia 的軟體優勢可能指日可待。

「護城河存在於晶片的可程式化性中,」Andere 在提到讓優化 Nvidia 硬體程式碼變得更容易的函式庫和軟體工具時說道。「我認為是時候開始重新思考這是否真的是一道強大的護城河了。」

除了讓優化不同矽晶片的程式碼變得更容易之外,AI 可能很快也會讓設計晶片本身變得更容易。由兩位前 Google 工程師 Azalia Mirhoseini 和 Anna Goldie 創立的新創公司 Ricursive Intelligence,正在開發利用人工智慧設計電腦晶片的新方法。如果其技術取得成功,將會有更多公司涉足晶片設計,創造出能更高效運行其軟體的客製化矽晶片。

「我們正致力於解決晶片設計中最耗時的部分——物理設計和設計驗證,」同時也是史丹佛大學助理教授的 Mirhoseini 在提到晶片設計涉及的兩大主要挑戰時說道。

設計電腦晶片是地球上最重要且最棘手的工作之一。晶片工程師需要弄清楚如何在一塊矽片上排列大量的組件,以優化不同的功能。在晶片初步設計完成後,其性能必須在迭代過程中經過仔細的測試和驗證,然後才能將設計發送到晶圓代工廠。

Nvidia 的設計對於現代 AI 至關重要,每一代新晶片都讓企業能夠利用大型數據中心內成百上千個聯網處理器來訓練更強大的 AI 模型。

Mirhoseini 和 Goldie 在 Google 任職期間開發了一種讓 AI 優化電腦晶片關鍵組件佈局的方法。這種方法改變了 Google 設計自家處理器的方式,目前已在業界廣泛用於協助排列不同晶片上的功能。

然而,Ricursive 的目標是更進一步,將晶片設計的更多元素自動化,並將大型語言模型整合到流程中。其目標是讓工程師能夠使用自然語言來描述變更或詢問有關晶片的問題。就像人們可以透過「憑感覺編碼」(vibe code)來開發應用程式一樣,或許最終也有可能「憑感覺設計」晶片。

Ricursive 仍在開發其技術,但 Mirhoseini 表示,公司已經證明它可以優化晶片設計的更多面向。

這種自動化晶片設計的前景讓一些投資者垂涎三尺:Ricursive 在短短幾個月內就以 40 億美元的估值籌集了 3.35 億美元。

Goldie 表示,最終或許有可能讓 AI 協同設計晶片和演算法,使其更加強大。她說,讓 AI 調整自己的矽晶片和程式碼可能會形成一種遞歸式的 AI 進步。「我們正在進入這個新體制,我們可以投入更多的運算量來設計更快、更好的晶片——為晶片設計創造出一種縮放定律(scaling law)。」

你對 AI 設計自己的矽晶片有什麼看法?請留言或發送電子郵件至 [email protected] 讓我知道。

https://wired.com/story/ai-could-democratize-one-of-techs-most-valuable-resources/