GTC 亮點:NVIDIA RTX PC 與 DGX Spark 本地端運行最新開源模型與 AI 代理人
消費級運算的範式正從個人裝置轉向代理人電腦。透過 NVIDIA DGX Spark 桌面 AI 超級電腦或專用的 NVIDIA RTX PC,使用者可以私密且免費地在本地端運行個人代理人,並利用最新的 Nemotron 開源模型與 NemoClaw 優化堆疊提升效能。
消費者運算的範式一直圍繞著個人裝置的概念——從個人電腦到智慧型手機和平板電腦。現在,生成式 AI——特別是 OpenClaw——引入了一個新類別:代理電腦(agent computers)。這些裝置,如 NVIDIA DGX Spark 桌面 AI 超級電腦或專用的 NVIDIA RTX PC,是運行個人代理程式的理想選擇——既私密且免費。
本週舉行的 NVIDIA GTC 展示了一系列代理式 AI(agentic AI)的發佈,包括:
-
用於本地代理的新型開放模型,包括 NVIDIA Nemotron 3 Nano 4B 和 Nemotron 3 Super 120B,以及針對 Qwen 3.5 和 Mistral Small 4 的優化。
-
NVIDIA NemoClaw,一個專為 OpenClaw 設計的開源堆疊,透過提高安全性並支援本地模型,優化了 NVIDIA 裝置上的 OpenClaw 體驗。
-
透過 Unsloth Studio 實現更簡單的微調,進一步提高代理工作流中開放模型的準確性。
親自參加 GTC 的與會者可以前往位於 GTC Park 的 NVIDIA build-a-claw 活動,活動時間為 3 月 19 日前每日上午 8 點至下午 5 點。NVIDIA 專家將協助賓客使用他們選擇的裝置,自定義並部署一個主動式、全天候在線的 AI 助手。無論是技術人員還是純粹好奇的參與者,都可以為他們的代理命名、定義其個性並授予其所需的工具權限——創建一個可以從他們偏好的通訊應用程式聯繫的個人助手。
新型開放模型為本地代理帶來雲端級品質
具有日益增長的上下文窗口(context windows)的下一代本地模型,提供了在 PC 上運行代理所需的智慧。結合更豐富的使用者上下文和強大的本地工具,這些進展正在開啟 AI PC 的新可能性,特別是在擁有 128GB 統一記憶體、支援超過 1200 億參數模型的 DGX Spark 上。
Nemotron 3 Super 於上週發佈,是一個擁有 1200 億參數的開放模型,具有 120 億個活動參數,旨在運行複雜的代理式 AI 系統。Nemotron 3 Super 是在 DGX Spark 或 NVIDIA RTX PRO 工作站上驅動代理的最佳選擇。在 PinchBench(一個用於確定大型語言模型在 OpenClaw 表現的新基準測試)中,Nemotron 3 Super 獲得了 85.6% 的評分,使其成為同類產品中頂尖的開放模型。
Mistral Small 4 是一個擁有 1190 億參數的開放模型,具有 60 億個活動參數(包含所有層則為 80 億個),統一了 Mistral 旗艦模型的功能。使用者現在擁有一個針對通用聊天、編碼和代理任務進行優化的超高效模型。
這兩款模型均可在 DGX Spark 和 RTX PRO GPU 上本地運行。
對於尋求較小模型的 GeForce RTX 使用者,Nemotron 3 Nano 4B 是 NVIDIA Nemotron 3 開放模型系列 的最新成員,為在 RTX AI PC 上本地構建代理和助手提供了一個精簡且強大的起點。該模型非常適合在資源受限的硬體上運行的遊戲和應用程式中,構建具有行動能力的對話角色。它適用於任何支援 NVIDIA GPU 的系統,並以極小的 VRAM 佔用結合了最先進的指令遵循能力和卓越的工具使用能力。
此外,NVIDIA 宣佈了對 阿里巴巴 Qwen 3.5 模型 的優化,這些模型展現了出色的準確性(27B、9B 和 4B),非常適合在 NVIDIA GPU 上運行本地代理。新模型原生支援視覺、多標記預測(multi-token prediction)和 262,000 個標記的大型上下文窗口。270 億參數的密集模型與 RTX 5090 GPU 搭配時表現優異。
*所有配置均使用 Q4_K_M 量化測量,BS = 1, ISL = 1024 且 OSL = 128,於 NVIDIA RTX 5090 和 Mac M3 Ultra 桌機上進行。標記生成吞吐量使用 llama.cpp b7789 透過 llama-bench 工具測量。
使用者今天就可以透過 Ollama、LM Studio 和 llama.cpp 嘗試這些模型,並由 RTX GPU 和 DGX Spark 提供加速推理。了解更多關於 NVIDIA 開放模型 的最新資訊。
利用最新的 RTX 優化模型加速創意 AI
Lightricks 最先進的影音模型 LTX 2.3 於本月初發佈,現在已支援 NVFP4 和 FP8 蒸餾模型,效能提升了 2.1 倍。了解更多關於 Lightricks LTX 2.3 模型 的資訊。
此外,Black Forest Lab 的 FLUX.2 Klein 9B 上週獲得更新,使圖像編輯速度提升高達 2 倍。NVIDIA 與 Black Forest Labs 合作發佈了 FP8 版本,針對 RTX GPU 的最快效能和最佳記憶體消耗進行了優化。
NVIDIA NemoClaw — 針對 OpenClaw 的 NVIDIA 優化
AI 開發者和愛好者正在購買 DGX Spark 超級電腦或組裝專用的 RTX PC,以運行像 OpenClaw 這樣的自主 AI 代理,這些代理可以從個人文件、應用程式和工作流中獲取上下文,並能自動執行日常任務。然而,隨著像 OpenClaw 這樣的代理系統普及,對標記(token)成本以及安全性和隱私的擔憂也隨之增加。
為了幫助解決這些問題,NVIDIA 本週推出了 NemoClaw,這是一個專為 OpenClaw 設計的開源堆疊,可在 NVIDIA 裝置上部署針對 OpenClaw 的優化。NemoClaw 中首批提供的功能包括 NVIDIA Nemotron 開放模型和 NVIDIA OpenShell 運行環境。Nemotron 本地模型讓使用者能在本地運行推理,這意味著更好的隱私且無需標記成本。OpenShell 則是專為更安全地執行 claw 而設計的運行環境。
了解更多關於 NemoClaw 的資訊。觀看 NVIDIA 創辦人暨執行長黃仁勳的 GTC 主題演講 並探索 分組會議。
透過 Unsloth Studio 讓微調變得簡單
隨著開放模型取得巨大飛躍,進一步提高準確性的一種方法是微調(fine-tuning),這允許使用者根據自己的數據和使用案例自定義模型。這種技術通常需要深入的技術專長、編碼知識和大量的配置。模型微調與對齊的領先開源庫 Unsloth 今日推出了 Unsloth Studio,這是一個易於使用的網頁介面,為 AI 愛好者和開發者簡化了微調過程。
Unsloth Studio 支援超過 500 種 AI 模型。簡單的使用者介面讓訓練和微調過程變得容易:使用者只需放入數據集,點擊基於圖形的畫布來生成額外的高品質合成數據,即可開始微調任務。它支援量化低秩適配(QLoRA)、低秩適配(LoRA)和全量微調。在模型微調過程中,使用者可以監控並視覺化任務進度。最後,他們可以將模型匯出到選擇的框架中並開始聊天,這一切都在同一個網頁應用程式中完成。
Unsloth Studio 的新介面建立在 Unsloth 庫之上,利用自定義和專門的 GPU 核心,可提供高達 2 倍的訓練速度並節省高達 70% 的 VRAM。這意味著新使用者可以開箱即用地充分發揮其 NVIDIA RTX GPU 和 DGX Spark 的效能。
立即嘗試 Unsloth Studio,包括 Nemotron 3 Nano 4B 和 Qwen 3.5 等新模型。查看其他 RTX AI Garage 文章,獲取更多關於使用 NVIDIA GeForce RTX GPU 微調模型的資訊。
來自 GTC 2026 的精彩回顧 (#ICYMI)
RTX AI 影片生成指南,特色為 ComfyUI 中的 RTX Video: 於今年早些時候在 CES 推出的全新 RTX AI 影片生成指南,向創作者和愛好者展示了如何使用引導式文字轉圖像工作流從概念走向創作,生成 AI 影片的關鍵影格,然後透過在本地 GPU 上運行的 RTX Video 技術放大至 4K。參考指南開始創作,並在社群媒體上使用 #AIonRTX 分享作品。
NVIDIA AI for Media 是一套高效能、易於使用的軟體開發套件,將 NVIDIA Broadcast 等級的 AI 效果——增強音訊(Linux 或 Windows)、影片 和 擴增實境 功能——帶入現場媒體、視訊會議和後期製作工作流。今日發佈的最新更新增加了更準確的對嘴同步、多活動發言者檢測、透過 RTX Video 超解析度功能在 RTX PRO 以及 GeForce RTX 40 和 50 系列 GPU 上實現更快的 4K 放大、更好的背景噪音消除,以及 NVIDIA Studio Voice 功能的更低延遲。
NVIDIA DLSS 5 將於今年秋季推出,透過為像素注入光影追蹤的照明和材質,縮小渲染與現實之間的差距,為遊戲視覺保真度帶來 AI 驅動的突破。
Maxon 發佈了 Redshift 2026.4,引入了由 DLSS 驅動的全新即時視覺化工作流,讓建築師能以互動式的速度和品質穿梭於項目之中。「NVIDIA 的 DLSS 技術是一個關鍵組件,讓我們能夠以互動速度提供高品質的視覺效果,」Maxon 首席技術暨 AI 官 Philip Losch 表示。
Reincubate Camo 在其 Camo Streamlight 應用程式中為 AI Autotune 增加了基於 NVIDIA TensorRT RTX EP 的 Windows ML,顯著提升了在 RTX GPU 上的效能。
關注 NVIDIA AI PC 的 Facebook、Instagram、TikTok 和 X —— 並訂閱 RTX AI PC 電子報 以獲取最新資訊。
在 LinkedIn 和 X 上關注 NVIDIA Workstation。
請參閱關於軟體產品資訊的 聲明。