Show HN:在 Apple Silicon Mac 上執行 TRELLIS.2 影像轉 3D 模型,無需 NVIDIA GPU
本專案將微軟頂尖的 TRELLIS.2 影像轉 3D 模型移植到 Apple Silicon,透過 PyTorch MPS 與純 Python 替代方案取代僅支援 CUDA 的函式庫。這讓 Mac 使用者能在 M4 Pro 晶片上,於約 3.5 分鐘內原生生成高品質的 3D 網格。
背景
微軟開發的 TRELLIS.2 是一款擁有 40 億參數、能將單張圖片轉換為高品質 3D 模型的先進技術,但其原始版本高度依賴 NVIDIA 的 CUDA 架構與特定硬體加速庫。開發者 shivampkumar 成功將此模型移植至 Apple Silicon 平台,透過 PyTorch MPS 後端取代了原本的 CUDA 專屬算子,讓 Mac 使用者無需依賴雲端或高階 NVIDIA 顯卡,即可在本地端生成包含超過 40 萬個頂點的 3D 模型。
社群觀點
針對這項移植成果,Hacker News 社群展開了關於技術可行性與模型實用價值的討論。部分網友對於「Mac 支援」的必要性持有保留態度,認為雖然 PyTorch 的 MPS 後端理論上一直都能支援這類運算,但開發者通常在 Hugging Face 等平台展示模型時會刻意忽略 Mac 相容性。這主要是因為硬體效能的巨大落差,在 Mac 上的執行速度可能比 NVIDIA GPU 慢上十倍,對於追求極致生成速度的開發者而言,為了相容性而犧牲效能的誘因並不高。
然而,這種觀點也引發了關於「理論可行性」與「實際可用性」之間的爭辯。有留言指出,雖然理論上可行,但若缺乏像作者這樣針對稀疏卷積、注意力機制以及網格提取等核心組件進行底層重構,原始模型根本無法在 Mac 上運行。作者的貢獻在於解決了 CUDA 專屬庫(如 flash_attn 或 nvdiffrast)無法在 macOS 環境運作的技術斷層,讓「理論上的可能」轉化為「實際可執行的工具」。
除了技術底層的討論,社群對於 TRELLIS.2 模型本身的品質也存在分歧。有使用者直言不諱地將該模型歸類為較不實用的等級,認為目前的 3D 生成領域中,開源模型的表現仍普遍落後於商業方案。該觀點指出,雖然本地端運行的嘗試值得肯定,但在實際應用中,像是 meshy.ai 等商業服務所產出的 3D 模型品質仍遠優於 TRELLIS 系列。這反映出開源社群在 3D 生成領域仍面臨挑戰,即便解決了硬體門檻,模型本身的精確度與可用性仍是使用者最在意的核心問題。
延伸閱讀
在討論中,有使用者提到 meshy.ai 作為目前 3D 生成效果較佳的參考對象,可作為與 TRELLIS.2 比較品質的基準。
相關文章
其他收藏 · 0