Launch HN: RunAnywhere (YC W26) – 在 Apple Silicon 上實現更快的 AI 推論

Hacker News·26 天前

RunAnywhere 推出了 RCLI，這是一款適用於 macOS 的開源裝置端語音 AI，利用專有的 MetalRT 引擎在無需雲端依賴的情況下實現低於 200 毫秒的延遲。它具備完整的 STT、LLM 和 TTS 管線，讓使用者能透過語音高效地控制 Mac 並查詢本地文件。

github.com

rcli

runanywhere.ai

metalrt fastest llm decode engine apple silicon

runanywhere.ai

metalrt speech fastest stt tts apple silicon

runanywhere.ai

fastvoice on device voice ai pipeline apple silicon

runanywhere.ai

fastvoice rag on device retrieval augmented voice ai

github.com

RCLI

youtube.com

watch

背景

RunAnywhere 是一家隸屬於 YC W26 梯次的初創公司，近期推出了專為 Apple Silicon 優化的推理引擎 MetalRT 以及開源工具 RCLI。該項目旨在透過自研的 GPU 著色器，在不依賴雲端與 API 金鑰的情況下，於 Mac 本地實現極低延遲的語音 AI 流程，包含語音轉文字、大語言模型推理及文字轉語音，並支援對本地文件的檢索增強生成（RAG）與系統自動化操作。

社群觀點

Hacker News 社群對 RunAnywhere 展現出的技術性能數據表示高度關注，特別是其宣稱在 M3/M4 晶片上能超越 llama.cpp 與 Apple 官方 MLX 框架的推理速度。部分開發者在初步測試後認可了其語音交互的流暢度，認為低延遲是本地 AI 邁向實用的關鍵。然而，技術層面的質疑也隨之而來，有用戶指出在特定模型（如 Llama-3.2-3B）的基準測試中，開源引擎 uzu 的表現甚至優於 MetalRT。對此，開發團隊回應稱 MetalRT 的優勢在於整合了語音全鏈路的記憶體管理，而非單純的 LLM 推理。

除了性能討論，工具的穩定性與實用性成為爭論焦點。有使用者回饋在安裝過程中遇到分段錯誤（Segmentation Fault），或是在執行 macOS 系統指令時出現「幻覺」，例如語音宣稱已完成網頁導航但實際上並無動作。開發者坦承這是小型模型在工具調用（Tool Calling）上的侷限性，並建議升級至參數較大的模型以改善準確度。此外，關於安裝腳本會自動安裝 Homebrew 的行為也引發了部分資深用戶的不滿，認為這種做法過於侵入且缺乏透明度。

最激烈的爭論圍繞在該公司的誠信與社群治理上。部分網友翻出該公司過去曾因抓取 GitHub 數據發送開發者垃圾郵件而遭到抨擊的往事，質疑其企業倫理。這導致討論串一度偏離技術本身，轉向對 YC 公司是否享有 HN 首頁特權以及版主是否刻意壓制負面評論的辯論。版主 dang 介入解釋了 YC 啟動貼文的排序規則，並強調雖然過去的行為值得警惕，但討論應回歸產品本身。這種技術潛力與企業聲譽之間的拉鋸，構成了此次討論最複雜的背景。

延伸閱讀

在討論過程中，社群成員提及了多個值得關注的替代方案與技術資源。針對 LLM 推理，網友推薦了同樣針對 Apple Silicon 優化的開源引擎 uzu。在語音轉文字領域，有用戶分享了基於 Linux 環境的 voxtype，該工具結合了 Parakeet 模型以提供極高的辨識準確度。此外，針對希望在 Linux 上實現類似語音輸入體驗的開發者，sherpa-onnx 被視為一個強大的開發起點。對於尋求更佳量化效果的用戶，則有建議關注 unsloth 的量化技術，認為其在位元效率上通常優於傳統格式。

https://github.com/RunanywhereAI/rcli