
你的第一個人形機器人同事很可能來自中國
爆炸性的加速、有限的靈活性、後腦勺長了眼睛。到底會出什麼差錯?
站在我面前這台 4 英尺高的人形機器人,老實說,看起來有點醉。它在兩腿之間跳躍,揮舞著手臂。大約 30 秒後,它突然停下,然後伸出一隻手臂朝我大步走來。
這台小機器人出現在上海黃浦江畔的世界人工智能大會(WAIC)上。展覽中心到處都是人形機器人——有的在跳舞,有的在搬運箱子,還有的在展位周圍遛著機器狗。幾台機器人正癱倒在角落充電。

這台機器人使用前置深度攝像頭和 3D 光學雷達掃描儀,提供前後方的視野。
這是七月一個溫暖的日子,我來到上海,是為了了解中國的 AI 領域與我平時報導的西方世界有何不同。我立刻注意到比亞迪(BYD)、小米(Xiaomi)和華為(Huawei)那些造型流線的電動車,充斥在時尚的舊法租界街道上。在高端連鎖咖啡店 Manner,我品嚐了一款名為「氣泡柑橘冰美式」的前衛飲品。現在身處大會現場,我不禁想像這些跳舞的機器人漫步在上海街頭,或許還幫主人提著購物袋。
一群人圍在一個小型拳擊場旁,兩台人形機器人正互相揮拳。其中一台倒下了,隨後又蹲坐起來並站直身體。一位年輕女性提議讓我打一下人形機器人,我覺得這會讓我心裡不舒服,於是婉拒了。
當然,展覽中心的這些活動帶有一點幻象色彩。在人群中,你可以看到有人拿著遊戲控制器,向機器人發出高階指令。這些人形機器人可以控制平衡並執行簡短的例行動作,但要走向哪裡、跟誰握手或何時做後空翻,仍由人類決定。另一個限制是:許多人形機器人沒有手指。它們的手臂末端通常是圓柱狀,這意味著雖然它們可以抱起或抬起箱子(或戴上拳擊手套),但無法抓取任何東西。
在東京國際機器人展上,宇樹科技(Unitree)的 G1 機器人在踢拳示範中對打。
儘管如此,專家預測機器人將對勞動力和經濟產生深遠影響。亞馬遜正在測試來自美國新創公司 Agility 的人形機器人,根據流出的備忘錄,亞馬遜預計在未來幾年內用機器人取代大量工人。美銀分析師預測,到 2035 年,機器人製造商每年將出貨 1,000 萬台人形機器人。摩根士丹利預測,到 2050 年將有 10 億台機器人投入使用,其中近三分之一(3.023 億台)將在中國,而美國則為 7,770 萬台。
或許沒有哪家人形機器人製造商比總部位於杭州的「宇樹科技」(Unitree)領先優勢更大。當伊隆·馬斯克的 Optimus 在演示中步履蹣跚時,宇樹的機器人正在進行衝刺、功夫踢腿和特技後空翻(大會上跳舞的迎賓機器人就是宇樹的產品)。宇樹的有腿機器人也極其便宜,售價僅數萬美元甚至更低,只有美國同類機器人成本的十分之一。宇樹是中國最著名的機器人新創公司,也是其科技產業的國家冠軍企業,據報導正計劃在上海進行估值 70 億美元的 IPO 上市。如果宇樹失敗了呢?還有多達 200 多家中國公司也在研發人形機器人,這甚至促使中國政府最近發出了產能過剩和不必要重複建設的警告。相比之下,美國約有 16 家知名公司在研發人形機器人。
有了這樣的數據,人們不禁懷疑,第一個擁有百萬台人形機器人的國家將會是中國。

憑藉 43 個馬達和強大的機載電腦,宇樹 G1 可以完成踢腿、翻轉和舞蹈動作。
杭州
宇樹的所在地杭州距離上海約 110 英里。這座城市以廣闊且上鏡的西湖聞名,但它也是電子商務巨頭阿里巴巴、螞蟻集團(阿里巴巴關聯公司)以及幾家快速成長的 AI 新創公司的所在地。除了宇樹,還包括其開源 AI 模型在全球廣受歡迎的 DeepSeek。
我希望能參訪宇樹以及其他幾家公司。與許多競爭對手不同,宇樹銷售多種有腿機器人且已實現盈利。遺憾的是,由於公司正準備 IPO,我發現它基本上不對訪客開放。後來我聽說其總部充滿了「戰鬥痕跡」:入口處的一組樓梯因為有腿機器人練習搬運重物而被撞得傷痕累累。「那是你能想像到最破舊的地方之一,」曾在那裡待過的駐新加坡機器人企業家 Mike Cho 表示,「到處都是壞掉的機器人、零件和破碎的水泥地。」
後來我聯繫上了宇樹的 CEO 王興興,他以英語不佳為由,同意透過通訊軟體微信(WeChat)交談。王興興在中國是位名人。2025 年 2 月,他受邀參加了由中國總理主持的活動,與會者還包括幾位中國科技界的重量級人物(阿里巴巴的馬雲、華為創始人任正非、比亞迪董事長王傳福以及小米 CEO 雷軍)。在上海的大會上,我曾看到王興興用極快的語速發表主題演講。他告訴觀眾,他計劃建造擅長「端茶遞水、在工廠工作,甚至表演藝術」的機器人。
在微信上,他告訴我他從小就對機器人著迷。大學一年級時,他用 200 元人民幣(28 美元)的預算拼湊出了一個小型雙足機器人。「當我看到自己設計的機器人活過來的那一刻,」王興興寫道,「那種結合技術與創意的成就感,讓我決心投身於機器人研究。」
2015 年在上海大學讀碩士期間,他用不到 2 萬人民幣(約 2,800 美元)造出了一個小型四足機器人。這在社交媒體上引起了轟動;人們驚訝於一名學生竟能造出如此步伐穩健、成本低廉的機器。他曾在無人機公司大疆(DJI)短暫工作,隨後在 2016 年獲得少量種子資金並創立了宇樹科技。公司於 2017 年發布了第一款產品——名為 Laikago 的機器狗。
王興興承認,早期波士頓動力(Boston Dynamics)及其四足機器人 Spot 是他的靈感來源。Ghost Robotics 的 CEO Gavin Kenneally 回憶起在貿易展和會議上看到 Laikago 的情景。「他們的機器人當時性能真的不太行,」他告訴我。但當 Spot 售價 7.5 萬美元時,Laikago 僅售 2.5 萬美元。
2019 年,麻省理工學院(MIT)的一個團隊開發了一款電動馬達,讓其四足機器人 Mini Cheetah 能以創紀錄的速度奔跑。不到一年後,宇樹推出了新款四足機器人 A-1。「它基本上就是 MIT Mini Cheetah 的翻版,」Kenneally 說,「它比他們之前的平台有了跨越式的進步。」
宇樹的業務隨即起飛。根據諮詢公司 SemiAnalysis 的數據,2023 年其四足機器人的銷量是波士頓動力的 10 倍。近 2.4 萬台宇樹四足機器人被售出,應用於建築工地、油井平台和工廠等場所。這些機器人可以爬樓梯、穿過碎石堆進行檢查或安全巡邏。

許多人形機器人的手臂末端是殘端,而非真正的手。增加三指或五指手掌需要額外費用。

一些較新的手部包含壓力傳感器,讓機器人能感知物體。
拆解一台宇樹機器人,你會看到中國高度整合製造業的巨大優勢,在這種環境下,與供應商的緊密關係決定了公司的成敗。SemiAnalysis 研究了宇樹最新款四足機器人 Go2 的一種配置,售價約 8,000 美元。該諮詢公司發現,其所有核心組件——傳感器、馬達、變速箱、電池、電腦——的成本僅為 3,272 美元(宇樹其他配置的 Go2 售價甚至低至 1,600 美元)。「他們所做的是利用中國的製造業和供應鏈進行極速迭代,」Kenneally 告訴我。
王興興感興趣的不僅是機器狗。波士頓動力研發人形機器人 Atlas 已有多年。到 2023 年,王興興看著馬斯克透過 Optimus 的演示激發了人們對人形機器人的熱情,他也開始研發自己的人形機器人。同年 8 月,宇樹發布了首款模型 H1。不到一年後,宇樹開始銷售性能更強的 G1,學術用戶售價僅 1.35 萬美元出頭。今年夏天,該公司又推出了一款更便宜但技術較簡單的人形機器人 R1,售價僅為 39,999 元人民幣(5,700 美元)。
在 WAIC 的演講中,王興興暗示機器人智能革命即將到來。「當機器人能進入陌生房間、給人遞瓶水,或在簡單指令下自主收拾屋子時,機器人的『ChatGPT 時刻』就到來了,」他告訴與會者。「如果快的話,這可能在 1 到 3 年內發生,最遲 3 到 5 年。」
許多機器人專家相信他們很快就會迎來「ChatGPT 時刻」,當然,問題在於如何定義它。不過,我有理由懷疑王興興的看法偏向樂觀。在最近於杭州舉行的一場大型機器人會議上,專家小組調查了現場觀眾:人形機器人是否會在 2050 年前取代大多數人類工作?王興興是少數認為會的人之一。
北京
我趕往北京,拜訪另一家正關注機器人「ChatGPT 時刻」的機構。北京智源人工智能研究院(BAAI)是北京市政府於 2018 年成立的非營利機構,旨在協調 AI 研究。從智源機器人實驗室(位於一棟矮辦公樓的高層)的窗戶望出去,可以看到清華大學和北京大學這兩所中國頂尖學府的校園。儘管具有學術背景,智源仍引起了美國政府的注意。2025 年 5 月,美國商務部將該研究院列入實體清單,禁止其獲取美國技術。美國政府指責智源「企圖獲取美國原產物品以支持中國軍事現代化」,儘管智源的工作人員堅稱其僅是一個研究實驗室。
在研究院,我遇到了另一台跳舞的宇樹機器人。這台機器人擺出寬闊的站姿,然後隨著節拍跺腳並揮動拳頭。我以前沒見過這些動作,這是有原因的。這台人形機器人使用的是一種實驗性方法,即 AI 模型透過觀察人類動作來學習——在這個案例中,是學習來自抖音(TikTok 的中國版)的舞蹈動作。
在北京一家商場的開業典禮上,宇樹 G1 機器人展示舞姿。
智源研究院院長兼機器人工作負責人王仲遠向我介紹了該院新的開源機器人模型 Robobrain 2.0,工程師開發此模型是為了將語言模型的能力與空間推理結合。機器人尚未充分利用語言模型的廣泛能力,人們希望大語言模型(LLM)能幫助機器人在陌生環境中運作並更好地溝通。在一次實驗中,智源研究人員使用 Robobrain 2.0 控制一對機器人手臂。當模型聽到有人說「我餓了,給我做個漢堡」時,它將這句話轉化為動作指令,指揮機器人手臂將生菜和肉放入麵包中。
但語言模型的能力有限,機器人最迫切需要的是一種能像 LLM 理解文字那樣理解物理世界的新型模型。為了建立這種模型,工程師需要海量數據。在智源走動時,我看到桌後坐著數十名工作人員。他們正在遠程操作各種機器人手臂和抓取器,教導算法完成簡單的操作任務,如掃桌上的豆子、將液體從壺中倒入不同的杯子,以及從架子上取貨。一名戴著虛擬實境頭盔的年輕人似乎正在泡茶,攝像頭記錄下了他的每一個動作。這個想法是,有了足夠的訓練數據,機器人就能在沒有特定訓練的情況下,憑直覺學會做各種事情。
問題在於,沒人確切知道什麼數據對機器人最有用,更不用說需要多少數據或如何收集數據最好了。而要讓人形機器人普及,人們需要發明能更好模擬人手的硬體。對機器人來說,做後空翻比彈硬幣要容易得多。

主要關節配備永磁同步馬達,提供高扭矩和快速加速度,使其能執行爆發性動作。
儘管如此,加州新創公司 Sunday Robotics 的共同創辦人兼 CEO Tony Zhao 告訴我,他擔心像他這樣的公司在面對中國企業時幾乎沒有勝算,因為中國企業可以僱用更多像智源那樣的遠程操作員來訓練機器人模型,並快速推出新硬體。「在迭代速度上,美國正在輸掉比賽,」他說,「老實說,我不知道我們該如何贏。」
為了跟上步伐,Zhao 最近從一家中國機器人公司挖來了一名高管,此人擁有深厚的人脈和開發中國龐大複雜供應鏈的經驗。「我們擊敗中國公司的唯一方法就是建立一支中國團隊,」他說。
包括 Google DeepMind 的 Demis Hassabis 和 Physical Intelligence 的 Lachy Groom 在內的一些美國 CEO(兩者都在追求機器人的 ChatGPT 時刻)曾告訴我,他們想像機器人的發展大致會模仿智慧型手機,即中國製造硬體,美國製造大腦。(只不過華為現在兩者都在做。)
Agility 的共同創辦人兼首席機器人官 Jonathan Hurst 建議,答案可能在於美國政府需要介入。他設想的措施包括對先進國內製造業進行大量投資,例如為在倉庫和工廠中使用機器人的公司提供稅收優惠,以此支撐國內機器人企業。這種策略可能會開始模仿中國政府對其產業的耐心資本投資。「我們必須在自動化方面非常聰明,」他說,「這是唯一的出路。」
我在北京中關村高科技園區住的酒店,並沒有在一些大城市酒店常見的、例行給客人送東西的輪式機器人。相反,我遇到了一位極其有禮貌的人類員工 Stephen。當我需要洗襯衫時,Stephen 在短短幾小時內就完成了任務。在旅程結束飛回家時,我思考著有多少雙手曾以如此快的速度清洗、熨燙、包裝並送回這件衣服。即使在中國,機器人也還沒有贏。
你有什麼看法?
請在下方評論區告訴我們你對本文的看法。或者,你可以致信編輯部:mail@wired.com。
相關文章
其他收藏 · 0