人形機器人數據：AI 訓練的新前沿

MIT Technology Review·大約 4 小時前

我最近受邀加入一個應用程式，透過拍攝自己做家務的影片來賺取加密貨幣，這反映出機器人公司正押注於人類動作數據，試圖將大型語言模型的縮放定律應用於開發更靈活的人形機器人。

最近，我受邀加入一款應用程式，只要拍攝自己完成特定任務（例如將食物放入碗中、微波，然後取出）的影片，就能獲得加密貨幣作為報酬。另一個網站則建議我嘗試一款新遊戲，讓我遠端控制位於中國深圳的機械手臂完成拼圖和任務，以協助提升機器人的靈巧度。

這究竟是怎麼回事？就像我們的文字成為了大型語言模型的訓練數據一樣，機器人公司正押注於人類動作的數據，認為這將有助於他們打造出更強大的類人機器人（humanoid robots）。他們認為，儘管類人機器人的訓練比簡單的機械手臂更困難，但它們更容易融入人類現有的工作場所（並在未來某天完全取代人類）。

這種訓練類人機器人的新觀念，可以說始於 2022 年 ChatGPT 的發布。大型語言模型能夠透過接觸海量的訓練數據——即人工智慧公司所能找到（或者有人認為是偷來）的每一篇文字——來生成文本。機器人專家希望將這些縮放定律（scaling laws）應用於機器人領域，但卻缺乏像網際網路規模般龐大、描述人類如何移動的數據集。

由於收集這些數據極其困難，各家公司曾採取折衷方案，例如在虛擬模擬環境中教導機器人移動。然而，模擬環境永遠無法完美模擬現實世界中的摩擦力或彈性等因素，因此在其中訓練的機器人往往會（字面意義上的）跌跌撞撞。

現在，開發類人機器人的公司已經認定，儘管收集現實世界的數據非常繁瑣，但其回報可能極其巨大。事情也因此開始變得詭異。

早期的嘗試既古怪又帶有學術色彩。實驗室收集了人們在佩戴攝影機或手持抓取器時，執行翻轉鬆餅或清理桌面等家務活動的數小時數據。這些數據是公開分享的。但隨著風險投資湧入機器人領域——僅 2025 年類人機器人領域就獲得了 61 億美元——創造這些訓練數據的競爭變得更加激烈且更加複雜。

現在中國設有訓練中心，工人們穿戴外骨骼和虛擬實境設備，每天重複數百次相同的動作，例如擦桌子。奈及利亞、阿根廷和印度的零工勞工正拍攝自己在家做家事的影片。今年早些時候，我得知美國一家快遞公司為員工配備了感測器，追蹤他們搬運箱子時的動作，部分是為了研究職業傷害，但也是為了訓練未來可能取代他們的機器人。

這一切都指向一個超現實的工作未來：體力勞動者正日益成為數據收集者。但利用我們收集的動作數據來訓練機器人，仍然是一個複雜的命題。目前尚不清楚是否能以實現技術突破所需的規模來進行數據收集，更不用說建立一個獲利的商業模式了。

我打開微波爐的一段影片價值多少？需要幾萬個這樣的瞬間才能教會機器人做晚餐？也許今年我們就會找到答案。

— MIT Technology Review

其他收藏 · 0

你的個人知識庫

人形機器人數據：AI 訓練的新前沿