人形機器人數據:AI 訓練的新前沿
我最近受邀加入一個應用程式,透過拍攝自己做家務的影片來賺取加密貨幣,這反映出機器人公司正押注於人類動作數據,試圖將大型語言模型的縮放定律應用於開發更靈活的人形機器人。
最近,我受邀加入一款應用程式,只要拍攝自己完成特定任務(例如將食物放入碗中、微波,然後取出)的影片,就能獲得加密貨幣作為報酬。另一個網站則建議我嘗試一款新遊戲,讓我遠端控制位於中國深圳的機械手臂完成拼圖和任務,以協助提升機器人的靈巧度。
這究竟是怎麼回事?就像我們的文字成為了大型語言模型的訓練數據一樣,機器人公司正押注於人類動作的數據,認為這將有助於他們打造出更強大的類人機器人(humanoid robots)。他們認為,儘管類人機器人的訓練比簡單的機械手臂更困難,但它們更容易融入人類現有的工作場所(並在未來某天完全取代人類)。
這種訓練類人機器人的新觀念,可以說始於 2022 年 ChatGPT 的發布。大型語言模型能夠透過接觸海量的訓練數據——即人工智慧公司所能找到(或者有人認為是偷來)的每一篇文字——來生成文本。機器人專家希望將這些縮放定律(scaling laws)應用於機器人領域,但卻缺乏像網際網路規模般龐大、描述人類如何移動的數據集。
由於收集這些數據極其困難,各家公司曾採取折衷方案,例如在虛擬模擬環境中教導機器人移動。然而,模擬環境永遠無法完美模擬現實世界中的摩擦力或彈性等因素,因此在其中訓練的機器人往往會(字面意義上的)跌跌撞撞。
現在,開發類人機器人的公司已經認定,儘管收集現實世界的數據非常繁瑣,但其回報可能極其巨大。事情也因此開始變得詭異。
早期的嘗試既古怪又帶有學術色彩。實驗室收集了人們在佩戴攝影機或手持抓取器時,執行翻轉鬆餅或清理桌面等家務活動的數小時數據。這些數據是公開分享的。但隨著風險投資湧入機器人領域——僅 2025 年類人機器人領域就獲得了 61 億美元——創造這些訓練數據的競爭變得更加激烈且更加複雜。
現在中國設有訓練中心,工人們穿戴外骨骼和虛擬實境設備,每天重複數百次相同的動作,例如擦桌子。奈及利亞、阿根廷和印度的零工勞工正拍攝自己在家做家事的影片。今年早些時候,我得知美國一家快遞公司為員工配備了感測器,追蹤他們搬運箱子時的動作,部分是為了研究職業傷害,但也是為了訓練未來可能取代他們的機器人。
這一切都指向一個超現實的工作未來:體力勞動者正日益成為數據收集者。但利用我們收集的動作數據來訓練機器人,仍然是一個複雜的命題。目前尚不清楚是否能以實現技術突破所需的規模來進行數據收集,更不用說建立一個獲利的商業模式了。
我打開微波爐的一段影片價值多少?需要幾萬個這樣的瞬間才能教會機器人做晚餐?也許今年我們就會找到答案。
相關文章
其他收藏 · 0