newsence
在家訓練人形機器人的零工經濟勞工

在家訓練人形機器人的零工經濟勞工

MIT Technology Review·4 天前

當住在尼日利亞山城的醫學生 Zeus 從醫院結束漫長的一天回到套房時,他打開環形燈,將 iPhone 綁在額頭上並開始錄製自己,他像夢遊者一樣緩慢移動雙手來鋪床,以確保動作留在鏡頭內。

當 Zeus 這位住在尼日利亞中部山頂城市的醫學生,結束在醫院漫長的一天回到他的套房公寓時,他打開環形補光燈,將 iPhone 綁在額頭上,開始記錄自己。他像夢遊者一樣在面前舉起雙手,並在床上鋪好床單。他動作緩慢且謹慎,以確保雙手始終保持在相機畫面內。

Zeus 是 Micro1 的數據記錄員。Micro1 是一家總部位於加州帕羅奧圖(Palo Alto)的美國公司,負責收集現實世界的數據並出售給機器人公司。隨著特斯拉(Tesla)、Figure AI 和 Agility Robotics 等公司競相開發人形機器人——即設計成外觀和動作都像人類,能在工廠和家庭中運作的機器人——由像 Zeus 這樣的零工經濟工作者拍攝的影片,正成為訓練機器人最熱門的新方式。

Micro1 已在包括印度、尼日利亞和阿根廷在內的 50 多個國家聘請了數千名合約工,這些地區有大量精通科技的年輕人正在尋找工作。他們將 iPhone 安裝在頭上,記錄自己摺衣服、洗碗和做飯。按當地標準衡量,這份工作薪水優渥,並正在提振地方經濟,但也引發了關於隱私和知情同意的棘手問題。而且,這項工作有時極具挑戰性——而且很怪異。

Zeus 在 11 月發現了這份工作,當時 LinkedIn 和 YouTube 上到處都在討論它。「這將是一個留下印記並提供數據的好機會,這些數據將用於訓練未來的機器人,」他想。

Zeus 的時薪為 15 美元,在失業率高企、經濟拮据的尼日利亞,這是一份不錯的收入。但作為一名夢想成為醫生的聰穎學生,他發現每天花幾個小時熨衣服非常乏味。

「我真的不怎麼喜歡它,」他說。「我是那種需要……一份需要思考的技術性工作的人。」

Zeus 以及所有接受《麻省理工科技評論》(MIT Technology Review)採訪的工作者都要求使用化名,因為他們未獲授權談論自己的工作。

人形機器人以難以製造著稱,因為操縱物理對象是一項難以掌握的技能。但 ChatGPT 等聊天機器人背後的大型語言模型的興起,激發了機器人領域的範式轉移。正如大型語言模型通過訓練從互聯網上抓取的海量文本來學習生成文字一樣,許多研究人員相信,人形機器人可以通過訓練海量的動作數據來學習與世界互動。

編者註:在最近的一項民意調查中,《麻省理工科技評論》的讀者將人形機器人選為我們 2026 年 10 大突破性技術 名單中的第 11 項突破。

然而,機器人技術需要關於物理世界更為複雜的數據,而這要難找得多。虛擬模擬可以訓練機器人表演雜技,但無法教會它們如何抓取和移動物體,因為模擬難以完美精確地模擬物理特性。為了讓機器人在工廠工作並擔任管家,現實世界的數據——無論收集起來多麼耗時耗力——可能正是我們所需要的。

投資者正瘋狂地投入資金來解決這一挑戰,2025 年在人形機器人上的支出超過 60 億美元。居家數據記錄正成為全球蓬勃發展的零工經濟。Scale AI 和 Encord 等數據公司正在招募自己的數據記錄員大軍,而 DoorDash 則付錢給外送員拍攝自己做家務的過程。在中國,數十個國有機器人訓練中心的工作人員戴著虛擬實境頭盔和外骨骼,教導人形機器人如何打開微波爐和擦桌子。

「需求量很大,而且增長非常快,」Micro1 的執行長 Ali Ansari 表示。他估計,機器人公司現在每年花費超過 1 億美元向他的公司及其他同類公司購買現實世界的數據。

生活的一天

Micro1 的工作人員由名為 Zara 的 AI 代理進行審核,它負責面試並審查家務影片樣本。每週,他們都會提交自己在自家做家務的影片,並遵循一系列指令,例如保持雙手可見以及以自然速度移動。影片由 AI 和人工共同審核,結果不是接受就是拒絕。隨後,影片由 AI 和一個由數百人組成的團隊進行標註,為片段中的動作貼上標籤。

「需求量很大,而且增長非常快。」

Ali Ansari,Micro1 執行長

由於這種訓練機器人的方法尚處於起步階段,目前還不清楚什麼才是好的訓練數據。儘管如此,「你需要提供大量的變體,才能讓機器人在基礎導航和世界操縱方面具備良好的泛化能力,」Ansari 說。

但許多工作者表示,在狹小的家中創造多樣化的「家務內容」是一項挑戰。住在簡陋套房裡的勤奮學生 Zeus,除了每天熨衣服外,很難記錄其他內容。印度德里的導師 Arjun 花了一個小時才拍出一段 15 分鐘的影片,因為他花了大量時間構思新的家務。

「家裡能拍出多少內容?到底能有多少內容?」他說。

還有棘手的隱私問題。Micro1 要求工作者不要在鏡頭前露臉,也不要透露姓名、電話號碼和出生日期等個人信息。然後,它使用 AI 和人工審核員來移除任何遺漏的信息。

但即使沒有臉部,影片也捕捉到了工作者生活的私密片段:家中的內部裝飾、財產、日常生活。要了解他們在鏡頭前忙於做家務時可能記錄下了什麼樣的個人信息,可能非常困難。對此類片段的審查可能無法過濾掉除了最明顯識別符之外的敏感信息。

對於有家庭的工作者來說,讓私生活遠離鏡頭是一場不斷的協商。身為兩個女兒父親的 Arjun,必須將他那兩歲愛搗蛋的孩子趕出畫面。「有時工作非常困難,因為我女兒還小,」他說。

Sasha 曾是一名銀行職員,後來轉行做數據記錄員。當她在尼日利亞一個共享住宅區的戶外晾衣服時,她總是躡手躡腳,以免拍到那些正困惑地看著她的鄰居。

「這需要的時間會比人們想像的更長。」

Ken Goldberg,加州大學柏克萊分校

雖然接受《麻省理工科技評論》採訪的工作者明白他們的數據被用於訓練機器人,但沒有人確切知道他們的數據將如何被使用、存儲以及與第三方(包括 Micro1 出售數據的機器人公司)共享。Ansari 表示,出於保密原因,Micro1 不會透露客戶名稱,也不會向工作者披露他們所貢獻項目的具體性質。

「重要的是,如果工作者參與其中,他們應該由公司告知其意圖……這種技術可能會走向何方,以及這可能對他們的長期產生什麼影響,」馬里蘭大學以人為本計算教授 Yasmine Kotturi 說。

偶爾,一些工作者說,他們看到其他工作者在公司的 Slack 頻道詢問公司是否可以刪除他們的數據。Micro1 拒絕對此類數據是否被刪除發表評論。

「人們是自願選擇做這件事的,」Ansari 說。「他們隨時可以停止工作。」

數據飢渴

由於數千名工作者在不同的家庭中以不同的方式做家務,一些機器人專家懷疑從他們那裡收集的數據是否足夠可靠,能安全地訓練機器人。

「從安全角度來看,我們在家庭中生活的方式並不總是正確的,」國際標準組織 ASTM International 的機器人專家 Aaron Prather 說。「如果那些人教導了可能導致事故的壞習慣,那這就不是好的數據。」而且,收集的數據量之大,使得質量控制審核變得極具挑戰性。但 Ansari 表示,公司會拒絕顯示不安全操作方式的影片,而笨拙的動作則可以用來教導機器人「不該做什麼」。

接下來的問題是我們需要多少這類數據。Micro1 表示它擁有數萬小時的素材,而 Scale AI 則宣佈它已收集了超過 10 萬小時。

「要達到目標還需要很長時間,」加州大學柏克萊分校的機器人專家 Ken Goldberg 說。大型語言模型是在人類需要 10 萬年才能讀完的文本和圖像上訓練出來的,而人形機器人可能需要更多的數據,因為控制機器人關節比生成文本更為複雜。「這需要的時間會比人們想像的更長,」他說。

當住在印度繁華科技中心的工程系學生 Dattu 在大學上完一整天的課回到家時,他顧不上吃晚飯,衝向他那擠滿了盆栽和啞鈴的小陽台。他將 iPhone 綁在額頭上,記錄自己一遍又一遍地摺疊同一套衣服。

他的家人疑惑地盯著他。「對他們來說,這就像某種太空科技,」他說。當他告訴朋友們他的工作時,「他們只是對『記錄家務就能領到薪水』這個想法感到震驚。」

在大學學業、數據記錄以及其他數據標註工作之間奔波,讓他感到疲憊。儘管如此,「感覺你正在做一些與全世界都不同的事情,」他說。

https://technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/