
北京時間11月3日,《商業(yè)內(nèi)幕》周末發(fā)文,披露了特斯拉的人形機器人實驗室,讓外界得以一窺特斯拉是如何把Optimus訓練得像人一樣的。
在特斯拉工程總部一間玻璃圍墻實驗室里,數(shù)十名員工正在模擬日常生活動作:舉起杯子、擦拭桌面、拉開窗簾。
他們在八小時輪班中要重復每個動作數(shù)百次,頭盔與厚重背包上安裝的五臺攝像機會全程記錄工作過程。特斯拉CEO埃隆·馬斯克(Elon Musk)偶爾會駐足觀看。特斯拉的投資者們也定期前來觀看演示。
“這種感覺就像‘顯微鏡下的小白鼠’?!币幻皢T工對《商業(yè)內(nèi)幕》表示。
這些員工的目標很簡單:教會特斯拉人形機器人Optimus如何像人類一樣活動。
馬斯克已將Optimus視為公司業(yè)務(wù)的關(guān)鍵組成部分。在特斯拉第三季度財報電話會議上,馬斯克表示,這款機器人“有望成為有史以來最大的產(chǎn)品”,并稱公司最終每年將生產(chǎn)100萬臺。他還預測,Optimus未來可能占到特斯拉企業(yè)估值的大約80%。
特斯拉計劃讓Optimus執(zhí)行各種任務(wù),包括工廠工作、家務(wù)以及護理工作。上述“數(shù)據(jù)收集操作員”的工作就是為Optimus替代人力勞動鋪路。
《商業(yè)內(nèi)幕》采訪了五名現(xiàn)任和前任員工,了解Optimus的訓練過程。他們表示,這份工作對體力要求高,有時看著可笑,但始終需要一絲不茍。員工需要完成沖刺、下蹲、跳舞。有員工透露,如果動作被判定“不夠擬人化”,還會被要求糾正改進。
特斯拉只是眾多嘗試在機器人身上復制復雜人類行為的科技公司之一,其他公司還有Figure和1X。像AI產(chǎn)業(yè)的許多其他項目一樣,它的最終目標可能是實現(xiàn)自主化,但眼下正是由血肉之軀的人類勞動者大軍,支撐著那些光鮮的演示場景與宏大的承諾藍圖。
教嬰兒
對于數(shù)據(jù)收集操作員來說,訓練機器人學會人類動作這份工作并不光鮮。
大多數(shù)數(shù)據(jù)收集員一開始只是擦桌子,有時要連續(xù)做好幾周。一名前員工說:“你走一步,擦桌子,然后復位,再重復一遍。”整個過程就是“反復循環(huán),直到休息時間”。
三名員工透露,他們會收到詳細的任務(wù)執(zhí)行規(guī)范,并遵循一本不斷增補的厚實操作手冊。五名員工表示,每名員工都配有搭檔,確保每個動作精準無誤。
“特斯拉對操作規(guī)范要求極為嚴苛,”一名員工坦言,“這對身心都是巨大考驗?!?/p>
在數(shù)據(jù)采集啟動初期,員工主要依靠動作捕捉服遠程操控機器人,通過人工動作完成教學。據(jù)《商業(yè)內(nèi)幕》此前報道,隨著項目總監(jiān)米蘭·科瓦奇(Milan Kovac)的離職,特斯拉在6月通知員工將轉(zhuǎn)變采集方式,逐步淘汰動作捕捉服與遠程操控,轉(zhuǎn)向純視覺數(shù)據(jù)采集。

馬斯克
員工表示,自己佩戴的多角度攝像頭能精準定位他們在環(huán)境中的行動軌跡。團隊被告知,摒棄動作捕捉服將有助于快速擴展數(shù)據(jù)采集規(guī)模。
三名員工證實,自6月改變收集方式以來,公司已引入多項新型訓練流程,包括在員工執(zhí)行任務(wù)時布置多機位進行全景采集。
謝菲爾德大學機器人技術(shù)專家喬納森·艾特肯(Jonathan Aitke)對《商業(yè)內(nèi)幕》表示,這些攝像頭陣列陣能通過提供更廣闊的環(huán)境視角來補充數(shù)據(jù)采集。
據(jù)三名員工透露,工作人員有時會配備觸覺手套,用以追蹤手部的精細動作。馬斯克曾表示,特斯拉已投入大量精力為Optimus研發(fā)仿生手部,并稱這是“極其困難的工程挑戰(zhàn)”。
三名員工稱,員工還會錄制彼此模仿動作的影像。兩名員工透露,在特斯拉位于加州弗里蒙特的工廠里,數(shù)據(jù)采集員曾頭戴傳感設(shè)備、身負背包,執(zhí)行整理汽車零部件和在傳送帶旁作業(yè)等任務(wù)。接受采訪的專家表示,為同一任務(wù)采集多樣化數(shù)據(jù)點,將有效促進機器人的訓練進程。
某些任務(wù)則簡單得被前員工形容為“教嬰兒”。兩名數(shù)據(jù)采集員稱,他們曾錄制自己操作真實嬰幼兒啟智玩具的過程:按尺寸和顏色套圈圈,或?qū)⒎e木放入對應(yīng)形狀的凹槽中。
三名員工表示,特斯拉還開始使用AI生成的提示來訓練機器人。在某些訓練環(huán)節(jié)中,工作人員通過頭顯接收到一系列AI生成的提示,該頭顯通過電線與30到40磅重的背包相連。雖然他們通常佩戴背包,但有時背包會放在旁邊的椅子或桌子上。
員工們表示,訓練動作包括深蹲、跳小雞舞、模仿大猩猩、模擬使用吸塵器、沖刺幾碼、模擬打高爾夫球以及跳電臀舞等。據(jù)透露,每個動作都需在3到5秒內(nèi)完成。有兩名員工回憶稱,部分任務(wù)令人感到不適,比如AI曾要求他們四肢著地爬行或脫去一件衣物。
艾特肯指出,這些看似隨機的訓練內(nèi)容實際上有助于特斯拉明確需要改進的技術(shù)短板。
“若不對各種可能性進行測試,又如何能確信自己已經(jīng)涵蓋了機器人所需掌握的全部技能范圍?”他反問道。
身體傷害
四名員工表示,這份工作會對身體造成損傷。一名前員工形容稱,這幾乎是“整天在做有氧運動”。
一名前員工透露,自己在訓練機器人時背部受傷。由于背包重量不均,他們感覺自己像是“在一瘸一拐地走路”。因此,他們不得不請病假。
“我右腿失去知覺,背部劇烈疼痛?!彼麄冋f。
員工還表示,他們曾看到同事因為這項工作的性質(zhì)而造成背部和頸部受傷。
一些員工在涉及動作捕捉服與虛擬現(xiàn)實頭盔的遠程操控環(huán)節(jié),出現(xiàn)了不適。三名員工表示,圖像清晰度欠佳加之長時間佩戴設(shè)備,引發(fā)了強烈的暈動癥。尤其當機器人突然傾倒時,視覺與體感的錯位會令人產(chǎn)生嚴重的迷失感。
“明明自己站得筆直,但透過機器人視角看到的卻是天旋地轉(zhuǎn)的墜落景象。”一名員工這樣描述道。
表演
目前,遠程操控演示主要保留給投資者參觀環(huán)節(jié)。
“投資者希望看到機器人流暢運作的場景,”一位前員工透露,“當我們穿上動作捕捉服操控時,機器人的動作會顯得更流暢?!?/p>
兩名前員工表示,馬斯克有時會帶著他5歲的兒子X陪同投資者觀看機器人演示。其中一位前員工將這類演示比作“精心編排的舞臺劇”。
“整個過程就像劇場表演?!边@位前員工感慨道。
兩名員工表示,機器人在執(zhí)行需要彎腰或傾斜的任務(wù)時,有一半時間會跌倒,有時還會損壞昂貴設(shè)備。三名員工表示,除非機器人執(zhí)行需要移動幾英尺以上的任務(wù),否則通常會被固定在支架,后者是一種幫助機器人保持直立的支撐裝置。
艾特肯表示,在特斯拉辦公室這種可控環(huán)境下,機器人應(yīng)能輕松保持直立?!白寵C器人站穩(wěn)并維持平衡應(yīng)該是技術(shù)開發(fā)最基礎(chǔ)的環(huán)節(jié)?!彼麖娬{(diào)。
馬斯克在特斯拉近期的財報電話會議上表示,Optimus在公司工程總部全天候待命,不僅能自由行走于辦公區(qū)域,還能引導訪客前往會議室。
功夫和糖塊只是表象
三名員工稱,數(shù)據(jù)采集團隊規(guī)模一度超過百人。但在9月份的半年度績效評估后,特斯拉裁撤了數(shù)十名數(shù)據(jù)采集員。
五名員工表示,他們的工作表現(xiàn)會通過量化評分體系進行評估,從身體角度到位置定位等所有細節(jié)都會收到反饋。數(shù)據(jù)采集員可通過在線儀表盤查看基于數(shù)據(jù)質(zhì)量和數(shù)量的評級結(jié)果。根據(jù)五名受訪者的說法,每人每班次需采集至少四小時合格視頻素材,若因定位偏差等問題導致素材不達標,將面臨相應(yīng)處罰。

Optimus發(fā)糖
然而,對于負責訓練機器人的員工而言,Optimus的績效評估標準卻顯得模糊。在主要依賴遠程操控的訓練階段,操作員可通過按鈕測試機器人執(zhí)行任務(wù)的能力。三名員工表示,成功率并不理想。如今這類評估日益減少,員工們對機器人的進展缺乏清晰認知。
在特斯拉發(fā)布的視頻中,Optimus可以走路、疊衣服、在《創(chuàng):戰(zhàn)神》首映式上表演功夫動作,以及在時代廣場派發(fā)糖果。
俄勒岡州立大學AI與機器人專家艾倫·弗恩(Alan Fern)對《商業(yè)內(nèi)幕》指出:“機器人演示永遠是他們能展示給你的最完美版本?!?/p>
“當你看到它表演武術(shù)這類展示時,看似展現(xiàn)了智能行為,但這會誤導人們高估其實際能力,”弗恩解釋道,“那只是機器人對環(huán)境做出的條件反射,背后并不存在真正的認知思維。”
與此同時,馬斯克繼續(xù)宣傳其宏大的愿景。他在10月對投資者表示:“Optimus甚至不會看起來像一臺機器人,更像是穿著機器人外殼的人類?!?/p>
目前,Optimus仍在通過重復、試錯以及無數(shù)小時的人力勞動進行學習。

