機器人應該是什么樣的?在科幻文學影視作品長年的熏陶影響下,社會大眾往往對人形機器人寄予了諸多幻想與預期,而當我們把這一問題拋給人形機器人領域的從業(yè)者時,得到的幾乎不約而同的答案卻是:人形機器人仍處在起步階段。
有目共睹,全球范圍內(nèi)的人形機器人熱潮仍在持續(xù)。8月8日,中國的機器人公司逐際動力宣布,其CL-1機器人繼習得上樓梯和跑步技能后,已能在模擬倉庫中完成一系列搬運任務。8月6日晚,美國初創(chuàng)企業(yè)Figure發(fā)布了新一代產(chǎn)品Figure02。而在一周之前,德國機器人公司Neura Robotics也更新旗下人形機器人4NE-1在多場景下的工作視頻。
世界上的人形機器人發(fā)展到何種程度了?機器人廠商都在做哪些技術研發(fā)與商業(yè)化探索?《中國經(jīng)營報》記者采訪了多名來自相關企業(yè)的人士,希望給社會公眾提供一個初步的解答與參考。
性能爭鋒
Figure02是Figure公司最新推出的第二代人形機器人產(chǎn)品,F(xiàn)igure公司創(chuàng)立于2022年,至今已完成5輪、總金額為8.54億美元的融資,估值達到26億美元,因投資方為微軟、OpenAI、英偉達、英特爾、亞馬遜創(chuàng)始人杰夫·貝索斯等而廣受業(yè)界的關注。該公司創(chuàng)始人兼CEO布雷特·艾德考克(Brett Adcock)宣稱,F(xiàn)igure02是目前“世界上最先進的AI硬件”,甚至其在社交媒體X上向特斯拉CEO埃隆·馬斯克“嗆聲”,稱“現(xiàn)在我們是老大了!”根據(jù)Figure官方公布的參數(shù),相比前一代,F(xiàn)igure02從外觀設計、軟硬件性能,到內(nèi)置AI模型都進行了明顯的升級。在OpenAI多模態(tài)大模型支持下,F(xiàn)igure02支持自然語言交互。
值得一提的是,特斯拉于2022年10月正式入局人形機器人賽道,推出了人形機器人Optimus(擎天柱),并在2023年12月推出了第二代Optimus Gen-2機器人。
記者梳理了包括Figure、特斯拉、波士頓動力、Neura Robotics、宇樹科技、逐際動力、優(yōu)必選、銀河通用等多家國內(nèi)外機器人產(chǎn)品及相關公開的性能參數(shù),綜合對比后發(fā)現(xiàn),各家在外觀形態(tài)、重量、負荷能力、電池續(xù)航、步行速度、主要應用場景、成本定價等各方面都不盡相同,在技術研發(fā)與主要性能方面也各不相同。不過總體來看,人們大致可以從靈巧性、空間感知交互能力、平衡穩(wěn)定性等幾個方面進行技術的積累與測試對比。這里需要說明的是,觀察大都基于各個機器人廠商官方公布的演示視頻,而演示視頻是否能夠與實際效果一致,暫時還無法一一甄別核實。
在平衡穩(wěn)定方面,在宇樹科技今年5月發(fā)布的人形機器人G1演示視頻中可以看到一名工程師從后方“猛踹”機器人的畫面。宇樹科技相關人士告訴記者,此項測試的目的在于利用強化學習的方式優(yōu)化機器人的運動控制程序,讓它在復雜環(huán)境或者有外力干擾的情況下保持平衡。與此同時,宇樹科技目前在技術研發(fā)方面的重點在于提升機器人的整體運動性能和智能化能力。
而靈巧性在一定程度上決定了機器人抓取任務的完成能力。銀河通用機器人創(chuàng)始人王鶴表示,該公司已合成了10億規(guī)模的靈巧手抓取數(shù)據(jù),能夠?qū)崿F(xiàn)對各種形態(tài)透明、高光材質(zhì)以及各種隨機堆疊物品的高穩(wěn)定抓取。最新面市的Figure02采用第四代靈巧手,擁有16個自由度;而特斯拉Optimus的這一數(shù)據(jù)為11個自由度,據(jù)馬斯克透露,今年新的Optimus將有22個自由度。
關于空間感知能力,比如機器人通過視覺感知系統(tǒng)獲取環(huán)境信息,滿足定位、跟蹤、分揀裝配等需求。在逐際動力的最新演示視頻中,CL-1能夠基于實時感知,在模擬倉庫中自主找到指定貨物,協(xié)同全身運動,實現(xiàn)負重深蹲、負重舉起等在內(nèi)的多種運動姿態(tài)下的搬運操作。
知名對沖基金Coatue在近日發(fā)布的《通往通用機器人之路》報告中指出,數(shù)據(jù)是機器人發(fā)展的核心瓶頸,圍繞快速積累機器人訓練數(shù)據(jù),近年來陸續(xù)形成了四種路徑:一是遠程操作,即由實驗人員操作機械手柄,遠程控制機器人做出相同動作;二是研究人員通過增強現(xiàn)實(AR)技術讓人機交互過程具備更強的解釋性;三是通過海量算力進行模擬運算,計算得出海量訓練數(shù)據(jù)集; 四是通過多模態(tài)大模型,直接讓機器人通過視頻學習人類動作,從而積累數(shù)據(jù)。記者從業(yè)內(nèi)了解到,這四種路徑各有優(yōu)劣利弊,不同企業(yè)也選擇了不同路線在探索實踐,甚至也存在融合交叉,目前還并沒有所謂的勝敗之分。
場景探索
“競賽已經(jīng)開始,包括Figure、特斯拉等數(shù)十種新型人形機器人正在開發(fā)中,以突破機器人的通用性!薄锻ㄍㄓ脵C器人之路》報告稱,單一用途的機器人已經(jīng)存在50多年,然而工業(yè)和消費機器人歷來以線性速度增長,尚未實現(xiàn)指數(shù)級普及。盡管有炫目的演示,但機器人項目在不同環(huán)境和成本方面仍面臨挑戰(zhàn)。與數(shù)字世界中的其他模式不同,機器人技術嚴重受限于高質(zhì)量的訓練數(shù)據(jù),這是實現(xiàn)通用智能的主要限制因素。幸運的是,過去幾年的開放研究加速了生成大量可擴展訓練數(shù)據(jù)的進程。與此同時,隨著硬件變得更加實惠,投入成本持續(xù)下降。
值得一提的是,早在2013年就涉足人形機器人領域的老牌廠商波士頓動力,在2024年4月17日宣布停產(chǎn)液壓動力的Atlas,全面轉向全電動路線。顯然,“老將”“新秀”將共同在人形機器人賽道上角逐。
從演示視頻來看,人形機器人測試的場景已覆蓋制造工廠、商業(yè)零售、農(nóng)業(yè)、家庭、科研等多個領域。其中,F(xiàn)igure02、Optimus-Gen2、優(yōu)必選Walker S Lite等紛紛進入汽車制造工廠中。早在今年1月,F(xiàn)igure就與寶馬簽署商業(yè)協(xié)議,F(xiàn)igure機器人在寶馬工廠中“自動執(zhí)行困難、不安全且乏味的任務”。今年5月,特斯拉官方的視頻顯示,Optimus Gen-2已進入自家的汽車工廠“打工”,在特斯拉電池工廠學會了分裝電池。優(yōu)必選Walker S Lite自7月初進入吉利控股集團旗下極氪5G智慧工廠“實訓”,在CTU入庫上料工位協(xié)同員工執(zhí)行搬運任務。今年7月,Neura Robotics則在演示視頻中展示了燙衣服、切蔬菜水果、擺盤、整理物品、鈑金焊接、工具箱搬運等任務。銀河通用相關負責人向記者透露,近期計劃聯(lián)合美團在無人藥店、商超等場景中部署機器人,“盡快地在線下幫助人類干活兒”。
值得注意的是,據(jù)記者不完全統(tǒng)計及采訪,已經(jīng)有幾家機器人企業(yè)公開提出了人形機器人產(chǎn)品的量產(chǎn)時間表。布雷特·艾德考克公開表示,F(xiàn)igure公司將推動人形機器人的低成本、高效率制造,2025年開始批量生產(chǎn)。波士頓動力方面則透露,全電動的Atlas機器人將于明年年初在現(xiàn)代汽車內(nèi)部進行測試,并在未來幾年內(nèi)全面投產(chǎn)。2023年2月創(chuàng)立的智元機器人方面也提出,其人形機器人“遠征”在今年內(nèi)實現(xiàn)商業(yè)化。銀河通用機器人將批量生產(chǎn)的時間計劃定于2026年。由清華大學交叉信息研究院孵化的星動紀元在今年將面向科研教育市場的“小星”第6代產(chǎn)品實現(xiàn)批量出貨。而宇樹科技人形機器人產(chǎn)品已在國內(nèi)外科研機構、高等院校等獲得采購訂單,其G1憑借9.9萬元人民幣(海外市場1.6萬美元)的價格優(yōu)勢已贏得了業(yè)界的高度關注。
數(shù)位業(yè)內(nèi)人士在接受記者采訪時,對人形機器人的觀點不盡相同,但大多看好未來的技術突破與市場潛力。不過他們認為短期內(nèi)不應當對人形機器人抱有過分的樂觀期望,因為其整體仍在起步階段,各家都在努力投入與加速研發(fā)中。與此同時,得益于大模型技術突破、資本助力支持,人形機器人的發(fā)展正在駛入快車道,從長遠來看也不應當持過度的悲觀看法。
按照Coatue報告的調(diào)研分析,機器人的普及會經(jīng)歷由淺入深的三個階段,走出一條獨特的發(fā)展路徑。第一階段是,人們通過電影、小說等媒介對機器人形成初步模糊的了解;第二階段,指消費者直接享受機器人提供的服務,而非自己擁有機器人,類似B2B2C的模式,比如消費者在咖啡廳享用一杯機器人拉花的咖啡,就屬于這個階段;第三階段則是每個用戶自己擁有一臺或多臺機器人。
本報記者 曲忠芳 北京報道