界面新聞記者 |周姝祺
具身智能行業(yè)可能是當下最熱門的投資賽道。據界面新聞統(tǒng)計,從7月7日至7月9日,三天時間里共有六家具身智能初創(chuàng)公司披露完成了新一輪融資。截至7月10日,2025年具身智能融資事件超過120起,涉及資金規(guī)模約173億元,均已超過2024年全年數(shù)據。
曾在今年3月創(chuàng)下中國具身智能行業(yè)天使輪最大融資額紀錄的它石智航,再度拿下一筆1.22億美元的天使+輪投資。這家企業(yè)核心成員來自華為和百度,創(chuàng)始人陳亦倫過去被視為華為智能輔助駕駛研發(fā)團隊的靈魂人物。
星動紀元、深庭紀智能科技、云深處科技、小雨制造和星海圖等五家具身機器人初創(chuàng)企業(yè)也均完成不同規(guī)模的融資。參與此輪布局的,不乏美團、滴滴、百度、IDG資本、均山資本、亦莊國投、國新基金等各類知名投資機構。
擁有高瓴創(chuàng)投、紅杉中國和上汽創(chuàng)投等多家資方加持的智元機器人,還有望成為在科創(chuàng)板上市的首家具身智能企業(yè)。上市公司上緯新材公告稱,智元機器人將至少收購其63.62%的股份,與其管理團隊共同控股。不過,智元機器人隨后否認了此舉意在借殼上市。
具身智能的通俗理解是,機器人能夠在物理世界自主地感知環(huán)境,做出決策并執(zhí)行動作。人形機器人是行業(yè)典型代表之一,也是各家企業(yè)追逐的研發(fā)方向。宇樹科技人形機器人在今年央視蛇年春晚表演的舞蹈,將這一概念從實驗室走向了大眾視野。
風險投資人被人形機器人極具想象力的未來打動,他們將其視同于10年前自動駕駛的風口,正處于技術躍遷的關鍵節(jié)點,是人工智能與物理世界結合的終極形態(tài)載體。瑞銀證券發(fā)布報告稱,2035年全球人形機器人數(shù)量將超過200萬臺,到2050年超過3億臺,潛在市場空間高達1.4至1.7萬億美元。
有志于搶占未來人機交互核心入口的汽車公司同樣不愿錯過這一賽道。人形機器人與智能電動汽車技術同源,做決策的“大腦”可復用智能輔助駕駛系統(tǒng)的大模型能力。與此同時,汽車制造與機器人生產的供應鏈重疊度較高,汽車公司能夠降低人形機器人成本和加速規(guī)模量產。
界面新聞注意到,比亞迪、長安、廣汽、奇瑞、小鵬、蔚來、理想以及小米等超過10家汽車公司已涉足具身智能領域。今年上海車展上,部分企業(yè)還開始用人形機器人當車模,吸引消費者看車和強化品牌科技智能形象。
一位要求匿名的汽車企業(yè)高管向界面新聞透露,2026至2028年將是人形機器人產業(yè)變革速度最快的三年,且2026年的發(fā)展進度或與2014年中國新能源汽車行業(yè)元年的水平相當。并且,人形機器人在相同發(fā)展階段的進步速度還可能快于新能源汽車行業(yè)。
但他同時指出,大多數(shù)從業(yè)者低估了人形機器人的復雜性和量產難度。它屬于軟硬件強耦合系統(tǒng),一個軟件功能的變動將牽扯到看似或與其無關的硬件大調整。現(xiàn)在售賣的人形機器人多只提供情緒價值,而真正具備人工智能能力的人形機器人最快還要一年的時間才會出現(xiàn)。
“人形機器人跳過了集成研發(fā)(供應商拼裝)和全棧研發(fā)(單項功能自研)兩大階段,直接進入全域研發(fā)的階段,要求企業(yè)具備軟硬件協(xié)同能力?!边@位參與機器人研發(fā)生產的高管說,只做生成式大模型的初創(chuàng)公司,或者不具備人工智能開發(fā)能力的汽車制造商,可能都很難成功。
瑞銀證券用“電動汽車時刻”定義為電動汽車技術瓶頸得到解決,且銷量在5年內從100萬臺增長至1000萬臺的時刻。由于軟硬件技術、制造成本、商業(yè)應用場景以及法律監(jiān)管等多重障礙,該投資銀行認為,人形機器人的“電動汽車時刻”可能要到2030年之后才會出現(xiàn)。
“人形機器人最大的技術制約瓶頸是智能化的‘大腦’。”瑞銀證券中國機械行業(yè)分析師王斐麗接受界面新聞等媒體采訪表示,“目前沒有看到成熟的用于大腦訓練的人工智能通用大模型,另外訓練模型的數(shù)據集也較為受限?!?/p>
參照自動駕駛等級分類標準(L0-L5),瑞銀證券報告指出,當前人形機器人的智能化水平還停留在L0-L1的初級階段,執(zhí)行大多數(shù)任務依賴人工操作或預編程。
特斯拉是人形機器人領域進展最受矚目的公司之一,其自研的人形機器人Optimus在去年10月“We Robot”發(fā)布會上,展示了倒酒,回答問題和石頭剪刀布等復雜交互能力。但后被證實,這些動作多由工程師遠程幕后控制完成。
一位人形機器人研發(fā)工程師向界面新聞指出,比如“讓機器人到廚房取個勺子”這句簡單指令,就能難倒大部分公司。它要人形機器人聽到這句話,成功判斷意圖,知道廚房位置,準確找到勺子,穩(wěn)定行走,抬手并抓住勺子,涉及多模態(tài)感知融合、空間建圖與導航、全身運動控制等多技術模塊。
不過,隨著VLM(視覺語言模型)、VLA(視覺語言動作模型)等端到端大模型技術的演進,人形機器人得以將感知、決策、執(zhí)行集成至統(tǒng)一框架,開始朝著L2階段發(fā)展,即能在標準場景中部分自主地完成單個任務。
人形機器人初創(chuàng)公司千尋智能的首席科學家高陽認為,VLA模型先從視覺和語言中抽取信息,再將兩者融合,最后與動作模塊進行進一步整合。這樣的設計有兩個顯著優(yōu)勢:一是信息以數(shù)學語言的形式傳遞,更加高效和精確;二是具備良好的預訓練能力,便于大規(guī)模數(shù)據學習與遷移。
目前VLA模型還處在極早期的技術驗證階段,尚未有企業(yè)能讓機器人具備足夠的泛化性完成大量通用任務,并且還做到足夠穩(wěn)定。一位自動駕駛研發(fā)人員向界面新聞指出,VLA模型上限高,下限也很低,它需要大量高質量的數(shù)據訓練才能發(fā)揮模型效用。
界面新聞了解到,具身智能行業(yè)的數(shù)據來源主要包括真機數(shù)據、仿真數(shù)據以及互聯(lián)網數(shù)據。其中,真機數(shù)據是通過遙控或輔助機器人進行任務操作而采集到的數(shù)據,也被稱為“遙操”數(shù)據,采集成本高,但訓練價值大;而仿真數(shù)據依賴算法生成,規(guī)模大卻容易出現(xiàn)幻覺。
上述汽車企業(yè)高管告訴界面新聞,參考智能輔助駕駛系統(tǒng)工程落地的實踐經驗,現(xiàn)階段其人形機器人的訓練數(shù)據主要依靠真機數(shù)據,小部分采用仿真數(shù)據。在他看來,真機數(shù)據最大價值是將物理世界發(fā)生頻率極低但產生較大影響的長尾場景集合起來訓練,能極大提升模型的安全性和技術能力。
王斐麗則向界面新聞等媒體表示,自動駕駛領域發(fā)展時間早,搜集數(shù)據時間長,其訓練數(shù)據規(guī)??赡芤呀洺霈F(xiàn)冗余,但人形機器人訓練數(shù)據集的廣度、寬度都非常有限,“所有可利用的數(shù)據都很重要,沒有主次之分。”
人形機器人不光大腦要好,身體也要足夠靈活,這其中最重要的零部件是執(zhí)行器。它相當于人形機器人的“肌肉”,直接決定了機器人能不能運動,怎么運動,持續(xù)時間多久以及運動多么類人。
執(zhí)行器的組成包括電機(驅動裝置)、減速器(傳動裝置)、編碼器(傳感裝置)、控制板和控制軟件(控制裝置)等。在接收到“大腦”傳遞的動作指令后,執(zhí)行器里的電機開始運轉,經減速器把速度放慢,增大扭矩,以此帶動軸承開始運動。編碼器和力矩傳感器分別監(jiān)測動了多少度和用了多大力氣,將運動反饋轉變?yōu)殡娦盘栐賯鬟f至大腦,進行隨時調整。
早期人形機器人公司使用響應快、易調試的旋轉式執(zhí)行器方案,能快速實現(xiàn)簡單行走。但是,該方案功耗高,也沒有辦法讓機器人負重干活,直到特斯拉Optimus推出行星滾柱絲杠方案,提高了推力和能效,才帶動行業(yè)向混合式執(zhí)行器發(fā)展演變。
人形機器人初創(chuàng)公司開普勒已經切換為行星滾柱絲杠方案,然而過程并不容易。 CEO胡德波提到,國內供應鏈沒有行星滾柱絲杠的制造基礎,工業(yè)級部件難以直接用于人形機器人;并且,將行星滾柱絲杠、電機、編碼器、傳感器等復雜機電系統(tǒng)集成,做出穩(wěn)定可靠的解決方案,也是全新嘗試。
想要機器人穩(wěn)定執(zhí)行更加精細化的動作,還需要一雙精準的靈巧手和穩(wěn)健的仿生腳,這依靠先進的傳感器技術研發(fā),即使是特斯拉,也還沒有得出滿意的設計方案。
從商業(yè)化落地角度看,人形機器人則面臨高企的制造成本與尚未明確的客戶群體兩大挑戰(zhàn)。以特斯拉最新一代Optimus為例,科技媒體晚點報道稱,其造價約為6萬美元,實際成本可能要更高。
依據瑞銀證券估算,人形機器人執(zhí)行器中的絲杠和力矩傳感器是兩個最大的成本項目,分別占總物料成本的14%和27%;其次是減速器和電機,均占總物料成本的8%。半導體芯片由于產業(yè)較為成熟,僅約占1%至2%,但也需要約1400美元。
一位業(yè)內人士向界面新聞指出,當前人形機器人的供應鏈還不完備,部分零部件還需要企業(yè)自主研發(fā)生產。前期量產規(guī)模的不足,導致單位成本高企,無法產生經濟效益,同時品質還不夠穩(wěn)定。“很多公司人形機器人都是靠手搓,而不是工業(yè)化流水線量產?!?/p>
部分機構投資人對人形機器人的商業(yè)前景已經失去耐心。金沙江創(chuàng)投即已從星海圖和松延動力兩家具身智能公司退出,其管理合伙人朱嘯虎認為,人形機器人當前最主要的市場需求是做研究以及前臺展示,并不能夠為客戶創(chuàng)造可持續(xù)的價值。
“現(xiàn)在人形機器人就會翻跟頭,但商業(yè)化在哪里?我問這幾個CEO,感覺他們都是自己想象出來的客戶,誰會花十幾萬買一個機器人去干這些活?”
一位具身智能初創(chuàng)公司的員工向界面新聞表示對朱嘯虎觀點的認同?!拔覀兊娜诵螜C器人連翻跟頭都還不會,也沒找到清晰的應用場景,甚至現(xiàn)階段行業(yè)對是否開發(fā)人形也都有爭議?!?/p>
瑞銀證券認為,人形機器人或將率先從有長期自動化經驗且盈利能力相對較高的制造業(yè)開始,包括汽車、電氣設備、電信設備、食品飲料以及化工和纖維行業(yè),隨后憑借人形機器人均價下降和規(guī)模效應,逐步進入到服務業(yè),最終進入家庭。
今年已有多家人形機器人公司拿下汽車廠訂單。優(yōu)必選與東風柳汽、一汽大眾、比亞迪等十余家企業(yè)達成合作,獲得了車廠超500臺訂單;樂聚機器人向北汽越野車交付了第100臺全尺寸人形機器人;智元機器人、智平方、傅里葉等公司同樣和汽車廠達成合作。
“在汽車組裝的物體搬運場景,尤其是“最后10米”任務,是人形機器人的切入口?!蓖蹯雏惛嬖V界面新聞,“一方面該工作場景里還沒有實現(xiàn)完全自動化,需要依賴勞動力;另一方面,這個場景比較簡單,對工廠效率影響較小,符合人形機器人目前的功能邊界。”
在相當長一段時間里,人形機器人或都仍將處于高商業(yè)估值區(qū)間,為眾多初創(chuàng)企業(yè)帶來熱錢和技術突破的機遇。但當潮水退去,唯有率先向消費者提供可負擔的產品,并持續(xù)創(chuàng)造不可替代價值的玩家,才能經受住商業(yè)檢驗,成長為人形機器人資本泡沫里,真正跑出來的大公司。