亚洲熟女少妇精品,无码精品一区二区免费式,国产成本人片免费av,中文无码电影2020

理想汽車的VLA“長征”

2025-08-12 17:53

在理想i8發(fā)布會(huì)舉行之前,理想汽車董事長兼CEO李想與前同事、維他動(dòng)力聯(lián)合創(chuàng)始人趙哲倫分享了自己關(guān)于“選擇”的長期主義哲學(xué)。

“要選‘長’的,這件事情最好要很長時(shí)間才能成功,如果是個(gè)很短時(shí)間就能成功的,就意味著所有人都能成功,反而沒什么壁壘。選‘長’的,跟時(shí)間做朋友,就有耐心了?!崩钕胝f。

當(dāng)晚,外界都以為理想i8是唯一主角。但這是一場(chǎng)有雙主角的發(fā)布會(huì),李想在現(xiàn)場(chǎng)宣布,理想VLA司機(jī)大模型將隨理想i8一同交付。

作為發(fā)布會(huì)上的另一個(gè)主角——VLA其實(shí)更能反映李想的長期主義哲學(xué)。

2025年的智能駕駛戰(zhàn)場(chǎng),彌漫著“短平快”的焦慮。數(shù)據(jù)上,部分車企依賴人工采集“老司機(jī)數(shù)據(jù)”,甚至雇傭數(shù)百人實(shí)車路測(cè),成本高昂卻效率低下。算法上,端到端+VLM架構(gòu)遭遇瓶頸——訓(xùn)練數(shù)據(jù)突破1000萬Clips后,性能增長緩慢。評(píng)測(cè)上,實(shí)車測(cè)試無法復(fù)現(xiàn)極端場(chǎng)景,接管里程的數(shù)字繁榮背后隱藏著極端場(chǎng)景的未解難題。

面對(duì)這些現(xiàn)象,李想曾用這樣一句話提醒公司乃至整個(gè)行業(yè)——端到端模型像猴子開車,它能夠?qū)W習(xí)人類行為,但并不理解物理世界。

李想的犀利比喻,直指行業(yè)痛點(diǎn)——短期可落地的技術(shù)≠真正智能。基于這樣的信念,理想沒有簡(jiǎn)單粗暴地用規(guī)則算法“修補(bǔ)”端到端缺陷,而是選擇了一條更艱難的長期主義道路:推翻現(xiàn)有架構(gòu),自研VLA司機(jī)大模型。

 

為何VLA是“正確的事”

區(qū)別于端到端架構(gòu)的模仿學(xué)習(xí),VLA司機(jī)大模型的優(yōu)勢(shì)是通過強(qiáng)化學(xué)習(xí)不斷進(jìn)化,讓機(jī)器理解“為什么這樣做”。這不僅關(guān)乎技術(shù)路線,更是一場(chǎng)關(guān)于用戶體驗(yàn)、商業(yè)效率與技術(shù)野心的深刻重構(gòu)。

首先,VLA能像經(jīng)驗(yàn)豐富的司機(jī)一樣預(yù)判風(fēng)險(xiǎn)(如盲區(qū)車輛切入)。理想汽車自動(dòng)駕駛研發(fā)高級(jí)副總裁郎咸朋希望,未來VLA能將事故里程(MPA)提升至人類駕駛的10倍,做到600萬公里才出一次事故(當(dāng)前理想輔助駕駛為350-400萬公里/次事故,人類駕駛約60萬公里/次事故)。

其次,VLA 還能“越開越像你”。激進(jìn)派車主獲得高效變道,穩(wěn)健派車主享受平順巡航——VLA通過持續(xù)學(xué)習(xí)用戶習(xí)慣,讓車輛“越開越像主人”。郎咸朋描繪未來:“強(qiáng)化學(xué)習(xí)是有這個(gè)能力來支撐它這個(gè)車越開越像你的風(fēng)格或體驗(yàn),之前端到端可能還不具備這樣的能力?!?/p>

郎咸朋透露,未來不同家庭成員上車,系統(tǒng)將通過Face ID自動(dòng)切換至其偏好的駕駛風(fēng)格,車輛真正成為懂你的“個(gè)性化司機(jī)”。

理想沒有讓自己陷入“百萬公里實(shí)車測(cè)試”的重資產(chǎn)泥潭,而是選擇用VLA撕開了行業(yè)的成本偽裝。當(dāng)然,仿真不是為了省錢所做出的選擇,它是能跑贏技術(shù)迭代的選擇——實(shí)車測(cè)試永遠(yuǎn)追不上Corner Case的產(chǎn)生速度。

郎咸朋揭示了效率本質(zhì):“任何技術(shù)的提升一定伴隨著研發(fā)流程的變革,工業(yè)時(shí)代來臨后,刀耕火種的流程被機(jī)械化替代……而進(jìn)入了VLA大模型時(shí)代,測(cè)試效率是提升能力的核心因素?!?/p>

2025年上半年,理想依托世界模型的仿真測(cè)試?yán)塾?jì)里程已突破4000萬公里,每天的測(cè)試?yán)锍套畲蟮姆逯悼蛇_(dá)到30萬公里,這是實(shí)車測(cè)試無法企及的速度與規(guī)模。

郎咸朋點(diǎn)明VLA快速迭代的秘訣:“VLA評(píng)測(cè)就像之前的實(shí)車評(píng)測(cè)一樣……我們的VLA仿真評(píng)測(cè)已經(jīng)在超級(jí)對(duì)齊里做好了基礎(chǔ),現(xiàn)在已經(jīng)有超過40多萬個(gè)場(chǎng)景評(píng)測(cè)了。” 這構(gòu)成了對(duì)手難以短時(shí)間復(fù)制的核心壁壘。

在VLA的長跑中,理想展現(xiàn)出驚人的戰(zhàn)略定力——精準(zhǔn)平衡短期妥協(xié)與長期收益。

在用戶端,理想接受初期功能保守,例如地庫限速最初為10 km/h ,現(xiàn)在逐漸提升到15km/h,換取絕對(duì)安全冗余。但郎咸朋承諾“進(jìn)一步提升能力并且做好測(cè)試之后,我們會(huì)逐步打開這個(gè)能力的車速上限”。

在技術(shù)端,理想犧牲端到端短期數(shù)據(jù)優(yōu)勢(shì)(堆Clip數(shù)),換取VLA的“思維涌現(xiàn)”能力。郎咸朋對(duì)比鮮明:“如果還是沿著端到端思路去做所謂VLA,你的速度一定會(huì)變慢……首先你要訓(xùn)1億個(gè)Clips需要多大的訓(xùn)練算力?”

同時(shí),理想專注構(gòu)建仿真評(píng)測(cè)壁壘。郎咸朋清醒判斷:VLA仍處技術(shù)周期早期,首要任務(wù)是“很好地驗(yàn)證這套系統(tǒng)”。

市場(chǎng)反應(yīng)印證了VLA的長線價(jià)值。今年1月發(fā)布的《理想智能駕駛2024年出行報(bào)告》顯示,理想汽車智能駕駛試駕率達(dá)到72.4%,試駕滿意度為92%,30萬以及40萬以上車型AD Max交付量占比分別為75.4%、84.6%。

可以看出,理想輔助駕駛不再是用戶購車決策中的弱勢(shì)項(xiàng),而是驅(qū)動(dòng)品牌銷量增長的重要因素,這也是VLA司機(jī)大模型與理想i8一同發(fā)布、一同交付的原因。

郎咸朋希望,2025年底將MPI接管里程提升至400-500km,到明年能夠達(dá)到1000km?!懊髂晡覀?nèi)绻搅?000km的MPI水平,可能會(huì)給用戶這種感覺真的到了一個(gè)VLA的ChatGPT的時(shí)刻?!崩硐肫囎詣?dòng)駕駛高級(jí)算法專家詹錕說。

對(duì)VLA的堅(jiān)定選擇,背后是理想的技術(shù)信仰。VLA是理想對(duì)行業(yè)本質(zhì)問題的回答:真正的智能不是“能做什么”,而是“為何這樣做”。

 

數(shù)據(jù)、算法、算力、工程四重難題

自研VLA,這是人跡罕至的路,郎咸朋的團(tuán)隊(duì)知道,啃下這塊“硬骨頭”,需要一場(chǎng)從數(shù)據(jù)、算法、算力到工程能力的全方位“長征”。

在數(shù)據(jù)問題上,截至2025年7月,理想積攢了累計(jì)43億公里輔助駕駛里程、12億公里有效回傳數(shù)據(jù)——這是理想從2020年理想ONE時(shí)代就開始布局的“數(shù)據(jù)金礦”。

接下來是數(shù)據(jù)清洗的“煉金術(shù)”。理想剔除了近1/4“不合規(guī)駕駛行為”,僅保留“老司機(jī)數(shù)據(jù)”。理想汽車自動(dòng)駕駛高級(jí)算法專家湛逸飛解釋:“我們需要的數(shù)據(jù)用一個(gè)詞總結(jié)叫‘老司機(jī)數(shù)據(jù)’。”他們?cè)谠贫瞬渴鹉P?,甚至利用大模型?duì)數(shù)據(jù)進(jìn)行“老司機(jī)”標(biāo)準(zhǔn)的嚴(yán)苛篩選。

為了實(shí)現(xiàn)世界模型的顛覆性革命,理想做出了一個(gè)大膽決策:用仿真測(cè)試替代90%實(shí)車路測(cè)。通過三維重建與場(chǎng)景泛化技術(shù),1:1還原極端場(chǎng)景。這源于一個(gè)嚴(yán)峻的事實(shí),即實(shí)車測(cè)試永遠(yuǎn)無法100%還原事故現(xiàn)場(chǎng)。

湛逸飛透露,依托強(qiáng)大的世界模型,單日峰值測(cè)試?yán)锍踢_(dá)到30萬公里,2025年上半年累計(jì)超4000萬公里。

這并非一蹴而就。2024年,理想進(jìn)行了150多萬公里實(shí)車測(cè)試,并非為了數(shù)據(jù)本身,而是為了驗(yàn)證和校準(zhǔn)仿真環(huán)境的可靠性。湛逸飛坦言,最初世界模型仿真復(fù)現(xiàn)率是存在問題的,團(tuán)隊(duì)通過一年時(shí)間,針對(duì)漏洞進(jìn)行大量工程和算法優(yōu)化,將仿真一致性提升至99.9%以上。

在算法問題上,李想曾尖銳評(píng)價(jià)端到端模型“像猴子開車”——能模仿動(dòng)作,卻無邏輯思維。VLA的突破,核心在于賦予機(jī)器“思考的能力”。

CoT思維鏈(Chain-of-Thought)是VLA的核心突破。它能實(shí)時(shí)呈現(xiàn)決策邏輯(如屏幕顯示“拒絕逆行因安全合規(guī)”),徹底解決端到端“無腦執(zhí)行”的痛點(diǎn)。換句話說,理想不是在教AI開車,而是在教它理解人類世界的規(guī)則。

面對(duì)大模型部署車端的世紀(jì)難題,理想選擇了最硬核的自研之路。

推理速度慢?今年,理想汽車將成為首個(gè)在Thor-U部署VLA模型(4B的MoE混合專家模型)的車企。理想汽車自動(dòng)駕駛高級(jí)算法專家詹錕自豪地說:“目前沒有任何一個(gè)架構(gòu)是這樣的,這是我們與基座團(tuán)隊(duì)共同研發(fā),專門對(duì)嵌入式芯片做了定制的MoE混合專家架構(gòu),在這個(gè)架構(gòu)上我們才能達(dá)到這樣的效果。” 

軌跡生成時(shí)延高?理想不是直接使用標(biāo)準(zhǔn)Diffusion,而是進(jìn)行了推理的壓縮。詹錕揭秘:“以前Diffusion可能要推理10步驟,我們使用了flow matching流匹配只需要推理2步就可以了,這方面的壓縮也是導(dǎo)致我們真正能夠部署VLA的本質(zhì)原因。”效果就是,軌跡生成時(shí)延僅15毫秒。

模型部署難?理想將32B云端大模型蒸餾至3.2B車端MoE模型。詹錕團(tuán)隊(duì)完成了看似不可能的任務(wù):“我們最早訓(xùn)練了一個(gè)32B的云端大模型……把它做出的思考和推理流程蒸餾到3.2B的MoE模型上?!?nbsp;

在算力問題上, 理想關(guān)心“有效算力”。最終,理想在Thor芯片上實(shí)現(xiàn)700TOPS有效算力。詹錕解釋秘訣:“傳統(tǒng)的訓(xùn)練一般都會(huì)拿FP32去做訓(xùn)練...我們有一個(gè)訓(xùn)練過程叫QAT(量化感知訓(xùn)練)……在訓(xùn)練過程中,我把參數(shù)就把它變成INT8或FP8?!?nbsp;

詹錕回顧攻堅(jiān)過程:“我們的工程團(tuán)隊(duì)、部署團(tuán)隊(duì)做了非常多的工作,包括我們魔改CUDA的底層,重寫PTX底層指令,才能實(shí)現(xiàn)現(xiàn)在的效果。” 

為了打破“芯片歧視鏈”,理想讓Orin X芯片和Thor芯片車型都能獲得VLA,這源于理想工程部署能力的一貫積累?!皬脑缙谠诘仄骄€J3部署高速NOA,到在Orin芯片上部署大模型,再到現(xiàn)在在Thor芯片上部署VLA高頻快速的大模型……很多技巧和分析方法,以及基礎(chǔ)設(shè)施的工具鏈都繼承下來了。”詹錕說。

數(shù)據(jù)、算法、算力和工程能力的四位一體,構(gòu)筑了理想VLA的護(hù)城河。而這場(chǎng)啃硬骨頭的長跑,旨在回答一個(gè)問題:真正的智能,是理解“為何這樣做”。

 

技術(shù)背后的價(jià)值觀

當(dāng)VLA司機(jī)在雙向單車道上拒絕執(zhí)行“左轉(zhuǎn)避開三輪車”的指令時(shí),一場(chǎng)關(guān)于機(jī)器價(jià)值觀的公開拷問被引爆。這不是技術(shù)故障,而是理想團(tuán)隊(duì)主動(dòng)選擇的安全底線。郎咸朋深知,VLA的每一步突破,都伴隨著尖銳的質(zhì)疑與艱難的權(quán)衡——這是啃硬骨頭必然付出的代價(jià)。

如何應(yīng)對(duì)用戶信任帶來的風(fēng)險(xiǎn),是理想正在面對(duì)的第一個(gè)問題。

“請(qǐng)左轉(zhuǎn)避開三輪車。”——面對(duì)這樣的指令,VLA在雙向單車道上陷入沉默。詹錕表示,這不是技術(shù)故障,是價(jià)值觀的主動(dòng)選擇。

一方面,復(fù)雜指令存在“通識(shí)門檻”,例如“前進(jìn)10米”依賴物理常識(shí)涌現(xiàn)。詹錕解釋核心原理:“當(dāng)量級(jí)達(dá)到一定規(guī)模時(shí),會(huì)涌現(xiàn)出組合泛化的能力……它懂了數(shù)字,懂了米數(shù),就能組合應(yīng)用?!?但這需要海量數(shù)據(jù)與迭代時(shí)間。

另一方面,交互權(quán)責(zé)存在模糊地帶。用戶閑聊提及“左轉(zhuǎn)”可能誤觸發(fā)指令,理想i8發(fā)布會(huì)上播放的岳云鵬駕駛VLA車輛的視頻,就以一種輕松的表達(dá)方式展現(xiàn)了這個(gè)問題。

“我們現(xiàn)在肯定是為了保持準(zhǔn)確,防止出現(xiàn)一些誤判,比如你本來不想操控車的行為,突然去操控了,這肯定是存在一些還需要迭代和優(yōu)化的地方?!闭插K坦言挑戰(zhàn)。而理想的解決方案指向“統(tǒng)一大腦”,讓車輛對(duì)用戶的想法有更精準(zhǔn)的理解。

如何應(yīng)對(duì)效率、安全、舒適的“不可能三角”,是理想正在面對(duì)的第二個(gè)問題。

郎咸朋強(qiáng)調(diào),理想的選擇,是安全大于舒適和效率。按照這一原則,現(xiàn)階段車輛即便走錯(cuò)路,VLA也不會(huì)通過一些危險(xiǎn)的駕駛動(dòng)作進(jìn)行糾正。只有在保證安全的前提下,VLA才會(huì)去努力讓行程更舒適和更高效。

當(dāng)然,任何選擇都會(huì)付出代價(jià)?!按鷥r(jià)就是初期體驗(yàn)保守?!崩上膛筇寡?,他同時(shí)承諾,我們會(huì)逐步打開能力上限。 

如何應(yīng)對(duì)行業(yè)內(nèi)卷背景下的對(duì)手圍剿和外界質(zhì)疑,是理想正在面對(duì)的第三個(gè)問題。

對(duì)于理想而言,那些采取“短平快”打法的對(duì)手,它們炫耀參數(shù)的行為并不值得自己焦慮,因?yàn)閱渭兊膮?shù)優(yōu)勢(shì),就像廚師夸耀灶臺(tái)火力旺一樣,其實(shí),食客只在乎菜是否燒糊了。

從落地節(jié)奏看,質(zhì)疑聲認(rèn)為“端到端生命周期僅1年,VLA是否曇花一現(xiàn)”,郎咸朋表示:“VLA架構(gòu)會(huì)延續(xù)到機(jī)器人繁榮之后,才可能被其它技術(shù)替代,它是一個(gè)相對(duì)長期的架構(gòu),技術(shù)潛力非常大,也更像人類的智能發(fā)展規(guī)律?!?/p>

面對(duì)各種質(zhì)疑,理想應(yīng)對(duì)之道的根基是三大原則:一是安全絕對(duì)優(yōu)先,MPA事故里程目標(biāo) 600萬公里(優(yōu)于人類駕駛員10倍),用數(shù)據(jù)兌現(xiàn)承諾;二是有效算力至上,以 FP8/INT4量化革命讓每顆芯片“鞠躬盡瘁”;三是用戶共建迭代,134萬車主接管數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí)。

 

寫在最后

理想汽車的VLA“長征”,遠(yuǎn)非一場(chǎng)單純的技術(shù)突圍。它是在智能駕駛喧囂的競(jìng)技場(chǎng)上,對(duì)行業(yè)浮躁與捷徑誘惑的一次“撥亂反正”。當(dāng)整個(gè)行業(yè)被“短平快”的焦慮裹挾,沉溺于算力參數(shù)的軍備競(jìng)賽時(shí),理想選擇了一條布滿荊棘的自研之路。

這條路的艱難顯而易見,但理想的創(chuàng)新內(nèi)核,恰恰體現(xiàn)在這份對(duì)困難的坦然擁抱與主動(dòng)選擇上。李想所言的“選擇‘長’的”,其深意不僅在于時(shí)間的長度,更在于路徑的深度——深入本質(zhì),重構(gòu)規(guī)則。

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。

熱新聞