市場

理想汽車12月31日全量推送OTA 7.0 有望在2025年實(shí)現(xiàn)L3級(jí)自動(dòng)駕駛

汽車之家 2024-12-26 21:12

12月26日，理想汽車CEO李想和智駕負(fù)責(zé)人郎咸朋在直播中講解了理想汽車在智駕方面的發(fā)展動(dòng)向。理想汽車將在12月31日全量推送OTA 7.0給AD Max用戶。按照理想現(xiàn)在的端到端+VLM體系繼續(xù)迭代，有望在2025年實(shí)現(xiàn)L3級(jí)自動(dòng)駕駛。具體的問答內(nèi)容如下：

汽車之家

01.理想智駕一號(hào)位的職業(yè)危機(jī)

張小?B：聽說李想對(duì)智駕發(fā)了很大的火，你怎么還能留在這？

郎咸朋：當(dāng)時(shí)想哥說了一句很狠的話，他說郎博下半年如果我還看不到變化，咱們還是拿不到頭部位置的話，那你這個(gè)負(fù)責(zé)人就可以不用干了。

張小?B：那次發(fā)火完之后達(dá)成了什么結(jié)果？

郎咸朋：我覺得大家就回歸的是體驗(yàn)和用戶價(jià)值，重新把大家的思路聚攏了。我們是給用戶做一個(gè)有更好體驗(yàn)、更安全、更便捷的產(chǎn)品，而不是說做一大堆什么從指標(biāo)上看起來挺好的產(chǎn)品。那次所有人心里邊又重新回到從產(chǎn)品出發(fā)去做智能駕駛，這是我覺得印象最深的一點(diǎn)。

張小?B：你們是那次之后開始轉(zhuǎn)的端到端嗎？

汽車之家

郎咸朋：其實(shí)在想哥發(fā)火之前，我們內(nèi)部的這個(gè)端到端的預(yù)研，已經(jīng)在開展了。那么從那一刻開始，我們端到端的速度就加快了。

張小?B：第一次試駕端到端是什么樣的體驗(yàn)？

郎咸朋：我第一次試到這個(gè)車，從中關(guān)村開到了北京交通大學(xué)。開了幾公里我就問旁邊的賈鵬，這是規(guī)則還是怎么做的？怎么我覺得開得這么好呢？他說一句規(guī)則都沒寫，全都是系統(tǒng)按照咱們給它的數(shù)據(jù)自己訓(xùn)練出來的。

咱們開車都知道，如果前面有個(gè)車剎停的話，它是要緩慢減速，甚至還再抬起一點(diǎn)剎車，有這樣非常舒適的剎車過程。這個(gè)過程我們團(tuán)隊(duì)在規(guī)則階段寫了很長時(shí)間的代碼，都沒有達(dá)到一個(gè)完全擬人、解決所有場景的表現(xiàn)。

但我第一次試駕端到端，它的縱向就已經(jīng)比之前試過所有的都要好的狀態(tài)，這才用了短短不到15天。所以我覺得那時(shí)候建立了一個(gè)信心，就是端到端一定能做出來。而且一旦它做出來，就一定會(huì)比現(xiàn)在所有的智能駕駛軟件都要好。

張小?B：既然端到端是靈丹妙藥，為什么去年不上？特斯拉去年就上了，你去年在干嘛？

郎咸朋：我們?cè)诘?，等足夠的?shù)據(jù)和算力，等到了我們就能上了。

端到端 VLM大模型其實(shí)最終的本質(zhì)是用人工智能來做自動(dòng)駕駛。人工智能的三個(gè)要素：算法、數(shù)據(jù)和算力。這三個(gè)要素必須全都齊備。我們是今年是準(zhǔn)備好了，所以我們能做這個(gè)事情。

理想AD Max 車型的銷量，去年起來了之后到今年初（高質(zhì)量訓(xùn)練）數(shù)據(jù)量達(dá)到10億（公里）左右規(guī)模，這是一個(gè)基礎(chǔ)。第二是算力基礎(chǔ)，今年初我們算力也到了5EFLOPS。再加上第三步，就是端到端的一些預(yù)研也有一定成果，所以到今年初是天時(shí)地利人和，可以做這個(gè)事情了，去年我們還在補(bǔ)課的一個(gè)過程。

張小?B：為什么很多企業(yè)的端到端是兩個(gè)模型，而不是One Model？

郎咸朋：這個(gè)是算法和理念的問題。我們要做端到端時(shí)就給自己定了一個(gè)目標(biāo)，一定要用純數(shù)據(jù)驅(qū)動(dòng)的方式來做這件事情，而不是結(jié)合了之前的規(guī)則來做，所以說它的性能上限會(huì)非常高。

張小?B：為什么理想是端到端+VLM，不像特斯拉只用端到端？你們對(duì)自己的端到端不夠自信嗎？

郎咸朋：不能這么講，我們?cè)谧黾夹g(shù)方案時(shí)充分參考了世界上所有的先進(jìn)方案，但始終無法解決一個(gè)問題是，當(dāng)一套自動(dòng)駕駛或智能駕駛系統(tǒng)，它工作時(shí)如果遇到之前沒有見過的場景，應(yīng)該怎么處理？我們認(rèn)為就是端到端+VLM，就是系統(tǒng)1+系統(tǒng)2的方式，很好地模仿人類大腦的工作方式。

張小?B：如果智駕一號(hào)位想要推動(dòng)智能駕駛的投入，老板會(huì)成為阻力嗎？

郎咸朋：沒有，反而李想一直在催促我：郎博，咱們自動(dòng)駕駛怎么還是慢了？趕緊加快速度！

02.要么就做端到端，要么就不再做自動(dòng)駕駛。

張小?B：特斯拉沒有用激光雷達(dá)，你們?yōu)槭裁匆茫?/strong>

李想：很多人不太理解說：為什么要保留激光雷達(dá)，還是為了安全。是不是因?yàn)槟慵夹g(shù)不好？不是，中國和美國是不一樣的，如果你經(jīng)常在中國晚上夜路開車，你會(huì)看到有尾燈壞了的大貨車、甚至可能尾燈壞的大貨車會(huì)直接停在主路上，至少我們今天的攝像頭，能夠在深夜里沒有光線下看到的距離，其實(shí)只有100米出頭。

但是激光雷達(dá)，在沒有任何光線的情況下是可以看到200米的。這就可以幫助我們實(shí)現(xiàn)130公里/小時(shí)的AEB自動(dòng)緊急制動(dòng)。那我覺得這個(gè)是非常重要的，因?yàn)槲覀兪莻€(gè)面向家庭的車，每個(gè)人生命安全都非常的重要，所以這是我們繼續(xù)保留激光雷達(dá)根本所在。而且后邊的車型仍然會(huì)保留。我相信如果馬斯克在中國，在深夜里不同的高速開過車，他也會(huì)選擇把前面的一顆激光雷達(dá)保留下來。因?yàn)樘厮估瓕?duì)于安全同樣地重視，只是他要在這個(gè)環(huán)境里來看到。

張小?B：理想激進(jìn)的用只有一個(gè)模型的端到端，其他車企還在用兩個(gè)模型，為什么？

李想：很多時(shí)候可能跟我們有一些比較好的外腦有關(guān)，像王興、陸奇博士，他們會(huì)給我們帶來很多啟發(fā)。有一次陸奇博士跟我們講，你們應(yīng)該思考一下人是怎么工作的？我覺得這個(gè)當(dāng)時(shí)對(duì)我們幫助很大。

今年初我還逼著智駕團(tuán)隊(duì)去美國，他們?cè)诓煌某鞘虚_FSD V12。另一方面我們研究工作也在進(jìn)行，那時(shí)已經(jīng)在發(fā)端到端+VLM的各種研究論文了。回來以后我覺得要么你做這個(gè)，要么我們就不要再做自動(dòng)駕駛了。今天你靠這些規(guī)則上來做的，跟請(qǐng)個(gè)供應(yīng)商做出來的東西有啥區(qū)別？沒有啥區(qū)別。

我說服郎博他們很重要的一點(diǎn)，我說你們經(jīng)常解決了一個(gè)Corner Case（極端情況），又出現(xiàn)三個(gè)其他的Corner Case。你們一輩子都在解決Corner Case，解決不完。

張小?B：所以其他人不轉(zhuǎn)，是因?yàn)樗麄僀orner Case解決得比你們好？

李想：有些企業(yè)Corner Case確實(shí)解決得比我們好，因?yàn)樗麜?huì)招很多的人，5倍、10倍的人，然后一個(gè)路口一個(gè)路口去解決。不但解決規(guī)則算法的Corner Case，甚至還自己有地圖，去修地圖的Corner Case。

張小?B：過去兩年在人工智能上，你有什么哇塞Moment嗎？

李想：ChatGPT 肯定是了，其次我們內(nèi)部還是有很多“哇塞”的。一個(gè)印象最深的是，我們決定啟動(dòng)端到端并匹配好資源，準(zhǔn)備好200人團(tuán)隊(duì)，他們訓(xùn)練了幾十版模型，第一版放到車上，當(dāng)時(shí)郎博讓我們來試，我跟張穎（經(jīng)緯中國合伙人）在北京研發(fā)總部正好就一起試了。張穎坐主駕我坐副駕，當(dāng)時(shí)我就很驚訝：這一個(gè)月的訓(xùn)練，比過去三年做的東西，進(jìn)步速度要快！

張穎之前試過無圖NOA，當(dāng)他試到端到端時(shí)發(fā)現(xiàn)這跟人很相似，甚至在一個(gè)路口，旁邊有輛車為了躲行人往我們這邊躲時(shí)，這個(gè)車也適時(shí)地避讓了。他問為什么能躲那么快？我說端到端響應(yīng)速度快了好幾倍，因?yàn)樗莻€(gè)One Model，而不是經(jīng)過4個(gè)步驟。

我們下一個(gè)大版本更新時(shí)，用戶可以在車上直接很清楚地看到端到端的工作方式是什么樣的，視覺語言模型工作方式是什么樣的，以及人工智能到底是怎么工作的。

03.有監(jiān)督智能駕駛不是L2的延續(xù)，而是L4的先導(dǎo)。

張小?B：大家都說理想做智駕是投入最晚最慢的，你怎么看？

郎咸朋：2018年1月我加入理想時(shí)，跟李想討論過這個(gè)問題。什么才是決定最終智能駕駛或自動(dòng)駕駛實(shí)現(xiàn)的最關(guān)鍵因素？我們當(dāng)時(shí)聊的就是數(shù)據(jù)。人才可以流動(dòng)、算法可以提升、算力也非常重要，但是只要有健康的資金、合理的資金使用也是能買得到的。

那么最重要就是數(shù)據(jù)，數(shù)據(jù)它是買不到的，必須自己有這樣一個(gè)非常高質(zhì)量、規(guī)模非常大的數(shù)據(jù)，才可以做好自動(dòng)駕駛。所以我們要按照節(jié)奏來做自動(dòng)駕駛，剛開始我們要先把車造好、把車賣好，然后積累更多的資金、人才和數(shù)據(jù)，到了一定時(shí)間點(diǎn)再大量投入，去達(dá)到更好的自動(dòng)駕駛的效果。其實(shí)從現(xiàn)在結(jié)果上也是能看出這一點(diǎn)的：我們自動(dòng)駕駛的節(jié)奏是非常好的。

張小?B：什么時(shí)候理想意識(shí)到，智駕對(duì)于賣車是有幫助的？

郎咸朋：從實(shí)際表現(xiàn)來看是從今年開始的，今年智能駕駛確實(shí)對(duì)于銷量有非常好的促進(jìn)作用。我們2月AD Max的交付量占比只到20%左右，然后到今年下半年超過50%了，這是實(shí)打?qū)嵉臉I(yè)績。早期大家認(rèn)為自動(dòng)駕駛是一個(gè)功能，它跟座椅加熱沒有大的區(qū)別，并沒有解決用戶日常出行的舒適性。直到現(xiàn)在我們用AI來做自動(dòng)駕駛，端到端+VLM真正解放用戶長時(shí)間的駕駛疲勞。當(dāng)我們能達(dá)到綜合MPI（城市+高速綜合接管里程）100公里、幾百公里時(shí)，大家就真正愿意為自動(dòng)駕駛買單了。

張小?B：理想提出有監(jiān)督智能駕駛，跟自動(dòng)駕駛L1到L5傳統(tǒng)分級(jí)有什么區(qū)別？

郎咸朋：這里面其實(shí)體現(xiàn)我們對(duì)自動(dòng)駕駛研發(fā)的思路差別。之前很多人認(rèn)為L3自動(dòng)駕駛是L2輔助駕駛的延續(xù)，只要把L2輔助駕駛的場景越做越多，總有一天能無限趨近于L3，甚至可能就能夠做到L3。

但在我們看來，L3或者有監(jiān)督智能駕駛，它并不是L2的延續(xù)，而是L4或者自動(dòng)駕駛的先導(dǎo)程序。實(shí)際上我們是錨著未來的自動(dòng)駕駛能力去研發(fā)、去成長和迭代的，而不是沿著過去一套用L2的思路，去做現(xiàn)在的自動(dòng)駕駛。

張小?B：你說自動(dòng)駕駛是能力、輔助駕駛是功能，兩者本質(zhì)區(qū)別是什么？

郎咸朋：功能是預(yù)設(shè)條件，能力是應(yīng)對(duì)所有條件。你不可能窮盡所有的預(yù)設(shè)。

功能的話，還是用上一代的這種軟件1.0方案來做自動(dòng)駕駛。最大的問題是在研發(fā)之初，就要清晰地設(shè)定所有條件、所有邊界，以及最終確定性的結(jié)果。這在自動(dòng)駕駛里是非常困難的。

能力的話，是用人工智能的方式來做自動(dòng)駕駛。當(dāng)我們把自動(dòng)駕駛當(dāng)成能力來開發(fā)，從最本質(zhì)思考人是怎么學(xué)會(huì)開車的。最開始人去駕校學(xué)習(xí)，掌握基本駕駛技能再考試?？纪暾莆栈灸芰χ?，作為實(shí)習(xí)司機(jī)一邊實(shí)踐一邊提升能力，慢慢地成長為老司機(jī)。我們系統(tǒng)1+系統(tǒng)2的方案，讓自動(dòng)駕駛系統(tǒng)擁有這種能力去迭代和成長，隨著數(shù)據(jù)量的增長，它會(huì)慢慢地讓性能隨之提升，這個(gè)就是大家經(jīng)常說的規(guī)模效應(yīng)。

張小?B：你們驗(yàn)證了自動(dòng)駕駛的規(guī)模效應(yīng)嗎？

郎咸朋：我們已經(jīng)驗(yàn)證出來了。這不是我們發(fā)明的，所有的大模型應(yīng)用都符合這種規(guī)律，也就是說數(shù)據(jù)規(guī)模和數(shù)據(jù)質(zhì)量的增長，會(huì)帶動(dòng)性能的增長。而且性能增長是接近于線性的，這就是我們用大模型最本質(zhì)的好處。

張小?B：有監(jiān)督智能駕駛階段，理想交付給用戶的產(chǎn)品長什么樣？

郎咸朋：全場景的、一體化端到端產(chǎn)品。要想實(shí)現(xiàn)有監(jiān)督智能駕駛，一個(gè)前提是實(shí)現(xiàn)車位到車位，也就是解決最前面一百米和最后面一百米。以前智駕是從干道開始，現(xiàn)在可以從小區(qū)車位開始，然后包括園區(qū)道路、泊車、城市道路，還有高速和收費(fèi)站ETC都會(huì)全部打通。

高速城市全場景升級(jí)端到端+VLM，以及創(chuàng)新的AI推理可視化的交互，將在近期隨OTA全量推送給所有的AD Max用戶。

張小?B：L3什么時(shí)候?qū)崿F(xiàn)？

郎咸朋：按照現(xiàn)在的端到端+VLM這套體系，能力繼續(xù)迭代的話，我們是有希望在2025年去實(shí)現(xiàn)L3的。

張小?B：面對(duì)李想年初對(duì)于智駕的發(fā)火，你的職業(yè)危機(jī)是什么時(shí)候解除的？

郎咸朋：我覺得到現(xiàn)在還沒解除，因?yàn)檫€沒有做到極致。我們的目標(biāo)是今年綜合MPI（城市+高速綜合接管里程）做到100公里接管一次的能力。這個(gè)接管不是安全接管，不是說你要撞車了才接管，是用戶覺得車開得不符合體驗(yàn)、不舒服的接管。到明年、后年，我們會(huì)逐漸提升至500公里、甚至1000公里以上。慢慢讓大家對(duì)智駕越來越自信、越來越依賴。

張小?B：要實(shí)現(xiàn)這樣的目標(biāo)，需要儲(chǔ)備多少算力和數(shù)據(jù)？

郎咸朋：要達(dá)到500公里的綜合MPI（城市+高速綜合接管里程），預(yù)計(jì)需要2000萬Clips（視頻片段）的水平。如果2000萬Clips從不到5%的老司機(jī)去篩選，這里隱含的數(shù)據(jù)量，要達(dá)到50億公里甚至上百億公里的水平。

04電動(dòng)車這場仗什么時(shí)候能分出勝負(fù)手？

張小?B：你現(xiàn)在開車智能駕駛占比是多少？

李想：大概80%左右。

張小?B：剩下的20%是因?yàn)槟銈兗夹g(shù)不夠行嗎？

李想：最主要是我趕時(shí)間。

張小?B：端到端是自動(dòng)駕駛的制勝法寶嗎？

李想：我覺得端到端只能解決L3，解決不了L4。

張小?B：什么時(shí)候可以100%用自動(dòng)駕駛？

李想：給我三年的時(shí)間，它需要技術(shù)到位，也需要產(chǎn)品到位，也需要一些環(huán)境和政策到位，也需要消費(fèi)者對(duì)于人工智能的信任到位。

張小?B：電動(dòng)車這場仗什么時(shí)候能分出勝負(fù)手？

李想：現(xiàn)在中國的汽車仍然非常內(nèi)卷。電動(dòng)化和智能化是兩場仗，電動(dòng)化其實(shí)是相當(dāng)于是一張門票，我認(rèn)為L4會(huì)分出來真正的勝負(fù)。但是我們今天在做的所有事情，是為了L4拿門票，因?yàn)長4所需要花的錢，所需要擁有的能力，所需要的數(shù)據(jù)量，是今天所不具備的，所以今天大家要靠這個(gè)東西去拿L4的門票。

張小?B：拿L4的門票需要什么條件？

李想：足夠多的車跑在路上。

張小?B：多少車？

李想：得500萬輛以上。第二你要真的自己掌握VLA（視覺語言行動(dòng)模型）這個(gè)基礎(chǔ)模型的能力。第三，你要有足夠多的錢去招募最頂級(jí)的人才，以及足夠的算力，有這三個(gè)條件。

張小?B：當(dāng)滿足這些條件且做到足夠優(yōu)秀時(shí)，能做出一家像蘋果這樣的公司嗎？

李想：一定會(huì)的，一定會(huì)的。(編譯/汽車之家顏歡）

來源：第一電動(dòng)網(wǎng)

作者：汽車之家

本文地址：http://healthsupplement-reviews.com/news/shichang/258512

返回第一電動(dòng)網(wǎng)首頁 >

以上內(nèi)容轉(zhuǎn)載自汽車之家，目的在于傳播更多信息，如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除，轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)（healthsupplement-reviews.com）立場。

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。

收藏

贊62

分享到：

相關(guān)話題

相關(guān)圈子

發(fā)表評(píng)論

新聞推薦

推薦

新車

評(píng)測

供應(yīng)鏈

智能科技

政策

人物

資本

問答

選擇車型
上牌城市	購車城市
姓名
手機(jī)號(hào)
驗(yàn)證碼
	xxx