在 11 月份全量推送完車(chē)位到車(chē)位的 V6.5 版本之后,理想汽車(chē)在 12 月底即將迎來(lái)新一輪 OTA 升級(jí)。
這一次則是 V7.0 版本的推送。
和 V6.5 版本針對(duì)車(chē)位到車(chē)位、全國(guó)高速收費(fèi)站 ETC 通行等場(chǎng)景不同,這一次理想汽車(chē)除了針對(duì)高速場(chǎng)景的升級(jí)外,針對(duì)智駕也引入了全新的交互設(shè)計(jì)。
所以接下來(lái)我們就從這兩個(gè)升級(jí)點(diǎn)來(lái)聊一聊理想 V7.0 版本。
首先就是 AI 推理這個(gè)功能。
如果不是理想汽車(chē)的內(nèi)測(cè)用戶(hù),大家在聽(tīng)到「 AI 推理」可能會(huì)有點(diǎn)陌生,如果是內(nèi)測(cè)用戶(hù),那你可以在評(píng)論區(qū)留下對(duì)「 AI 推理」上車(chē)的看法。
在過(guò)去有圖、有規(guī)則的智駕時(shí)代,信息輸入和輸出都是規(guī)則化的,在規(guī)則化之下可視化的顯示也就會(huì)比較單一。
但隨著無(wú)圖時(shí)代以及 VLM 等系統(tǒng)上車(chē),各種判斷和可能性也就更豐富。
所以在新的規(guī)則之下,理想汽車(chē)想把系統(tǒng)盡可能無(wú)盡的還原給用戶(hù),也是希望通過(guò)這個(gè)「 AI 推理」來(lái)告訴用戶(hù)這套系統(tǒng)的能力。
這套系統(tǒng)簡(jiǎn)單說(shuō)就是把系統(tǒng)能力可視化,把系統(tǒng)的思考和判斷告訴用戶(hù)。所以 V7.0 版本就在智駕 SR 界面上多了一個(gè)「 AI 推理」打開(kāi)按鍵。
打開(kāi)之后我們可以看到整個(gè)中控大屏的右側(cè) 2/3 界面分為了三個(gè)板塊。當(dāng)然,我們也可以把這個(gè)顯示界面移動(dòng)到副駕娛樂(lè)屏。
這三個(gè)板塊分別是左上角的端到端模型輸出行駛軌跡的思考過(guò)程、左下角注意力系統(tǒng)以及右側(cè)的 VLM 視覺(jué)語(yǔ)言模型。
其中,左上角端到端模型輸出行駛軌跡共有十條路徑,每個(gè)路徑代表一種模型輸出結(jié)果,最終系統(tǒng)選擇一條老司機(jī)概率最高的軌跡來(lái)執(zhí)行操作。
左下角 Attention( 注意力系統(tǒng) ) 則是展示車(chē)輛感知到的交通和環(huán)境路況信息,系統(tǒng)會(huì)以熱力圖形式展示注意力系統(tǒng)的工作狀態(tài)。
其中顏色更暖 ( 偏紅 ) 的區(qū)域代表對(duì)智能駕駛決策影響更大的區(qū)域,顏色更冷 ( 偏藍(lán) ) 的區(qū)域代表對(duì)智能駕駛決策影響較小的區(qū)域。
最后就是 VLM (視覺(jué)語(yǔ)言模型) ,這里則是以對(duì)話(huà)形式展示視覺(jué)語(yǔ)言模型的感知、推理和決策過(guò)程。
所以「 AI 推理」其實(shí)就是理想汽車(chē)針對(duì)當(dāng)下無(wú)圖智駕的一種交互理念的創(chuàng)新,本意是一種系統(tǒng)能力的展示,通過(guò)能力的展示讓用戶(hù)可以更放心、更安心的使用理想的智駕。
但從實(shí)際體驗(yàn)來(lái)看,個(gè)人覺(jué)得這套「 AI 推理」信息密度過(guò)高,并且整個(gè)信息更新也相對(duì)較快,其實(shí)在真正使用智駕的時(shí)候?qū)ζ鋮⒖疾⒉欢?,但好在可以取消顯示,屬于一種展示的拓展,偶爾可以炫炫技。
除了「 AI 推理」之外,這一次 V7.0 版本還有一個(gè)比較大的升級(jí),那就是端到端的高速上車(chē)。
在原有城市基礎(chǔ)上,本次高速環(huán)路和高速路場(chǎng)景 NOA 也升級(jí)為端到端模型。
這也就意味著隨著 V7.0 版本的推送,理想汽車(chē)將用端到端技術(shù)這一套架構(gòu)實(shí)現(xiàn)城市、高速環(huán)路、高速路等場(chǎng)景的智能駕駛。
高速及環(huán)路的端到端上車(chē)帶來(lái)的好處就是不再依賴(lài)先驗(yàn)信息,體驗(yàn)上用戶(hù)不會(huì)再因?yàn)楦呔貓D的缺失帶來(lái) NOA 降級(jí),全程無(wú)斷點(diǎn),體驗(yàn)也更一致化。
當(dāng)然了,因?yàn)闆](méi)有了先驗(yàn)信息,同時(shí)也是架構(gòu)的初次切換,一些能力的表現(xiàn)和過(guò)去依靠先驗(yàn)信息的系統(tǒng)表現(xiàn)也確實(shí)會(huì)有所不同。隨著學(xué)習(xí)的深度提升,后續(xù)表現(xiàn)肯定也會(huì)不斷優(yōu)化。
這一次我們也再次去跑了下深中通道,簡(jiǎn)單的體驗(yàn)了下。因?yàn)樵诮衲?7 月份我們?cè)?jīng)駕駛理想 L 系列車(chē)型,當(dāng)時(shí)還是 6.0.0 beta 3 版本,那個(gè)時(shí)候還只能全程 LCC 使用。
這一次我們駕駛 V7.0 版本則是可以全程 NOA 通過(guò)深中通道,而且全程并未出現(xiàn)任何的降級(jí),包括較長(zhǎng)的隧道、橋上以及下橋。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
2倍速 NOA 在深中大橋行駛的視頻包括在同樂(lè)收費(fèi)站有一段路,在 12 月 18 日我使用 V6.5.1 版本的 NOA 到這里還是會(huì)降級(jí)為 LCC。這一次我們駕駛 V7.0 版本剛好經(jīng)過(guò)這里,全程 NOA 通過(guò),沒(méi)有再降級(jí)。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
6.5.1 版本在此處還會(huì)降級(jí),V7.0 則不會(huì)降級(jí)基于此情況之下,我們也來(lái)簡(jiǎn)單聊一聊 V7.0 版本的高速去高精地圖上了端到端后的表現(xiàn)。
除了全程無(wú)斷點(diǎn)的表現(xiàn)之外,V7.0 版本在匝道轉(zhuǎn)換方面給我留下了比較深的印象。
過(guò)去我們?cè)诟咚偕鲜褂弥邱{時(shí),遇到匝道轉(zhuǎn)換或駛離匝道場(chǎng)景時(shí),系統(tǒng)一般會(huì)在距離匝道 1-2 公里處開(kāi)始處理變道等動(dòng)作。
這一次使用 V7.0 版本遇到最極限的一次是在距離匝道還有 370 米時(shí)才發(fā)起第一個(gè)變道動(dòng)作,而且此時(shí)車(chē)輛還處于三車(chē)道的最左側(cè)車(chē)道。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
距離匝道 370 米處,開(kāi)始第一次變道駛離匝道最終驚險(xiǎn)的完成了此次匝道轉(zhuǎn)換。
可以看到相較于過(guò)去的 1-2 公里處開(kāi)始處理轉(zhuǎn)換,這個(gè)版本在這個(gè)匝道的表現(xiàn)確實(shí)非常的極限,個(gè)人覺(jué)得可以再優(yōu)化下。
不過(guò)在準(zhǔn)備下高速的匝道轉(zhuǎn)換時(shí),系統(tǒng)的表現(xiàn)就沒(méi)那么極限了,在距離出口 700 多米時(shí)開(kāi)始向右發(fā)起變道,距離和效率把控的都不錯(cuò)。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
距離 700 米處,發(fā)起變道駛出匝道而且在駛?cè)朐训烙龅揭环侄缆非闆r下,系統(tǒng)并不是快速的向左車(chē)道或是向右車(chē)道進(jìn)入車(chē)道里,而是比較“擬人化”的騎著中線(xiàn)然后再并入車(chē)道。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
在一分二道路上,騎線(xiàn)行駛的同時(shí)駛?cè)氲缆分?V7.0 版本在體驗(yàn)連續(xù)性、效率和擬人化方面確實(shí)不錯(cuò),但我們也遇到了一些不舒適的點(diǎn)。
例如在深中通道行駛時(shí),當(dāng)我們從隧道出來(lái)會(huì)有一次「導(dǎo)航更新」,這個(gè)時(shí)候系統(tǒng)把車(chē)速?gòu)?70km/h 快速降到 55km/h,體感及安全感都不是很好。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話(huà)窗口。Escape鍵將取消并關(guān)閉對(duì)話(huà)窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話(huà)窗口
出隧道后會(huì)出現(xiàn)地圖更新降速問(wèn)題當(dāng)然了,因?yàn)槭鞘状伟迅咚俸透咚侪h(huán)線(xiàn)切到無(wú)高精地圖+端到端大模型技術(shù)方案,所以在能力表現(xiàn)方面出現(xiàn)點(diǎn)波動(dòng)也屬正常。隨著模型訓(xùn)練數(shù)量的提升,后續(xù)這方面的問(wèn)題也會(huì)被慢慢 OTA 優(yōu)化掉。
但在沒(méi)優(yōu)化之前,大家使用智駕也一定要小心,無(wú)論使用哪家智駕都不可大意,安全才是第一位。
以上就是這一次理想 V7.0 版本帶來(lái)的兩個(gè)比較重磅的更新內(nèi)容,「AI 推理」把系統(tǒng)更豐富的能力可視化,有需求的小伙伴可以去參考這個(gè)「AI 推理」看系統(tǒng)能力,不需要的也可以直接關(guān)閉。
高速 NOA 在去高精地圖加上端到端大模型后,也讓理想在城市和高速都采用了同一套技術(shù)框架。從體驗(yàn)來(lái)看,在效率和擬人化方面確實(shí)有提升,但也還需要繼續(xù)優(yōu)化。不過(guò),隨著模型數(shù)量的提升,后續(xù)高速 NOA 升級(jí)也會(huì)變的更快。
來(lái)源:第一電動(dòng)網(wǎng)
作者:新出行
本文地址:http://www.healthsupplement-reviews.com/carnews/pingce/258511
以上內(nèi)容轉(zhuǎn)載自新出行,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.healthsupplement-reviews.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。