關(guān)注并標(biāo)星電動(dòng)星球News
每天打卡閱讀
更深刻理解汽車產(chǎn)業(yè)變革
————————
出品:電動(dòng)星球 News
作者:毓肥
今天下午,長(zhǎng)城汽車旗下自動(dòng)駕駛公司毫末智行,舉辦了他們第 6 屆 AI Day——也是今年毫末智行信息量最大、定調(diào)最激進(jìn)的一次發(fā)布會(huì)。
有多激進(jìn)?毫末 CEO 顧維灝直接在發(fā)布會(huì)上說(shuō)「目前已經(jīng)是中國(guó)量產(chǎn)自動(dòng)駕駛公司的第一名」;董事長(zhǎng)張凱說(shuō)「穩(wěn)穩(wěn)占據(jù)中國(guó)量產(chǎn)自動(dòng)駕駛第一名」。
我們可以對(duì)比一下,4 個(gè)月前的第五屆 AI Day,毫末的表態(tài)還是「夯實(shí)中國(guó)量產(chǎn)輔助駕駛第一名」,4 個(gè)月后,毫末的語(yǔ)氣起碼往上邁了一個(gè)大臺(tái)階。
從 2019 年 11 月 29 日毫末智行成立算起,今天也才 1020 天,不到三年。
作為長(zhǎng)城系車型的智能駕駛支柱,同時(shí)涉獵商用物流的自動(dòng)駕駛公司,今天一眾高管的表態(tài),是否也在強(qiáng)調(diào),毫末以不到三年的時(shí)間,已經(jīng)幫助長(zhǎng)城成為自動(dòng)駕駛的頭牌玩家?
帶著好奇和疑惑,我們來(lái)看看毫末第六次 AI Day,報(bào)告了哪些自動(dòng)駕駛的技術(shù)進(jìn)展,其自動(dòng)駕駛的量產(chǎn)走到了哪一步,又是怎么理解自動(dòng)駕駛未來(lái)的。
一、MANA 數(shù)據(jù)閉環(huán)
顧維灝認(rèn)為,自動(dòng)駕駛最近十年來(lái)的技術(shù)發(fā)展,可以分為三個(gè)階段:
1.0 時(shí)代:100 萬(wàn)公里規(guī)模,硬件驅(qū)動(dòng);
2.0 時(shí)代:百萬(wàn)-億公里規(guī)模,軟件驅(qū)動(dòng);
3.0 時(shí)代:1 億公里以上規(guī)模,數(shù)據(jù)驅(qū)動(dòng)。
而毫末智行的目標(biāo),則是「沖刺進(jìn)入自動(dòng)駕駛3.0時(shí)代」。而想要徹底達(dá)成這一目標(biāo),顧維灝認(rèn)為所需的數(shù)據(jù)量、算力、模型優(yōu)化等等,都將比 2.0 時(shí)代高出幾個(gè)數(shù)量級(jí)。
也是在今天的發(fā)布會(huì)上,張凱宣布毫末智行人工智能數(shù)據(jù)體系 MANA,已經(jīng)基本完成了數(shù)據(jù)閉環(huán)。MANA,似乎也成為了毫末智行喊出「中國(guó)第一」的底氣。
那么,MANA 到底做到了什么?和前面幾次亮相相比,它又有什么進(jìn)化?
1. 更大的模型
Transformer,這是目前深度學(xué)習(xí)發(fā)展最強(qiáng)勢(shì)的神經(jīng)網(wǎng)絡(luò)。而基于 Attention 自注意力機(jī)制的 Transformer,又成為了深度學(xué)習(xí),以及如今自動(dòng)駕駛的核心名詞。
什么是 Attention 機(jī)制?它的本質(zhì)是模擬人類的注意力(attention),因?yàn)槲覀兺ㄟ^(guò)聚焦物體的主要特征,從而高效識(shí)別出這是什么,我該怎么做。
換句話說(shuō),簡(jiǎn)潔、焦點(diǎn),就是 Attention 機(jī)制的核心。
Attention 機(jī)制可以無(wú)限堆疊基本單元,如今最大的 Attention 模型參數(shù)已經(jīng)達(dá)到了萬(wàn)億級(jí),訓(xùn)練效果非常驚人——同時(shí)對(duì)算力的要求也非常驚人,起碼達(dá)到了傳統(tǒng) CNN 網(wǎng)絡(luò)的 100 倍。
顧維灝也表示,Attention 機(jī)制 Transformer 的應(yīng)用實(shí)踐,意味著自動(dòng)駕駛數(shù)據(jù)規(guī)模要足夠大,而且需要更充分地多樣性——「起碼要 1 億公里」。
毫末智行和業(yè)界主流一樣沿用了 Attention 機(jī)制,而其 MANA 閉環(huán)的獨(dú)特優(yōu)化,關(guān)鍵則在于數(shù)據(jù)規(guī)模擴(kuò)大的前提下,不斷提高訓(xùn)練效率。
2. 4 萬(wàn)年與 1700 萬(wàn)公里
4 萬(wàn)年,是目前 MANA 數(shù)據(jù)體系的仿真系統(tǒng)內(nèi),已經(jīng)積累的「虛擬駕齡」,模型累計(jì)訓(xùn)練時(shí)長(zhǎng)則超過(guò)了 31 萬(wàn)小時(shí)。另外毫末目前累積的真實(shí)道路數(shù)據(jù),已經(jīng)超過(guò) 1700 萬(wàn)公里。
不斷滾雪球的訓(xùn)練數(shù)據(jù)和模型,需要持續(xù)優(yōu)化的訓(xùn)練效率。其中一個(gè)方法,是通過(guò) backbone 統(tǒng)一,直接利用大量無(wú)標(biāo)注數(shù)據(jù)。
聽(tīng)起來(lái)很復(fù)雜,其實(shí)深度學(xué)習(xí)里面的 backbone 顧名思義,指的是神經(jīng)網(wǎng)絡(luò)的「脊梁骨」,學(xué)名主干網(wǎng)絡(luò),作用類似于提取「最大公約數(shù)」,也就是找到不同數(shù)據(jù)之間的基本共同特征。
毫末智行的做法,則是將所有感知任務(wù)的 backbone 統(tǒng)一,然后利用無(wú)標(biāo)注數(shù)據(jù)先訓(xùn)練好某個(gè) backbone 并鎖定,模型剩余部分再用已標(biāo)注樣本來(lái)訓(xùn)練。
顧維灝表示,這樣操作可使訓(xùn)練效率提升 3 倍以上,同時(shí)精度有顯著提升。
統(tǒng)一 backbone 應(yīng)對(duì)的是更大的模型,另一個(gè)挑戰(zhàn)是更多的數(shù)據(jù)。怎么理解?比如積累到第 10 億公里的時(shí)候,前面 100 萬(wàn)公里可能會(huì)被「遺忘」,大概相當(dāng)于被后面的數(shù)據(jù)「沖掉」了某些特征。
顧維灝指出,最簡(jiǎn)單的方法是用所有數(shù)據(jù)再「提純」一次,但這樣「太貴太慢」。
毫末的方法是類似于「面多加水,水多加面」:抽取已有的數(shù)據(jù),與新數(shù)據(jù)在同一個(gè)模型下輸出。最終號(hào)稱在同樣精度下可以節(jié)省 80% 以上的算力,收斂時(shí)間也可以提升 6 倍以上。
3. 感知全世界
4 月份,我們?cè)诒本w驗(yàn)了毫末智行城市 NOH 的長(zhǎng)城摩卡試驗(yàn)車。當(dāng)時(shí)毫末對(duì)這套城市領(lǐng)航方案的定義是「重感知、輕地圖」,也就是高精地圖的「濃度」相對(duì)更低。
為什么毫末將天平傾向感知?顧維灝的解釋是「高精地圖的置信度有問(wèn)題」。
他表示,城市道路環(huán)境的變化頻率遠(yuǎn)高于高速場(chǎng)景——比如修路?!溉绻训貓D看作傳感器的話,它的置信度是有些問(wèn)題的,不知道什么時(shí)候、什么地方,它就會(huì)失效。」
這樣的邏輯下,毫末決定用 Transformer 建立強(qiáng)感知的時(shí)空理解能力。比如用綜合長(zhǎng)時(shí)間多幀信息來(lái)消除抖動(dòng)、用時(shí)序的 transformer 模型在 BEV 空間上做虛擬實(shí)時(shí)建圖等等。
我們直接來(lái)看療效吧,顧維灝表示,目前毫末已經(jīng)可以解決部分道路模糊、復(fù)雜路口、環(huán)島等問(wèn)題,而且在感知過(guò)程中只需要普通地圖信息,「就像我們自己開(kāi)車一樣」。
有關(guān)「重感知」路線,一周前我們?cè)谠儐?wèn)毫末智行技術(shù)副總裁艾銳的時(shí)候,得到了這樣的回答:
「在純技術(shù)研發(fā)的角度,高精地圖是好事,可以降低難度。但毫末作為競(jìng)爭(zhēng)者的角度,一定要有特色路線。另外國(guó)內(nèi)存在各種限制,高精地圖不會(huì)開(kāi)放得特別快?!?/span>
另外,在重感知賽道上,艾銳表示沒(méi)有必要放棄激光雷達(dá)。
首先,他認(rèn)為 2022 這個(gè)時(shí)間點(diǎn),視覺(jué)并沒(méi)有「碾壓」激光雷達(dá)。而且激光雷達(dá)廠商也不會(huì)坐以待斃,CMOS 化、降成本等等都在做。「如果價(jià)格合適,多配一個(gè)激光雷達(dá)有什么關(guān)系呢?」
當(dāng)然,純視覺(jué)感知走得最堅(jiān)定的特斯拉,艾銳表示依然「比我所知道的都領(lǐng)先一大截,屬于獨(dú)一檔的,其他人都差不太多」。
回到今天發(fā)布會(huì),毫末提到的另一個(gè)關(guān)于感知的進(jìn)步,在于利用人類世界進(jìn)行交互。
說(shuō)得簡(jiǎn)單點(diǎn)就是識(shí)別真實(shí)世界中的通用交通行為,比如車燈。目前毫末正在升級(jí)感知系統(tǒng),目的是識(shí)別剎車燈、轉(zhuǎn)向燈等信息。
艾銳當(dāng)時(shí)則展開(kāi)了更多:比如很多車外后視鏡都有的黃色警報(bào)燈,也在考慮做進(jìn)感知里面,「讓系統(tǒng)知道對(duì)方司機(jī)已經(jīng)發(fā)現(xiàn)你了,可以有更多的博弈邏輯」。
4. 超算中心
去年 12 月 23 日,毫末 MANA 數(shù)據(jù)體系正式亮相。當(dāng)時(shí) MANA 號(hào)稱是「中國(guó)第一個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系」,毫末同時(shí)還宣布了自研超算中心的計(jì)劃。
今天下午,毫末的超算中心披露了更多信息。
首先是建設(shè)目標(biāo):滿足千億參數(shù)的大模型、數(shù)據(jù)規(guī)模百萬(wàn) clips(片段),同時(shí)整體訓(xùn)練成本可以降低 200 倍。
降低成本,指的其實(shí)不是單純「少花錢」,更關(guān)鍵的是「少花時(shí)間」——目前同樣一個(gè)千億參數(shù)的模型,顧維灝表示需要「上千卡 GPU 訓(xùn)練幾個(gè)月時(shí)間?!?/span>
提到訓(xùn)練,最近中美訓(xùn)練芯片禁運(yùn)事件不得不提。艾銳的回應(yīng)是「訓(xùn)練其實(shí)不一定全得用英偉達(dá)方案」。
5. 城市 NOH 的五大功能
最終,MANA 數(shù)據(jù)體系會(huì)在產(chǎn)品上,以高級(jí)智能駕駛的形態(tài)出現(xiàn)。今天的發(fā)布會(huì)上,毫末公布了城市 NOH 的 5 個(gè)主要領(lǐng)航功能:
智能識(shí)別交通燈:可以識(shí)別包括紅綠燈、黃閃燈、左右轉(zhuǎn)箭頭燈等,但與我們體驗(yàn)的版本不一樣,量產(chǎn)版紅轉(zhuǎn)綠燈時(shí)需要輕點(diǎn)油門,官方表示這是出于「用戶磨合」考慮。
智能左右轉(zhuǎn):根據(jù)人類駕駛經(jīng)驗(yàn)設(shè)定左右轉(zhuǎn)向,轉(zhuǎn)向過(guò)程中遇到行人和非機(jī)動(dòng)車時(shí)會(huì)主動(dòng)避讓,遇到機(jī)動(dòng)車才會(huì)觸發(fā)博弈。
智能變道:這是城市領(lǐng)航最主要的功能之一。毫末NOH的變道邏輯包括:保障行駛在正確的車道、為了通行效率主動(dòng)變道、變道時(shí)判斷后方交通參與者運(yùn)動(dòng)情況、會(huì)主動(dòng)用加減速創(chuàng)造變道空間。
智能躲避障礙物(動(dòng)/靜態(tài)):靜態(tài)的典例是錐桶,躲避的邏輯是「能繞就繞,不能繞就減速」;動(dòng)態(tài)的典例則是前車壓線行駛,此時(shí)首選是減速,然后再判斷是否可以繞行。
以上 5 個(gè)(動(dòng)/靜態(tài)分成了兩個(gè))功能都會(huì)在即將發(fā)布的正式版城市 NOH 上線。而隨后毫末將 OTA 的新功能,是「智慧交通流處理」,基礎(chǔ)是加入了識(shí)別轉(zhuǎn)向/剎車燈,然后去做相應(yīng)的決策適配。
最后,顧維灝表示目前毫末的北京、保定、上海、深圳研發(fā)中心都在持續(xù)招聘。
二、1000 天之后,挑戰(zhàn)第一?
前面一段很技術(shù)向,可以概括為「毫末在做什么」。
除了技術(shù)細(xì)節(jié),這屆 AI Day 還是毫末「喊話」最大聲的一次,態(tài)度鮮明、表述高調(diào)。用毫末智行董事長(zhǎng)張凱的原話概括,這次發(fā)布會(huì),毫末在講「中國(guó)自動(dòng)駕駛的新故事、新標(biāo)桿」。
一家成軍不到三年的公司,說(shuō)話這么狠?
我們總結(jié)了張凱今天的幾個(gè)關(guān)鍵表態(tài),以及更多核心數(shù)據(jù)。這里面有很多個(gè)「國(guó)內(nèi)第一」,有些甚至號(hào)稱是「業(yè)內(nèi)第一」。
1.「國(guó)內(nèi)智能駕駛技術(shù)落地經(jīng)驗(yàn)最豐富的公司」
張凱表示,毫末智行用 2 年時(shí)間開(kāi)發(fā)了三代智能駕駛系統(tǒng),落地了 10 余款不同平臺(tái)的車型。目前可以做到全新車型復(fù)用開(kāi)發(fā) 4 個(gè)月達(dá)到量產(chǎn)狀態(tài)、全新車型匹配標(biāo)定 2 個(gè)月內(nèi)完成,號(hào)稱標(biāo)定效率「全行業(yè)第一」。
另外,毫末目前可以同時(shí)異步并行開(kāi)發(fā)超過(guò) 30 個(gè)智能駕駛項(xiàng)目(約等于 30 臺(tái)車),同樣號(hào)稱「國(guó)內(nèi)唯一」的開(kāi)發(fā)能力。
2.「國(guó)內(nèi)最早且唯一的進(jìn)入產(chǎn)品快速迭代階段的自動(dòng)駕駛公司」
除了我們體驗(yàn)過(guò)的,首發(fā) HPilot 3.0 的摩卡激光雷達(dá)版,今年搭載毫末智行智能駕駛的上市車型,還包括歐拉閃電/芭蕾/好貓、長(zhǎng)城炮等等。
量產(chǎn)乘用車以外,今年毫末還發(fā)布了第二代自動(dòng)駕駛末端物流車「小摩駝 2.0」,這款十萬(wàn)級(jí)的物流小車已經(jīng)開(kāi)始交付。
3.「中國(guó)首個(gè)大規(guī)模量產(chǎn)的城市 NOH 輔助駕駛系統(tǒng)」
上面這句話定語(yǔ)很長(zhǎng),但早在 4 月份的時(shí)候,我們得到的準(zhǔn)確表態(tài),是「毫末智行城市領(lǐng)航的落地速度,會(huì)比更依賴高精地圖的華為、小鵬等企業(yè)更快」。
今天發(fā)布會(huì)上,張凱表示今年 HPilot 3.0 可以落地 10 個(gè)城市,明年計(jì)劃是落地超過(guò) 100 個(gè)城市。最先落地的城市,會(huì)是北京/保定。
三、毫末會(huì)是長(zhǎng)城的「長(zhǎng)城」嗎?
我們一直在觀察毫末智行。
原因其實(shí)有好幾個(gè):毫末展示出來(lái)的體系化思考、長(zhǎng)城「全村的希望」、民企做技術(shù)的「豁出去」,等等。
到了 2022 年 9 月,我們看到毫末用3年不到的時(shí)間,追上了華為、小鵬等等城市領(lǐng)航的先發(fā)者,已經(jīng)要同臺(tái)競(jìng)技了。
速度可嘉,但最后依然要看療效。最快下個(gè)月,我們就能看到來(lái)自長(zhǎng)城體系的量產(chǎn)版城市領(lǐng)航了,毫末今天立的 flag、喊的口號(hào),今年真的會(huì)兌現(xiàn)嗎?
你們?cè)趺纯??評(píng)論區(qū)見(jiàn)。
(完)
來(lái)源:第一電動(dòng)網(wǎng)
作者:電動(dòng)星球News蟹老板
本文地址:http://www.healthsupplement-reviews.com/kol/184792
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。
相關(guān)話題