1. 首頁
  2. 資訊
  3. 市場
  4. 大模型上車,沒那么簡單

大模型上車,沒那么簡單

蓋世汽車 青檸

自去年ChatGPT發(fā)布之后,大模型的熱度持續(xù)高漲。國內(nèi)企業(yè)迅速跟進(jìn),前有百度文心一言、阿里通義千問,后有訊飛星火,加上商湯、騰訊等多家企業(yè),共同開啟“百模大戰(zhàn)”。

一場場的發(fā)布會(huì)向公眾展示大模型在各個(gè)垂類領(lǐng)域的應(yīng)用前景,開啟了一場人工智能的狂歡。而對于汽車領(lǐng)域,眾廠商發(fā)揮巧思,在智能座艙、自動(dòng)駕駛等方向似乎都有大模型應(yīng)用的廣闊天地。

“大模型在很多產(chǎn)業(yè)上都在使用,但對于一個(gè)AI的應(yīng)用或者技術(shù),最重要的是應(yīng)用場景。我們認(rèn)為汽車是大模型最大的應(yīng)用場景?!痹谌涨芭e辦的未來汽車先行者大會(huì)上,斑馬智行副總裁徐強(qiáng)如是說道。

前景是美好的,現(xiàn)實(shí)又是怎樣的呢?大模型上車,真能那么順利嗎?

使用前景

在未來汽車先行者大會(huì)上,中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強(qiáng)談到,大模型顧名思義就是通過大量的數(shù)據(jù)訓(xùn)練,得到一個(gè)基礎(chǔ)大模型,然后基于這個(gè)模型根據(jù)專業(yè)運(yùn)用進(jìn)行微調(diào),在自然語言處理和看圖片、聽歌、識(shí)別、文字編輯等方面有很多應(yīng)用。

大模型上車,沒那么簡單

圖片來源:未來汽車先行者大會(huì)

從功能上來看,目前人工智能在汽車上主要有兩種落地形式,一類是用于人工智能對話領(lǐng)域,多數(shù)應(yīng)用在智能座艙。

有觀點(diǎn)認(rèn)為,大模型融入智能座艙,將重塑汽車空間,重新定義人與汽車的關(guān)系,推動(dòng)智能汽車向三生活空間轉(zhuǎn)變,同時(shí)讓汽車更顯情感化,滿足乘客更深層次的生理和心理需求。

這也符合用戶對大模型產(chǎn)品上車的第一印象,即通過大模型產(chǎn)品,加強(qiáng)車內(nèi)語音對話等智能座艙表現(xiàn)。

上海車展期間,商湯科技亮相日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合;此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試等。

另一類則是聚焦智能駕駛,比如毫末智行發(fā)布了自動(dòng)駕駛生成式大模型DriveGPT,幫助解決認(rèn)知決策問題,最終實(shí)現(xiàn)端到端的自動(dòng)駕駛。

“AI技術(shù)加速了自動(dòng)駕駛規(guī)模落地,自動(dòng)駕駛是人工智能的典型應(yīng)用場景,人工智能賦予智能汽車超級(jí)大腦。以規(guī)劃決策為例,目前已經(jīng)實(shí)現(xiàn)了從基于規(guī)則到基于自學(xué)習(xí)算法的規(guī)則,自學(xué)習(xí)算法能夠超越經(jīng)驗(yàn)系統(tǒng),更加聰明處理復(fù)雜場景,大幅拓展自動(dòng)駕駛的設(shè)計(jì)運(yùn)行范圍?!卑俣茸詣?dòng)駕駛業(yè)務(wù)部總經(jīng)理陳卓說到。

據(jù)陳卓介紹,百度依托文心一言大模型,實(shí)現(xiàn)了技術(shù)駕駛技術(shù)和應(yīng)用的突破,文心圖文大模型具有數(shù)千種物體識(shí)別能力,拓展自動(dòng)駕駛語義識(shí)別的數(shù)據(jù),如消防車、救護(hù)車等特殊車輛,讓解決自動(dòng)駕駛長尾問題的效率得到提升。此外,得益于文心大模型超大參數(shù)規(guī)模,通過大模型訓(xùn)練小模型,自動(dòng)感知泛化能力也顯著增強(qiáng)。

陳卓表示,通用AI技術(shù)在自動(dòng)駕駛帶來的突破,讓大家對其在汽車行業(yè)的想象更加真實(shí)。

應(yīng)用現(xiàn)狀

基于大模型顯露出來的種種優(yōu)勢和可能性,車企對大模型顯露出了足夠的興趣,比如百度的文心一言,已有東風(fēng)日產(chǎn)、紅旗、長城等近十家車企宣布接入。

在上個(gè)月華為nova11 系列及全場景新品發(fā)布會(huì)上,華為常務(wù)董事、終端BG CEO、智能汽車解決方案BU CEO余承東透露,AITO問界M9將搭載AI大模型,詳細(xì)功能體驗(yàn)將在今年秋季AITO問界M9發(fā)布會(huì)上揭曉。

6月16日,美國微軟公司和德國汽車廠商梅賽德斯奔馳公司宣布,雙方將展開合作,把ChatGPT人工智能服務(wù)整合到存量汽車中,美國地區(qū)90萬輛汽車將因此受益。

梅賽德斯奔馳介紹,未來車主在使用語音助手提問時(shí),ChatGPT將會(huì)負(fù)責(zé)回答問題,增強(qiáng)汽車語音助手的negligible。微軟公司發(fā)言人介紹稱,這也是ChatGPT產(chǎn)品第一次應(yīng)用在汽車環(huán)境中。

5月,百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果。百度Apollo演示了基于文心大模型能力探索下,智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識(shí)問答等多項(xiàng)能力,同時(shí)也展示了在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級(jí)響應(yīng)、免喚醒全時(shí)交互的體驗(yàn)。

百度Apollo方面表示,該公司對下一代車載語音展望是:將命令式交互做到極致,速度最快、全時(shí)交互、覆蓋全車所有音區(qū)。據(jù)悉,這是國內(nèi)首個(gè)大模型在汽車行業(yè)應(yīng)用的成果探索,有望在未來推進(jìn)量產(chǎn)。

大模型上車,沒那么簡單

圖源:百度Apollo

值得注意的是,在現(xiàn)場演示的過程中,依然存在延時(shí)、語義理解不清晰等問題,有待精進(jìn),但已顯露大模型大模型賦能智能座艙的實(shí)踐可能。

至于大模型在自動(dòng)駕駛方面的應(yīng)用。6月20日,理想汽車公布了智能駕駛最新進(jìn)展,稱理想AD Max 3.0進(jìn)入大模型時(shí)代,本月內(nèi)將向北京和上海的內(nèi)測用戶交付不依賴高精地圖的城市NOA功能,下半年將向用戶開放通勤NOA功能。

大模型上車,沒那么簡單

圖片來源:理想

理想汽車表示,有了通勤NOA,無需等待整個(gè)城市NPN特征訓(xùn)練好,只要設(shè)定好自己的通勤路線、自車學(xué)習(xí)NPN特征,學(xué)成之后就可以在這條路線上使用NOA功能。該功能核心是采用了BEV大模型,可以在絕大多數(shù)的道路和路口,實(shí)時(shí)生成穩(wěn)定的道路結(jié)構(gòu)信息。但對于城市中的復(fù)雜路口,僅通過BEV大模型來進(jìn)行感知依然不夠穩(wěn)定。理想汽車的解決方法是通過NPN特征增強(qiáng)BEV模型。

據(jù)了解,NPN指的是神經(jīng)先驗(yàn)網(wǎng)絡(luò)(NeuralPriorNet),車輛會(huì)提前進(jìn)行路口NPN特征的提取,當(dāng)車輛再次行駛到該路口時(shí),將之前提取好的NPN特征拿出來,與車端感知大模型的BEV特征層相融合,最終得到完美的感知結(jié)果。理想汽車表示,通過NPN特征增強(qiáng)BEV模型,相關(guān)工作的論文,會(huì)發(fā)表在AI領(lǐng)域的國際頂級(jí)會(huì)議CVPR上。

此前,李想在微博發(fā)表觀點(diǎn)稱“智能駕駛和智能空間都已經(jīng)進(jìn)入大模型時(shí)代,大模型的研發(fā)和訓(xùn)練是智能電動(dòng)車企業(yè)的必要能力,否則只會(huì)停留在電動(dòng)車的時(shí)代。”

長路漫漫

大模型在智能座艙上的應(yīng)用是可以直觀感受的,現(xiàn)在已有一些成果出現(xiàn),但對于自動(dòng)駕駛,大模型上車還有很長的路要走。

“自動(dòng)駕駛的本質(zhì)屬性是用裝置來替代人的操作,從這個(gè)角度來看,人工智能是汽車向更高級(jí)別的智能化發(fā)展時(shí)必須要有的專業(yè)技術(shù)。目前來看我們可以用大模型更好地獲取、加工數(shù)據(jù),更好地做一些場景建立,做一些算法的初步迭代、訓(xùn)練?!崩羁藦?qiáng)說到。

但李克強(qiáng)也指出大模型是好的支撐方法、支撐工具,在汽車?yán)锩嬉呀?jīng)有很多應(yīng)用領(lǐng)域,但是在深層領(lǐng)域還要做很多工作。

不可否認(rèn),對于大模型上車,大家是充滿期待的。但是現(xiàn)實(shí)狀況是,除了一些交互的表層應(yīng)用,要想在自動(dòng)駕駛等領(lǐng)域進(jìn)行深層應(yīng)用,還有很長的路要走。

每次人工智能的突破,必然會(huì)引起一次行業(yè)發(fā)展的熱潮。早前,分析型的人工智能,在圖片分析領(lǐng)域,已經(jīng)能做到貓和狗的識(shí)別。彼時(shí)的人們期待其在自動(dòng)駕駛領(lǐng)域的應(yīng)用,因?yàn)榧热挥?jì)算機(jī)能識(shí)別,那么應(yīng)用在汽車領(lǐng)域,也能識(shí)別那些事障礙物,哪些是人或貓狗。

以特斯拉為主的相關(guān)玩家投身該領(lǐng)域,2014年特斯拉就推出了FSD,并且表示很快就能實(shí)現(xiàn)自動(dòng)駕駛,但是直到現(xiàn)在,已有近十年的時(shí)間,仍然無法真實(shí)的大規(guī)模上路。

去年年底到今年年初,以ChatGPT為代表的生成型的人工智能,又帶來一場狂歡,大家很自然就想到能不能把這項(xiàng)技術(shù)再用到智能汽車上。

加拿大工程研究院院士、人工智能與數(shù)字經(jīng)濟(jì)廣東省實(shí)驗(yàn)室(深圳)執(zhí)行主任于非坦言:“我自己的一點(diǎn)想法是,大家對人工智能期待有點(diǎn)高?!?/p>

大模型上車,沒那么簡單

圖片來源:未來汽車先行者

于非把汽車分為三個(gè)部分來看:第一是感知部分,第二是模型部分或者思考部分,第三是執(zhí)行部分。于非認(rèn)為,從歷史角度來看,感知部分的技術(shù)已經(jīng)非常成熟,思考系統(tǒng)正在發(fā)生一次非常大的裂變,但是執(zhí)行部分的大變革還沒有真正到來。

“大時(shí)間尺度的秒級(jí)、分鐘級(jí)的邏輯推理,用大模型可能比較適合,但是小規(guī)模、小時(shí)間尺度的,尤其是汽車的控制領(lǐng)域方面,我覺得還有所不足,還有很長的路要走。”于非說道。

大模型在汽車領(lǐng)域的應(yīng)用還存在多方面的風(fēng)險(xiǎn),包括整個(gè)生態(tài)上是否已準(zhǔn)備好,車端是否有足夠的算力與資源來運(yùn)行模型。

“現(xiàn)在真正的模型數(shù)據(jù)調(diào)動(dòng)管理需要利用智能網(wǎng)聯(lián)汽車以及計(jì)算技術(shù)平臺(tái)、云控技術(shù)平臺(tái)等平臺(tái),只有大量的數(shù)據(jù)匯聚才可做交叉,特別是垂直領(lǐng)域,這和娛樂系統(tǒng)、服務(wù)系統(tǒng)不一樣,從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來看,若基礎(chǔ)云平臺(tái)不能打通,很難實(shí)現(xiàn)向深層領(lǐng)域推進(jìn)?!崩羁藦?qiáng)說到。

此外,在道德和法律層面,大模型上車也還存在一些限制,歸到最后的場景落地,人工智能能否滿足車輛對實(shí)時(shí)性、安全性等方面的超高要求,或者什么時(shí)候才能滿足,都是個(gè)問題。

大模型或許有可能打開智能汽車深層進(jìn)化的大門,但就現(xiàn)在而言,只能說是有可能。

來源:蓋世汽車

作者:青檸

本文地址:http://www.healthsupplement-reviews.com/news/shichang/205532

返回第一電動(dòng)網(wǎng)首頁 >

收藏
41
  • 分享到:
發(fā)表評(píng)論
新聞推薦
熱文榜
日排行
周排行
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!
-->