市場

大模型上車，沒那么簡單

蓋世汽車青檸 2023-06-28 12:00

自去年ChatGPT發(fā)布之后，大模型的熱度持續(xù)高漲。國內(nèi)企業(yè)迅速跟進(jìn)，前有百度文心一言、阿里通義千問，后有訊飛星火，加上商湯、騰訊等多家企業(yè)，共同開啟“百模大戰(zhàn)”。

一場場的發(fā)布會(huì)向公眾展示大模型在各個(gè)垂類領(lǐng)域的應(yīng)用前景，開啟了一場人工智能的狂歡。而對于汽車領(lǐng)域，眾廠商發(fā)揮巧思，在智能座艙、自動(dòng)駕駛等方向似乎都有大模型應(yīng)用的廣闊天地。

“大模型在很多產(chǎn)業(yè)上都在使用，但對于一個(gè)AI的應(yīng)用或者技術(shù)，最重要的是應(yīng)用場景。我們認(rèn)為汽車是大模型最大的應(yīng)用場景?！痹谌涨芭e辦的未來汽車先行者大會(huì)上，斑馬智行副總裁徐強(qiáng)如是說道。

前景是美好的，現(xiàn)實(shí)又是怎樣的呢？大模型上車，真能那么順利嗎？

使用前景

在未來汽車先行者大會(huì)上，中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強(qiáng)談到，大模型顧名思義就是通過大量的數(shù)據(jù)訓(xùn)練，得到一個(gè)基礎(chǔ)大模型，然后基于這個(gè)模型根據(jù)專業(yè)運(yùn)用進(jìn)行微調(diào)，在自然語言處理和看圖片、聽歌、識(shí)別、文字編輯等方面有很多應(yīng)用。

圖片來源：未來汽車先行者大會(huì)

從功能上來看，目前人工智能在汽車上主要有兩種落地形式，一類是用于人工智能對話領(lǐng)域，多數(shù)應(yīng)用在智能座艙。

有觀點(diǎn)認(rèn)為，大模型融入智能座艙，將重塑汽車空間，重新定義人與汽車的關(guān)系，推動(dòng)智能汽車向三生活空間轉(zhuǎn)變，同時(shí)讓汽車更顯情感化，滿足乘客更深層次的生理和心理需求。

這也符合用戶對大模型產(chǎn)品上車的第一印象，即通過大模型產(chǎn)品，加強(qiáng)車內(nèi)語音對話等智能座艙表現(xiàn)。

上海車展期間，商湯科技亮相日日新Sensenova大模型，展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合；此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試等。

另一類則是聚焦智能駕駛，比如毫末智行發(fā)布了自動(dòng)駕駛生成式大模型DriveGPT，幫助解決認(rèn)知決策問題，最終實(shí)現(xiàn)端到端的自動(dòng)駕駛。

“AI技術(shù)加速了自動(dòng)駕駛規(guī)模落地，自動(dòng)駕駛是人工智能的典型應(yīng)用場景，人工智能賦予智能汽車超級(jí)大腦。以規(guī)劃決策為例，目前已經(jīng)實(shí)現(xiàn)了從基于規(guī)則到基于自學(xué)習(xí)算法的規(guī)則，自學(xué)習(xí)算法能夠超越經(jīng)驗(yàn)系統(tǒng)，更加聰明處理復(fù)雜場景，大幅拓展自動(dòng)駕駛的設(shè)計(jì)運(yùn)行范圍?！卑俣茸詣?dòng)駕駛業(yè)務(wù)部總經(jīng)理陳卓說到。

據(jù)陳卓介紹，百度依托文心一言大模型，實(shí)現(xiàn)了技術(shù)駕駛技術(shù)和應(yīng)用的突破，文心圖文大模型具有數(shù)千種物體識(shí)別能力，拓展自動(dòng)駕駛語義識(shí)別的數(shù)據(jù)，如消防車、救護(hù)車等特殊車輛，讓解決自動(dòng)駕駛長尾問題的效率得到提升。此外，得益于文心大模型超大參數(shù)規(guī)模，通過大模型訓(xùn)練小模型，自動(dòng)感知泛化能力也顯著增強(qiáng)。

陳卓表示，通用AI技術(shù)在自動(dòng)駕駛帶來的突破，讓大家對其在汽車行業(yè)的想象更加真實(shí)。

應(yīng)用現(xiàn)狀

基于大模型顯露出來的種種優(yōu)勢和可能性，車企對大模型顯露出了足夠的興趣，比如百度的文心一言，已有東風(fēng)日產(chǎn)、紅旗、長城等近十家車企宣布接入。

在上個(gè)月華為nova11 系列及全場景新品發(fā)布會(huì)上，華為常務(wù)董事、終端BG CEO、智能汽車解決方案BU CEO余承東透露，AITO問界M9將搭載AI大模型，詳細(xì)功能體驗(yàn)將在今年秋季AITO問界M9發(fā)布會(huì)上揭曉。

6月16日，美國微軟公司和德國汽車廠商梅賽德斯奔馳公司宣布，雙方將展開合作，把ChatGPT人工智能服務(wù)整合到存量汽車中，美國地區(qū)90萬輛汽車將因此受益。

梅賽德斯奔馳介紹，未來車主在使用語音助手提問時(shí)，ChatGPT將會(huì)負(fù)責(zé)回答問題，增強(qiáng)汽車語音助手的negligible。微軟公司發(fā)言人介紹稱，這也是ChatGPT產(chǎn)品第一次應(yīng)用在汽車環(huán)境中。

5月，百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果。百度Apollo演示了基于文心大模型能力探索下，智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識(shí)問答等多項(xiàng)能力，同時(shí)也展示了在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級(jí)響應(yīng)、免喚醒全時(shí)交互的體驗(yàn)。

百度Apollo方面表示，該公司對下一代車載語音展望是：將命令式交互做到極致，速度最快、全時(shí)交互、覆蓋全車所有音區(qū)。據(jù)悉，這是國內(nèi)首個(gè)大模型在汽車行業(yè)應(yīng)用的成果探索，有望在未來推進(jìn)量產(chǎn)。

圖源：百度Apollo

值得注意的是，在現(xiàn)場演示的過程中，依然存在延時(shí)、語義理解不清晰等問題，有待精進(jìn)，但已顯露大模型大模型賦能智能座艙的實(shí)踐可能。

至于大模型在自動(dòng)駕駛方面的應(yīng)用。6月20日，理想汽車公布了智能駕駛最新進(jìn)展，稱理想AD Max 3.0進(jìn)入大模型時(shí)代，本月內(nèi)將向北京和上海的內(nèi)測用戶交付不依賴高精地圖的城市NOA功能，下半年將向用戶開放通勤NOA功能。

圖片來源：理想

理想汽車表示，有了通勤NOA，無需等待整個(gè)城市NPN特征訓(xùn)練好，只要設(shè)定好自己的通勤路線、自車學(xué)習(xí)NPN特征，學(xué)成之后就可以在這條路線上使用NOA功能。該功能核心是采用了BEV大模型，可以在絕大多數(shù)的道路和路口，實(shí)時(shí)生成穩(wěn)定的道路結(jié)構(gòu)信息。但對于城市中的復(fù)雜路口，僅通過BEV大模型來進(jìn)行感知依然不夠穩(wěn)定。理想汽車的解決方法是通過NPN特征增強(qiáng)BEV模型。

據(jù)了解，NPN指的是神經(jīng)先驗(yàn)網(wǎng)絡(luò)（NeuralPriorNet），車輛會(huì)提前進(jìn)行路口NPN特征的提取，當(dāng)車輛再次行駛到該路口時(shí)，將之前提取好的NPN特征拿出來，與車端感知大模型的BEV特征層相融合，最終得到完美的感知結(jié)果。理想汽車表示，通過NPN特征增強(qiáng)BEV模型，相關(guān)工作的論文，會(huì)發(fā)表在AI領(lǐng)域的國際頂級(jí)會(huì)議CVPR上。

此前，李想在微博發(fā)表觀點(diǎn)稱“智能駕駛和智能空間都已經(jīng)進(jìn)入大模型時(shí)代，大模型的研發(fā)和訓(xùn)練是智能電動(dòng)車企業(yè)的必要能力，否則只會(huì)停留在電動(dòng)車的時(shí)代。”

長路漫漫

大模型在智能座艙上的應(yīng)用是可以直觀感受的，現(xiàn)在已有一些成果出現(xiàn)，但對于自動(dòng)駕駛，大模型上車還有很長的路要走。

“自動(dòng)駕駛的本質(zhì)屬性是用裝置來替代人的操作，從這個(gè)角度來看，人工智能是汽車向更高級(jí)別的智能化發(fā)展時(shí)必須要有的專業(yè)技術(shù)。目前來看我們可以用大模型更好地獲取、加工數(shù)據(jù)，更好地做一些場景建立，做一些算法的初步迭代、訓(xùn)練?！崩羁藦?qiáng)說到。

但李克強(qiáng)也指出大模型是好的支撐方法、支撐工具，在汽車?yán)锩嬉呀?jīng)有很多應(yīng)用領(lǐng)域，但是在深層領(lǐng)域還要做很多工作。

不可否認(rèn)，對于大模型上車，大家是充滿期待的。但是現(xiàn)實(shí)狀況是，除了一些交互的表層應(yīng)用，要想在自動(dòng)駕駛等領(lǐng)域進(jìn)行深層應(yīng)用，還有很長的路要走。

每次人工智能的突破，必然會(huì)引起一次行業(yè)發(fā)展的熱潮。早前，分析型的人工智能，在圖片分析領(lǐng)域，已經(jīng)能做到貓和狗的識(shí)別。彼時(shí)的人們期待其在自動(dòng)駕駛領(lǐng)域的應(yīng)用，因?yàn)榧热挥?jì)算機(jī)能識(shí)別，那么應(yīng)用在汽車領(lǐng)域，也能識(shí)別那些事障礙物，哪些是人或貓狗。

以特斯拉為主的相關(guān)玩家投身該領(lǐng)域，2014年特斯拉就推出了FSD，并且表示很快就能實(shí)現(xiàn)自動(dòng)駕駛，但是直到現(xiàn)在，已有近十年的時(shí)間，仍然無法真實(shí)的大規(guī)模上路。

去年年底到今年年初，以ChatGPT為代表的生成型的人工智能，又帶來一場狂歡，大家很自然就想到能不能把這項(xiàng)技術(shù)再用到智能汽車上。

加拿大工程研究院院士、人工智能與數(shù)字經(jīng)濟(jì)廣東省實(shí)驗(yàn)室（深圳）執(zhí)行主任于非坦言：“我自己的一點(diǎn)想法是，大家對人工智能期待有點(diǎn)高?！?/p>

圖片來源：未來汽車先行者

于非把汽車分為三個(gè)部分來看：第一是感知部分，第二是模型部分或者思考部分，第三是執(zhí)行部分。于非認(rèn)為，從歷史角度來看，感知部分的技術(shù)已經(jīng)非常成熟，思考系統(tǒng)正在發(fā)生一次非常大的裂變，但是執(zhí)行部分的大變革還沒有真正到來。

“大時(shí)間尺度的秒級(jí)、分鐘級(jí)的邏輯推理，用大模型可能比較適合，但是小規(guī)模、小時(shí)間尺度的，尤其是汽車的控制領(lǐng)域方面，我覺得還有所不足，還有很長的路要走。”于非說道。

大模型在汽車領(lǐng)域的應(yīng)用還存在多方面的風(fēng)險(xiǎn)，包括整個(gè)生態(tài)上是否已準(zhǔn)備好，車端是否有足夠的算力與資源來運(yùn)行模型。

“現(xiàn)在真正的模型數(shù)據(jù)調(diào)動(dòng)管理需要利用智能網(wǎng)聯(lián)汽車以及計(jì)算技術(shù)平臺(tái)、云控技術(shù)平臺(tái)等平臺(tái)，只有大量的數(shù)據(jù)匯聚才可做交叉，特別是垂直領(lǐng)域，這和娛樂系統(tǒng)、服務(wù)系統(tǒng)不一樣，從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來看，若基礎(chǔ)云平臺(tái)不能打通，很難實(shí)現(xiàn)向深層領(lǐng)域推進(jìn)?！崩羁藦?qiáng)說到。

此外，在道德和法律層面，大模型上車也還存在一些限制，歸到最后的場景落地，人工智能能否滿足車輛對實(shí)時(shí)性、安全性等方面的超高要求，或者什么時(shí)候才能滿足，都是個(gè)問題。

大模型或許有可能打開智能汽車深層進(jìn)化的大門，但就現(xiàn)在而言，只能說是有可能。

來源：蓋世汽車

作者：青檸

本文地址：http://www.healthsupplement-reviews.com/news/shichang/205532

返回第一電動(dòng)網(wǎng)首頁 >

以上內(nèi)容轉(zhuǎn)載自蓋世汽車，目的在于傳播更多信息，如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除，轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)（www.healthsupplement-reviews.com）立場。

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請聯(lián)系admin#d1ev.com（#替換成@）刪除。