1. 首頁(yè)
  2. 大牛說(shuō)
  3. 特斯拉AI Day全記錄+解讀:不僅有算力怪獸,還有特斯拉機(jī)器人!

特斯拉AI Day全記錄+解讀:不僅有算力怪獸,還有特斯拉機(jī)器人!

大概兩個(gè)小時(shí)前,可能是特斯拉本年度最重要,也可能是汽車(chē)領(lǐng)域——甚至科技行業(yè)本年度非常重要的一次發(fā)布會(huì),剛剛結(jié)束。

2019 年的 Autonomous Day 上,特斯拉帶來(lái)了首款車(chē)企自研的自動(dòng)駕駛計(jì)算方案;2020 年的 Battery Day,馬斯克又發(fā)布了號(hào)稱(chēng)續(xù)航提升 54% 的 4680 電池+一體式底盤(pán)。

而今天的 AI Day,特斯拉正式兌現(xiàn)了馬斯克承諾的「一家人工智能公司」,發(fā)布了第一款汽車(chē)企業(yè)自研的人工智能訓(xùn)練芯片 D1,以及目前性能最強(qiáng)的人工智能計(jì)算機(jī)柜 DOJO Pod——它會(huì)為特斯拉的純視覺(jué) FSD 深度學(xué)習(xí)服務(wù)。

圖片

除此以外,特斯拉還公開(kāi)了純視覺(jué) FSD 的工作原理、遇到的挑戰(zhàn),以及 Autopilot 軟件團(tuán)隊(duì)的解決方案。

最出乎意料的,是馬斯克帶來(lái)了 one more thing——特斯拉研發(fā)的機(jī)器人 Tesla Bot!

圖片

我們用盡可能易懂的表達(dá),盡量摘錄了大部分內(nèi)容,但時(shí)間關(guān)系,具體的原理今天很難展開(kāi)討論,請(qǐng)大家見(jiàn)諒。

今天的文章不短,而且很多圖,但我們還是強(qiáng)烈建議您看完全文,因?yàn)檫@場(chǎng)發(fā)布會(huì)實(shí)在太炸裂。

前言:特斯拉的 AI 原命題

如果你制定了超越一個(gè)行業(yè)的計(jì)劃,要不你是個(gè)瘋子,要不你就會(huì)滾起認(rèn)知和實(shí)踐的雪球,做到無(wú)數(shù)個(gè)「第一次」。

特斯拉就是典例。

DOJO 的誕生并不是為了稱(chēng)霸超算界而稱(chēng)霸超算界,它更像是普羅米修斯手里的火種,目的是為特斯拉,以及后面的一眾車(chē)企/技術(shù)公司,照亮人工智能的前路。

圖片

所以進(jìn)入正文前,請(qǐng)大家牢記一個(gè)問(wèn)題:當(dāng)前地球量產(chǎn)科技基礎(chǔ)上,如何打造最極致的人工智能?

因?yàn)檫@是 DOJO、FSD、Tesla Bot 的靈魂,也是特斯拉本次 AI Day 的原命題。

一、「用眼睛開(kāi)車(chē)」

很多朋友已經(jīng)對(duì)這句話倒背如流,不過(guò)今天還是得重復(fù)一次,作為本章節(jié)的綱領(lǐng)——「你會(huì)開(kāi)車(chē),是因?yàn)槟阌醚劬绰罚皇茄劬Πl(fā)射激光」。

這句話將一個(gè)深刻的道理極限地淺顯化,以至于引來(lái)了可能是自動(dòng)駕駛領(lǐng)域最激烈(起碼之一)的爭(zhēng)論。

這個(gè)道理是:人類(lèi)經(jīng)過(guò)漫長(zhǎng)歲月的進(jìn)化,已經(jīng)形成了一套從眼睛開(kāi)始,以大腦為中樞,肢體為具現(xiàn)的「地球 OL 啟動(dòng)器」。

所以,特斯拉的純視覺(jué)方法論,并不像是繞開(kāi)雷達(dá)信號(hào)融合的「捷徑」,反而可能是最形而上學(xué)的蜀道難——因?yàn)樘厮估M煲粋€(gè)輪子上的人。

前不久的 2021 CVPR 計(jì)算機(jī)視覺(jué)會(huì)議上,特斯拉 AI 部門(mén)高級(jí)主管 Andrej Karpathy 已經(jīng)分享了很多 Autopilot 軟件細(xì)節(jié),大家可以點(diǎn)擊這里回看我們的報(bào)道,今天我們只聊特斯拉做到了什么。

想要實(shí)現(xiàn) Andrej 說(shuō)過(guò)的,讓汽車(chē)用眼睛開(kāi)車(chē),有攝像頭是不夠的,關(guān)鍵是如何分解攝像頭信號(hào),又如何讓汽車(chē)思考這些信號(hào)。

圖片

但事實(shí)上,先不說(shuō)更深層次的「思考」,光是讓純視覺(jué)「認(rèn)清」一樣?xùn)|西,就已經(jīng)需要耗費(fèi)大量努力。

圖片

和我們開(kāi)眼看世界不太一樣,攝像頭看到的是像素集合,因此神經(jīng)網(wǎng)絡(luò)要做的,是分析每個(gè)像素之間的聯(lián)系,并判斷哪些像素集合成哪些物體。

點(diǎn)線面體,我們現(xiàn)在來(lái)到了「體」,也就是由無(wú)數(shù)同一時(shí)間發(fā)生的、存在的事物組成的真實(shí)世界。以駕駛為例子,「障礙物」、「交通燈」、「車(chē)道線」等等,都是需要神經(jīng)網(wǎng)絡(luò)認(rèn)清的元素。

圖片

于是我們需要多任務(wù)深度學(xué)習(xí),特斯拉則將自己的多任務(wù)網(wǎng)絡(luò)稱(chēng)為「HydraNets」。

純視覺(jué) Autopilot 數(shù)據(jù),由 8 個(gè)攝像頭,每個(gè)攝像頭每秒拍攝的 36 幀畫(huà)面組成,所以每一幀的最終效果如下圖所示——每秒一共有 36 組這樣的畫(huà)面。

圖片

圖片

挑戰(zhàn)隨即而至:多攝像頭融合的界限很難劃分、圖像內(nèi)的空間也并不是最終映射的實(shí)際空間(類(lèi)似于畸變)。

圖片

圖片

一個(gè)明顯的例子是長(zhǎng)長(zhǎng)的半掛,同時(shí)出現(xiàn)在 5 個(gè)攝像頭的視野內(nèi):

圖片

除了看清物體,看路也是至關(guān)重要的一環(huán),特別是正確識(shí)別道路的邊界。在這張范例里,道路邊緣的特征點(diǎn)被車(chē)輛阻擋,這時(shí)候就需要從畫(huà)面其他部分「尋找線索」。

圖片

事實(shí)上,讓車(chē)子搞清楚「需要看哪里」,同樣不是容易的事情,特斯拉把算法的簡(jiǎn)單結(jié)構(gòu) po 了出來(lái):

圖片

接下來(lái)要搞定的,是如何「看得完整」。也就是正確識(shí)別某個(gè)物體跨越多個(gè)攝像頭的全部運(yùn)動(dòng)軌跡,比如前面有車(chē)經(jīng)過(guò):

圖片

最后是「記得你看過(guò)的東西」。

我們?cè)陂_(kāi)車(chē)的時(shí)候,以往的經(jīng)驗(yàn)會(huì)告訴我們,路邊停著的車(chē)隊(duì)中間可能會(huì)竄出一個(gè)人、單行道上沒(méi)有打雙閃的車(chē),停下來(lái)也許短時(shí)間也不會(huì)走...

以至于速度、方向、標(biāo)識(shí)等等紛繁的細(xì)節(jié),它們都組成了我們對(duì)路況即時(shí)的記憶,然后決定了我們什么時(shí)候應(yīng)該做什么。

圖片

二、FSD 老司機(jī)成長(zhǎng)記

在特斯拉的理解里,自動(dòng)駕駛的目標(biāo),就是同時(shí)最大化安全 safety、舒適 comfort,以及效率 efficiency。是的,同時(shí),缺一不可。

圖片

第一段說(shuō)「看路」,本質(zhì)上是自動(dòng)駕駛的感知。而本段討論的則是規(guī)劃,以及控制。事實(shí)上特斯拉用了海量篇幅討論「規(guī)劃」,控制相對(duì)少很多。

圖片

我們直接看療效:

圖片

圖片

比如上圖,我們經(jīng)過(guò)一個(gè)十字路口之后,前方還要左轉(zhuǎn)。這時(shí)候有多種操作方式:減速提早變線、加速推遲變線,等等。但每個(gè)選擇都可能有缺點(diǎn),依據(jù)的路況也不一樣,這就是 coarse search 粗搜索。

圖片

特斯拉表示僅僅 1.5 毫秒內(nèi),系統(tǒng)就可以做出 2500 個(gè)粗搜索。靈光一現(xiàn)也許都不太夠用,這得靈光 2500 現(xiàn)。

圖片

即使是靈光 2500 萬(wàn)現(xiàn),最終也得往前開(kāi)。經(jīng)歷眾多備選項(xiàng)之后,系統(tǒng)就可以做出相對(duì)合理的抉擇,在兼顧舒適與安全的基礎(chǔ)上,盡量簡(jiǎn)單地把彎給轉(zhuǎn)了,這就是 smooth trajectory 平滑軌跡。

自動(dòng)駕駛的科目二和科目三幾乎是一起上的,而且課程極其繁重——因?yàn)槁窙r瞬息萬(wàn)變。

圖片

這時(shí)候依然需要粗搜索大法,以停車(chē)場(chǎng)為例,在走過(guò)一個(gè)彎的路程內(nèi),Autopilot 已經(jīng)進(jìn)行了接近 40 萬(wàn)次的粗搜索:

圖片

對(duì)于特斯拉來(lái)說(shuō),規(guī)劃的最終目的,就是為了 Corridor 行駛通道內(nèi)的安全、順滑和速度不斷優(yōu)化。

圖片

三、一切為了數(shù)據(jù),為了數(shù)據(jù)的一切

2021 CVPR 會(huì)議上,Andrej 表示特斯拉轉(zhuǎn)向純視覺(jué)深度學(xué)習(xí)之后,已經(jīng)積累了超過(guò) 60 億個(gè)物體標(biāo)簽,超過(guò) 1.5PB 的數(shù)據(jù)量——那還只是 6 月底。

圖片

為了應(yīng)對(duì)如此龐大的數(shù)據(jù),特斯拉表示他們目前擁有一支 1000 人的數(shù)據(jù)標(biāo)簽隊(duì)伍,與工程師一起工作,打造了完全定制化的數(shù)據(jù)標(biāo)簽&分析架構(gòu)。

在傳統(tǒng)的 2D 圖像標(biāo)注基礎(chǔ)上,特斯拉現(xiàn)在可以實(shí)現(xiàn) 4D,也就是立體空間+時(shí)間戳的四維標(biāo)注,效果如圖:

圖片

另外,銷(xiāo)量屢創(chuàng)新高,路上跑的車(chē)越來(lái)越多之后,特斯拉如今可以對(duì)同一條路做多次數(shù)據(jù)收集:

圖片

加上墻壁、路障,和其他所有物體,再加上周邊行人、車(chē)輛的閉環(huán)整合,一輛特斯拉眼中的數(shù)據(jù)世界,是這樣的:

圖片

四、Dojo,地表最強(qiáng)!

終于來(lái)到本次發(fā)布會(huì)的重中之重了。

圖片

目前特斯拉唯一一款自研芯片,是 FSD Chip。單芯算力 72TOPS,雙芯組成的 Autopilot 硬件 3.0 算力 144TOPS。

圖片

除了裝在 SEXY 家族車(chē)型上,特斯拉還在用硬件 3.0 做 AI 評(píng)估,超過(guò) 3000 塊 HW3.0 主板組成的 3 個(gè)數(shù)據(jù)中心,每周可以運(yùn)行 100 萬(wàn)次循環(huán)。

圖片

而前不久 Andrej「爆料」的,目前用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的超級(jí)計(jì)算機(jī),則使用了英偉達(dá) A100 GPU 方案,合計(jì) 5760 個(gè) GPU 以及 12PB(1PB=1024TB)的 NVME 高速存儲(chǔ)器。

圖片

但在 Dojo 面前,它倆都像是上一個(gè)時(shí)代的產(chǎn)物——或者說(shuō)本來(lái)就是。

正式進(jìn)入 Dojo 參數(shù)之前,我們先來(lái)強(qiáng)調(diào)一下:特斯拉對(duì)于 AI 訓(xùn)練計(jì)算機(jī)的核心訴求,并不是算力,而是帶寬和延遲

圖片

這一點(diǎn),2019 年的 Pete Bannon 已經(jīng)提到過(guò):「自動(dòng)駕駛運(yùn)算需要極高的帶寬,起碼要達(dá)到 1TB 每秒,F(xiàn)SD 芯片(內(nèi)部)可以達(dá)到 2TB 每秒」。

多芯片之間數(shù)據(jù)交換的帶寬(類(lèi)似于車(chē)道數(shù))和延遲(類(lèi)似于道路限速),是特斯拉在 AI 訓(xùn)練路上狂奔得足夠久之后的深刻總結(jié)。

圖片

Dojo 的設(shè)計(jì)原命題,就是帶寬和延遲,這兩個(gè)要素,是決定特斯拉能否達(dá)到「最佳 AI 訓(xùn)練性能、更大更復(fù)雜神經(jīng)網(wǎng)絡(luò)、能耗成本優(yōu)化」目標(biāo)的關(guān)鍵。

圖片圖片

再賣(mài)個(gè)關(guān)子,來(lái)看看英偉達(dá)的 A100 多芯片方案,多個(gè)芯片位于不同的 PCB 基板,用橋接器連接。這已經(jīng)是目前最快的橋接器,速度達(dá)到了 600GB 每秒。

但對(duì)于特斯拉來(lái)說(shuō),這還遠(yuǎn)遠(yuǎn)不夠。

圖片

多芯片之間最理想的數(shù)據(jù)交換方式,就是「放在一起」,也就是位于同一塊基板上,左鄰右里排布。

而特斯拉更進(jìn)一步,不是將芯片們「放」在一起,而是「封裝」在一起。

封裝多個(gè)芯片有很多種方法,比如這顆英特爾處理器一樣,兩塊芯片放在一個(gè)基板上:

而特斯拉又進(jìn)了一步,使用了臺(tái)積電首次量產(chǎn)的 InFO-SoW 扇上晶圓直出封裝技術(shù),也就是直接從晶圓上刻出一個(gè)個(gè)芯片,然后整塊晶圓摁在基板上。

圖片

全部裝起來(lái)之后,一個(gè) Dojo 計(jì)算模組長(zhǎng)這樣:

圖片

如果只刻一塊芯片,那它叫 D1 Chip,長(zhǎng)這樣,基于臺(tái)積電 7 納米工藝打造,核心面積 645 平方毫米,內(nèi)置了 500 億個(gè)晶體管,內(nèi)部線束長(zhǎng)度高達(dá) 11+ 英里(約 18 公里):

圖片

內(nèi)部線束如此驚人,是因?yàn)?D1 芯片內(nèi)和芯片間的通信帶寬簡(jiǎn)直駭人聽(tīng)聞。這同時(shí)得益于臺(tái)積電的封裝技術(shù)(芯片之間的距離極短),以及特斯拉的芯片設(shè)計(jì)。

一塊 D1 芯片由 354 個(gè)訓(xùn)練節(jié)點(diǎn)組成,每個(gè)訓(xùn)練節(jié)點(diǎn)內(nèi)部都起碼有以下部分:

64 位 4 路集相的多線程 CPU;

1.25MB SRAM 緩存;

低延遲數(shù)據(jù)交換結(jié)構(gòu);

SIMD 單指令多數(shù)據(jù)流的浮點(diǎn)/整數(shù)單元

D1 訓(xùn)練節(jié)點(diǎn)的一大特點(diǎn),就在于這個(gè)「低延遲數(shù)據(jù)交換結(jié)構(gòu)」。

圖片

上圖右上角有一個(gè)叫做「 NOC Router」的結(jié)構(gòu),這是訓(xùn)練節(jié)點(diǎn)之間交換數(shù)據(jù)的工具——特斯拉喪心病狂地給每一個(gè)小節(jié)點(diǎn),都設(shè)計(jì)了上下左右各 64bit 的通道。

這是什么意思?我們還是直接看療效:D1 的芯片內(nèi)部帶寬高達(dá)10TB每秒,芯片外帶寬也高達(dá) 4TB每秒!

圖片

算力方面,每一個(gè)訓(xùn)練節(jié)點(diǎn)都擁有 1024GFLOPS的 BF16/CF8 精度計(jì)算能力(這兩個(gè)是較新的精度標(biāo)準(zhǔn)),或者 32GFLOPS的 FP32 精度計(jì)算能力。

354 個(gè)訓(xùn)練節(jié)點(diǎn)構(gòu)成的 D1 芯片,則可以實(shí)現(xiàn)高達(dá) 362TFLOPS 的 BF16/CF8 精度算力(FP32 精度 22.6T)——而 25 個(gè) D1 芯片組成的 Dojo 計(jì)算模塊,則將這塊人手輕松舉起來(lái)的「電腦」算力,推到了驚人的:

9PFLOPS!

圖片

這是什么概念?

最終成品的單個(gè) DOJO 計(jì)算機(jī)柜,叫做 DOJO Pod,總算力超過(guò) 1.1EFLOPS(BF16 精度),內(nèi)含 3000 個(gè) D1 芯片,也就是只需要 120 片上圖這樣小巧的模組——就達(dá)到了超越全球超算排行榜第 5 名的 FP32 精度算力。

圖片

而目前的第 5 名,隸屬于美國(guó)國(guó)家能源研究科學(xué)計(jì)算中心(NERSC)的 Perlmutter,一共有 40 個(gè)機(jī)柜。

當(dāng)然,馬斯克說(shuō)過(guò)的可是「1 exa flops at de facto FP32(貨真價(jià)實(shí)的 1E FP32 精度算力)」。目前一個(gè) Dojo Pod 可實(shí)現(xiàn)不了——但這次跳票也許真不怪馬斯克,臺(tái)積電目前有多緊俏,相信大家都有所耳聞。

哦對(duì)了,下一代 Dojo 和相關(guān)軟件工具已經(jīng)在研發(fā)了,目標(biāo)又是 10 倍級(jí)別的系統(tǒng)級(jí)性能提升。

圖片

五、One More Thing

年滿 50 歲的馬斯克,終于知道人前起舞是有點(diǎn)幼稚的事情,于是今天他請(qǐng)來(lái)了一位衣著前衛(wèi)的舞者,替他發(fā)泄情緒:

圖片

不好意思歪樓了,這是今天的 One More Thing,也是全場(chǎng)發(fā)布會(huì)最大的驚喜——特斯拉機(jī)器人  Tesla Bot。不是跳舞這位,而是它:

圖片

馬斯克對(duì) Tesla Bot 的定義是「由人類(lèi)世界制造,為人類(lèi)世界制造」、「友好」、「無(wú)威脅,從事重復(fù)性/無(wú)聊的工作」。

Tesla Bot 的身高是 5'8"(約一米八),體重 56.7 公斤,可以硬拉 150 磅(68 公斤),或者搬運(yùn) 45 磅(20.4 公斤)的物體,伸開(kāi)手的狀態(tài)下可以拿 10 磅(4.5公斤)的物體,最高時(shí)速 8 公里。

這個(gè)數(shù)據(jù)就是一個(gè)竹竿型人類(lèi)的標(biāo)配,但作為即將發(fā)售的機(jī)器人,這也許更應(yīng)該是一串歷史素材。

圖片

Tesla Bot 全身具有 40 個(gè)電動(dòng)促動(dòng)器,臉上是顯示屏,全身由輕量化材料打造,手掌質(zhì)感接近真人。

哦對(duì)了,Tesla Bot 的腳板有傳感器,別亂踩人家。

圖片

至于「大腦」,Tesla Bot 將由 Autopilot 硬件驅(qū)動(dòng)(什么叫垂直整合啊),「眼睛」也會(huì)是 Autopilot 攝像頭,深度學(xué)習(xí)、DOJO 訓(xùn)練什么的一應(yīng)俱全。

馬斯克說(shuō)明年 Tesla Bot 的原型就將公布,「大家看我們只是在造車(chē),但其實(shí)我們也是全球最大的機(jī)器人公司——因?yàn)樘厮估能?chē)就像是輪子上的機(jī)器人,所以我們就造了真正的機(jī)器人?!?/span>

六、軟硬合一,進(jìn)度 50%?

寫(xiě)到最后一段,我的亢奮更甚了。

前天我在文章里提了一嘴:

「軟硬結(jié)合,是科技公司心目中的殿堂、王座、圣杯。但能實(shí)現(xiàn)這一點(diǎn),而且軟硬皆?xún)?yōu)的科技企業(yè),只有蘋(píng)果算一個(gè),AI Day 之后的特斯拉算半個(gè)——FSD 全球推送之后能補(bǔ)上另一半?!?/span>

今天的 AI Day 實(shí)在是太過(guò)于驚艷,以至于我真的很希望寫(xiě)下「軟硬合一」四個(gè)字,竭盡全力吹一把特斯拉。

但再想一下,我覺(jué)得現(xiàn)在下這個(gè)定論,似乎不太準(zhǔn)確。

特斯拉還沒(méi)有最終實(shí)現(xiàn)人工智能的軟硬合一,無(wú)論是汽車(chē)的自動(dòng)駕駛,還是機(jī)器人。FSD 還在 Beta、DOJO 也是上周才正常上機(jī)運(yùn)行、Tesla Bot 更是明年才有「原型」。

但光從硬件的角度看,今天的特斯拉,將人工智能的想象力拓寬了整整一大步,或者說(shuō)狠狠拉了一把進(jìn)度條。

如果說(shuō)前兩次年度發(fā)布會(huì),特斯拉車(chē)企的味道還很濃,那么今天的特斯拉,已經(jīng)開(kāi)始若有若無(wú)地,有一種游戲《賽博朋克 2077》里荒坂集團(tuán)的味道了——不是說(shuō)他大反派,而是類(lèi)似的創(chuàng)造力,以及每個(gè)細(xì)分領(lǐng)域的統(tǒng)治力。

真想快進(jìn)到萬(wàn)物 AI 的終局。

(完)

來(lái)源:第一電動(dòng)網(wǎng)

作者:電動(dòng)星球News蟹老板

本文地址:http://www.healthsupplement-reviews.com/kol/154195

返回第一電動(dòng)網(wǎng)首頁(yè) >

收藏
77
  • 分享到:
發(fā)表評(píng)論
新聞推薦
熱文榜
日排行
周排行
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢(xún)價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!
-->