當(dāng)今越來越多的行業(yè)朝著智能化方向轉(zhuǎn)移,擁有百年歷史的汽車行業(yè)也不例外。汽車制造商、供應(yīng)商、初創(chuàng)公司等正接受著這股浪潮的洗禮,向自動(dòng)駕駛時(shí)代前進(jìn)。
蔚來是一家全球化的智能電動(dòng)汽車公司,于 2014 年 11 月 25 日正式成立。蔚來致力于通過提供高性能的智能電動(dòng)汽車與極致用戶體驗(yàn),為用戶創(chuàng)造愉悅的生活方式。蔚來采用了?NVIDIA DRIVE Orin 系統(tǒng)級(jí)芯片構(gòu)建自主研發(fā)的新一代自動(dòng)駕駛平臺(tái),其在智能電動(dòng)汽車領(lǐng)域始終保持領(lǐng)先的自動(dòng)駕駛研發(fā)水平,滿足軟件定義車輛的 AI 基礎(chǔ)架構(gòu)和車內(nèi)計(jì)算需求。
?
圖片來源于蔚來
自動(dòng)駕駛面臨算力挑戰(zhàn)
自動(dòng)駕駛汽車的開發(fā)是一項(xiàng)需要大量加速計(jì)算基礎(chǔ)架構(gòu)的計(jì)算密集型工作。為了在更多場(chǎng)景中為用戶提供極致的駕乘體驗(yàn),完成更高等級(jí)的自動(dòng)駕駛算法落地,軟件定義汽車需要實(shí)現(xiàn)冗余、配置多種高分辨率傳感器并應(yīng)用深度神經(jīng)網(wǎng)絡(luò)。這些因素都將帶來對(duì)強(qiáng)大計(jì)算能力的需求,以便能夠處理所有 AI 工作負(fù)載。
另外,研發(fā)所用的數(shù)據(jù)采集車每年會(huì)產(chǎn)生百 PB 級(jí)別的數(shù)據(jù)以及幾十億張圖像,量產(chǎn)車也需要回流海量的道路數(shù)據(jù),用于優(yōu)化算法模型,這意味著車企的數(shù)據(jù)中心需要具備回流、篩選和標(biāo)注海量用于 AI 模型訓(xùn)練的數(shù)據(jù)的能力。
成功的規(guī)?;夹g(shù)應(yīng)用離不開穩(wěn)健的技術(shù)基礎(chǔ)架構(gòu),包括覆蓋全場(chǎng)景鏈路的人工智能平臺(tái)和大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)在內(nèi),蔚來汽車采用NVIDIA GPU自主研發(fā)了一整套自動(dòng)駕駛基礎(chǔ)架構(gòu)體系,支持復(fù)雜的深度學(xué)習(xí)模型迭代以及全流程快速迭代,為自動(dòng)駕駛算法閉環(huán)提供堅(jiān)實(shí)支撐。
NVIDIA 賦能超級(jí)計(jì)算機(jī)
蔚來的超級(jí)計(jì)算機(jī)由 NVIDIA HGX A100 8-GPU 和 NVIDIA Mellanox InfiniBand ConnectX-6 構(gòu)建。超級(jí)計(jì)算機(jī)集群包括超級(jí)計(jì)算機(jī)和搭配 NVIDIA Mellanox InfiniBand ConnectX-6 的高性能 NVME SSD 服務(wù)器,通過 NVIDIA Mellanox InfiniBand 高速網(wǎng)絡(luò)相連,且規(guī)模不斷擴(kuò)大。
通過合理使用 NVIDIA Multi-Instance GPU,使得算法工程師在開發(fā)過程中的工作效率和集群資源利用率得到了巨大提升。同時(shí),蔚來在 NVIDIA NVLink 和 NVIDIA Mellanox InfiniBand 的基礎(chǔ)上構(gòu)建了支持多卡和多機(jī)訓(xùn)練的深度學(xué)習(xí)訓(xùn)練框架,使用 NVIDIA Mellanox InfiniBand 和基于 NVIDIA Mellanox InfiniBand 的 RDMA 技術(shù),構(gòu)建了分布式的高性能文件讀取加速套件。在數(shù)據(jù)驅(qū)動(dòng)應(yīng)用的場(chǎng)景下,使得大量的深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)能夠以高達(dá) 200 Gbps 的超高速率零拷貝傳輸至超級(jí)計(jì)算機(jī)內(nèi)存或 NVIDIA A100 顯存中,進(jìn)一步穩(wěn)固了自動(dòng)駕駛平臺(tái)的基礎(chǔ)服務(wù)架構(gòu)。
另外,每個(gè)端上配備 4 顆?NVIDIA DRIVE Orin 系統(tǒng)級(jí)芯片,具備 8096 個(gè) CUDA 核心,為量產(chǎn)車提供了前所未有的超 1000 TOPS 算力。DRIVE Orin?系統(tǒng)級(jí)芯片集成了 NVIDIA Ampere 架構(gòu)和 Arm Hercules CPU 內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器,總計(jì)每秒可運(yùn)行超過 254 萬億次計(jì)算,幾乎是 NVIDIA?上一代 Xavier 系統(tǒng)級(jí)芯片性能的 7 倍。Orin?可處理在自動(dòng)駕駛汽車內(nèi)同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了 ISO 26262 ASIL-D 等系統(tǒng)安全標(biāo)準(zhǔn)。
借助?DRIVE Orin?強(qiáng)大的性能優(yōu)勢(shì),蔚來能夠?yàn)榘踩淖詣?dòng)駕駛功能提供所必需的冗余和靈活性,讓駕乘體驗(yàn)安心舒適。
蔚來的首款轎車ET7 是具備自動(dòng)駕駛能力的智能電動(dòng)旗艦轎車。ET7 應(yīng)用了最新的蔚來自動(dòng)駕駛技術(shù)NAD(NIO Autonomous Driving)。蔚來超算平臺(tái)Adam搭載四顆NVIDIA DRIVE Orin,算力高達(dá)1016 TOPS,是迄今為止最強(qiáng)大的量產(chǎn)移動(dòng)計(jì)算平臺(tái)。蔚來建立了全棧自動(dòng)駕駛技術(shù)能力,將逐步實(shí)現(xiàn)高速、城區(qū)、停車、加電等場(chǎng)景下輕松安全的點(diǎn)到點(diǎn)自動(dòng)駕駛體驗(yàn)。
加速自動(dòng)駕駛產(chǎn)品落地
NVIDIA HGX A100 是適用于龐大數(shù)據(jù)集、復(fù)雜模型等 AI 場(chǎng)景的加速服務(wù)器平臺(tái)。HGX A100 整合 NVIDIA Ampere GPU、NVIDIA NVLink、NVIDIA Mellanox InfiniBand 網(wǎng)絡(luò)及在 NGC(NVIDIA GPU Cloud)中經(jīng)全面優(yōu)化的 NVIDIA AI 軟件堆棧。同時(shí),它樹立了新的計(jì)算密度標(biāo)桿,將 5 PETAFLOPS 的 AI 性能濃縮,并用一個(gè)平臺(tái)取代了各種 AI 工作負(fù)載的傳統(tǒng)孤島式基礎(chǔ)架構(gòu)。借助 HGX A100,蔚來以縱向擴(kuò)展和橫向擴(kuò)展方式自由搭建并應(yīng)用 AI 平臺(tái),也讓蔚來的模型開發(fā)效率提高了 20 倍,幫助蔚來更快的落地自動(dòng)駕駛產(chǎn)品,向更新更快的架構(gòu)演進(jìn)。
另一方面,NVIDIA DGX POD 參考架構(gòu)結(jié)合 NVIDIA 加速計(jì)算架構(gòu)、Mellanox 網(wǎng)絡(luò)架構(gòu)和系統(tǒng)管理軟件?;诖耍祦韺?shí)現(xiàn)了提供使超級(jí)計(jì)算能力大眾化的解決方案,使超級(jí)計(jì)算能力變得易于訪問、安裝和管理,從而滿足自動(dòng)駕駛復(fù)雜架構(gòu)的需求。
高性能 AI 計(jì)算是蔚來汽車自動(dòng)駕駛技術(shù)的重要組成部分,在?NVIDIA?DRIVE?端到端解決方案的強(qiáng)力支持下,蔚來可以通過龐大的道路實(shí)際數(shù)據(jù)來演進(jìn)設(shè)計(jì)新的自動(dòng)駕駛功能,持續(xù)為車主提供安心的駕駛體驗(yàn)。
NVIDIA?致力于提供領(lǐng)先的技術(shù)和解決方案,幫助汽車制造商加速開發(fā)和軟件定義汽車的生產(chǎn)落地。
蔚來 AI 平臺(tái)負(fù)責(zé)人白宇利表示:“量產(chǎn)車面臨的復(fù)雜場(chǎng)景是蔚來自動(dòng)駕駛能力的試金石,同時(shí),量產(chǎn)車產(chǎn)生的海量數(shù)據(jù)也是也是蔚來自動(dòng)駕駛能力護(hù)城河。NVIDIA?的高性能計(jì)算解決方案,成為了蔚來在自動(dòng)駕駛這條道路上的加速器?!?/p>