作者:北京華興萬(wàn)邦管理咨詢(xún)有限公司 翔煜 商瑞
智能汽車(chē)時(shí)代的加速到來(lái),使車(chē)載智能系統(tǒng)面臨前所未有的算力需求。隨著越來(lái)越多車(chē)型引入電子電氣架構(gòu)轉(zhuǎn)向中心化、智能駕駛的多傳感器融合、智能座艙的多模態(tài)交互以及生成式AI驅(qū)動(dòng)的虛擬助手等創(chuàng)新技術(shù),都要求車(chē)用主芯片能夠同時(shí)勝任圖形渲染、AI推理和安全計(jì)算等多重任務(wù)。當(dāng)下,功能安全、高效高靈活性的算力、產(chǎn)品生命周期,以及軟件生態(tài)兼容性這“四大核心要素”,已成為衡量智能汽車(chē)AI芯片創(chuàng)新力和市場(chǎng)競(jìng)爭(zhēng)力的核心標(biāo)準(zhǔn)。
傳統(tǒng)汽車(chē)計(jì)算架構(gòu)中,往往采用CPU與GPU或/和NPU等計(jì)算單元組成異構(gòu)計(jì)算模式;隨著自動(dòng)駕駛算法從L1向L5快速演進(jìn)對(duì)軟件適配性的要求越來(lái)越高,以及不斷有新的傳感器和信息娛樂(lè)設(shè)備加入車(chē)內(nèi),不同的架構(gòu)開(kāi)始出現(xiàn)不同的發(fā)展軌跡。同時(shí),系統(tǒng)復(fù)雜性快速提升、大量的數(shù)據(jù)搬運(yùn)、資源調(diào)度協(xié)同難度提升和軟件快速迭代等新挑戰(zhàn)開(kāi)始出現(xiàn),使缺乏靈活性的硬件架構(gòu)成為了在技術(shù)、安全和成本等多個(gè)方面制約汽車(chē)智能化發(fā)展的瓶頸。
市場(chǎng)急需一種既能靈活地提供高性能、高效圖形與AI加速能力,同時(shí)滿足功能安全標(biāo)準(zhǔn)、可與廣泛的軟件生態(tài)對(duì)接且總成本更低的車(chē)用芯片架構(gòu)。
功能安全不僅關(guān)乎安全也是芯片成本控制關(guān)鍵
功能安全永遠(yuǎn)是消費(fèi)者、主機(jī)廠、Tier-1和芯片供應(yīng)商首先關(guān)心的問(wèn)題,但它并不是一個(gè)智能駕駛技術(shù)快速發(fā)展進(jìn)程中才出現(xiàn)的問(wèn)題;行業(yè)已經(jīng)形成了完善的ISO26262標(biāo)準(zhǔn)和ASIL認(rèn)證體系,以及鎖步(Lock-Step)和雙套硬件結(jié)果對(duì)比等解決方案。但是隨著車(chē)用芯片中的CPU、GPU和NPU越來(lái)越復(fù)雜并占用更大面積,這些原本為MCU提供的功能安全解決方案的硅成本和復(fù)雜性都大幅提升,因此市場(chǎng)需要在汽車(chē)芯片功能安全解決方案領(lǐng)域?qū)崿F(xiàn)創(chuàng)新。
作為汽車(chē)電子領(lǐng)域的一項(xiàng)創(chuàng)新產(chǎn)品,Imagination DXS GPU IP專(zhuān)注于智能座艙與自動(dòng)駕駛場(chǎng)景的深度優(yōu)化,其設(shè)計(jì)充分體現(xiàn)了業(yè)界近期在功能安全方面的巨大突破,同時(shí)確保了性能的提升、安全性的增強(qiáng)以及芯片成本的有效控制。Imagination DXS GPU的峰值性能較前一代產(chǎn)品提升了50%,算力從單核的0.25TFLOPS擴(kuò)展至1.5TFLOPS,最高可達(dá)6TFLOPS和24TOPS,同時(shí)支持高達(dá)192GPixel/s的圖形渲染速率。
在功能安全的實(shí)現(xiàn)上,Imagination DXS GPU采用了針對(duì)GPU運(yùn)算開(kāi)放的分布式安全機(jī)制(DSM),僅以10%的面積開(kāi)銷(xiāo)就實(shí)現(xiàn)了ISO 26262 ASIL-B功能安全認(rèn)證。DSM利用了處理器的并行特性,在空閑周期運(yùn)行安全測(cè)試,既保證了性能不受影響,又確保了安全,打破了鎖步和備份等傳統(tǒng)安全設(shè)計(jì)的局限性。這一創(chuàng)新設(shè)計(jì)從架構(gòu)層面闡釋了功能安全領(lǐng)域仍然存在著許多創(chuàng)新機(jī)會(huì),可以幫助越來(lái)越先進(jìn)的GPU在安全保障、系統(tǒng)復(fù)雜性、成本控制與下游廠商獲得認(rèn)證等多個(gè)方面創(chuàng)造價(jià)值。
正是因?yàn)镮magination DXS GPU在功能安全性和計(jì)算性能等方面實(shí)現(xiàn)了開(kāi)創(chuàng)性的突破,在2025年5月于上海舉辦的 “第十二屆汽車(chē)電子創(chuàng)新大會(huì)暨汽車(chē)芯片產(chǎn)業(yè)生態(tài)發(fā)展論壇(AEIF 2025)”上,Imagination DXS GPU IP憑借其創(chuàng)新的、先進(jìn)的GPU技術(shù),
榮獲“2025 汽車(chē)電子?金芯獎(jiǎng)-新銳產(chǎn)品”殊榮。據(jù)了解,從該公司的D系列GPU IP產(chǎn)品開(kāi)始,包括最新的公布了架構(gòu)的E系列中的車(chē)用GPU IP都將采用這種成本和復(fù)雜性都具有明顯優(yōu)勢(shì)的分布式功能安全機(jī)制。目前,DXS GPU IP已集成于瑞薩R-Car Gen 5系列SoC中,助力智能駕駛技術(shù)的商業(yè)應(yīng)用,滿足從入門(mén)級(jí)到旗艦車(chē)型的全方位需求。
高靈活性的高效算力是車(chē)用處理器的核心功能
對(duì)于車(chē)用芯片設(shè)計(jì)企業(yè),為了處理越來(lái)越復(fù)雜的AI計(jì)算和圖形渲染,在其計(jì)算芯片中采用GPU或者NPU這樣的并行處理器成為了必然;然而隨著汽車(chē)電子電氣架構(gòu)從域控制轉(zhuǎn)向中央控制,車(chē)用核心處理器不僅需要更高的算力,而且還需要針對(duì)不同的應(yīng)用可以在架構(gòu)上靈活地進(jìn)行優(yōu)化,也就是需要性能更高、同時(shí)又不會(huì)被鎖死在NPU或者GPU架構(gòu)上的靈活架構(gòu),這也成了汽車(chē)和其他很多邊緣AI應(yīng)用中高性能并行計(jì)算的發(fā)展方向。
對(duì)于這種可以針對(duì)應(yīng)用進(jìn)行優(yōu)化和定義的并行計(jì)算處理器架構(gòu),依然是Imagination憑借其技術(shù)前瞻性和能力,而重新定義了面向汽車(chē)和端側(cè)AI的高性能并行計(jì)算行業(yè)標(biāo)準(zhǔn)。2025年5月,Imagination推出了專(zhuān)為端側(cè)智能場(chǎng)景設(shè)計(jì)的新一代E系列(E-Series) GPU IP架構(gòu),該系列GPU憑借其高效的并行處理架構(gòu),在提供卓越圖形性能的同時(shí),針對(duì)人工智能工作負(fù)載具備靈活算力擴(kuò)展能力。
E系列GPU架構(gòu)集成了神經(jīng)核(Neural Cores)和爆發(fā)式處理器(Burst Processors),支持算力從2TOPS靈活擴(kuò)展至200TOPS(INT8/FP8),滿足從基礎(chǔ)端側(cè)計(jì)算到高階智駕的多樣化算力需求。這樣的架構(gòu)設(shè)計(jì)使Imagination E系列GPU同時(shí)具有了NPU的高性能和GPU的高靈活性;通過(guò)優(yōu)化指令調(diào)度和數(shù)據(jù)復(fù)用機(jī)制,端側(cè)計(jì)算的平均功耗效率提升了 35%,在相同算力條件下,車(chē)載系統(tǒng)的功耗降低了20%。
這種高效且靈活的AI算力及圖形處理功能調(diào)配,完美貼合了在包括汽車(chē)在內(nèi)的端側(cè)AI場(chǎng)景中同時(shí)存在大量的AI計(jì)算與圖形處理需求的應(yīng)用,優(yōu)化了中央計(jì)算模式下核心車(chē)用芯片同時(shí)處理駕駛和座艙需求的性能與能耗。此外,通過(guò)升級(jí)硬件級(jí)虛擬化技術(shù),E系列GPU IP支持多達(dá)16個(gè)虛擬機(jī)任務(wù)隔離,實(shí)現(xiàn)了AI、圖形、UI等多任務(wù)的異步并行處理,確保了智能座艙多系統(tǒng)協(xié)同工作和自動(dòng)駕駛多任務(wù)并行處理的車(chē)用場(chǎng)景需求。以“高靈活性的高效算力”為核心,E-Series GPU不僅滿足了未來(lái)智能汽車(chē)車(chē)用處理器的算力需求,并推動(dòng)了汽車(chē)智能化體驗(yàn)的進(jìn)一步提升。
更長(zhǎng)的產(chǎn)品生命周期:GPU 架構(gòu)的可編程性打破總成本困局
隨著智能駕駛和智能座艙技術(shù)從旗艦車(chē)型向中低端車(chē)型的滲透,主機(jī)廠對(duì)芯片成本的嚴(yán)格控制正在推動(dòng)行業(yè)打破傳統(tǒng)開(kāi)發(fā)模式的局限性。根據(jù)行業(yè)數(shù)據(jù),傳統(tǒng)車(chē)用計(jì)算芯片的開(kāi)發(fā)成本高達(dá)2億-3億美元,研發(fā)周期長(zhǎng)達(dá)3~5年。在算法需要迭代時(shí),固定功能架構(gòu)的NPU芯片必須重新流片,每次迭代的成本占到初始開(kāi)發(fā)費(fèi)用的40%~50%。這種“高投入、長(zhǎng)周期、低彈性”的開(kāi)發(fā)模式,在主機(jī)廠追求“一款芯片滿足多車(chē)型10年生命周期”的目標(biāo)面前,明顯暴露出成本上的限制。
因此,相對(duì)于從架構(gòu)到功能都基本固定的基于NPU車(chē)用控制芯片,采用GPU IP的車(chē)用芯片可以更加從容地去面對(duì)這樣的總成本壓力,因?yàn)椴捎肎PU的硬件設(shè)計(jì)可以通過(guò)更高的可編程性來(lái)實(shí)現(xiàn)跨算法、跨廠商和跨車(chē)型應(yīng)用,用更大數(shù)量的市場(chǎng)應(yīng)用來(lái)攤低高昂的芯片研發(fā)成本,因而基于GPU架構(gòu)的車(chē)用芯片比基于NPU的車(chē)用芯片擁有更長(zhǎng)的產(chǎn)品生命周期和更高的應(yīng)用靈活性。
當(dāng)然,如果車(chē)用芯片中GPU本身的AI計(jì)算與圖形處理能力就可以靈活配置,那么還會(huì)帶來(lái)更高的成本節(jié)省和更長(zhǎng)的產(chǎn)品生命周期。以Imagination在其GPU IP產(chǎn)品中推動(dòng)的可編程泛化架構(gòu)以及由此開(kāi)發(fā)的E系列GPU為例,其通過(guò)軟件定義硬件的設(shè)計(jì),可將芯片硬件生命周期延長(zhǎng)至10年以上:當(dāng)AI模型升級(jí)時(shí),僅需數(shù)月軟件適配即可完成迭代,較傳統(tǒng)NPU迭代方案大幅減少。這種統(tǒng)一計(jì)算單元設(shè)計(jì)可跨汽車(chē)、工業(yè)等幾大場(chǎng)景復(fù)用,硬件設(shè)計(jì)成本降低40%,研發(fā)投入回收周期顯著縮短。
開(kāi)放軟件生態(tài):一次開(kāi)發(fā)、多場(chǎng)景部署
軟件生態(tài)和可適配性正在變成各種高性能計(jì)算的重要門(mén)檻,英偉達(dá)的CUDA生態(tài)使其在AI計(jì)算和汽車(chē)芯片方面占盡了先機(jī)。因此,其他的汽車(chē)和端側(cè)AI芯片廠商要在市場(chǎng)中斬獲更多份額,就需要其核心計(jì)算單元IP提供商構(gòu)建更加開(kāi)放的軟件生態(tài);隨著諸多基于此目的的標(biāo)準(zhǔn)組織不斷建立和壯大,其中的主要玩家正在支持新一代車(chē)用芯片開(kāi)發(fā)商解決軟件生態(tài)的問(wèn)題。
例如,Imagination就構(gòu)建了一個(gè)面向未來(lái)的開(kāi)放體系,其核心優(yōu)勢(shì)在于“一次開(kāi)發(fā),多場(chǎng)景部署”。其算力可以通過(guò)OpenCL、Vulkan等主流API直接調(diào)用,開(kāi)發(fā)者利用oneAPI、Apache TVM等工具鏈,可以輕松地將工作負(fù)載遷移到E系列GPU中的神經(jīng)核。這種可編程性不僅大幅降低了跨平臺(tái)開(kāi)發(fā)的成本,還賦予了設(shè)備適應(yīng)未來(lái)算法變革的靈活性。面對(duì)生成式AI、多模態(tài)交互等前沿應(yīng)用的快速迭代,E系列GPU無(wú)需硬件迭代,僅通過(guò)軟件升級(jí)就能迅速適應(yīng),確保產(chǎn)品持續(xù)滿足新興需求。
在自動(dòng)駕駛領(lǐng)域,Imagination的GPU IP同樣遵循“一次開(kāi)發(fā),多場(chǎng)景部署”的理念。通過(guò)集成FP16流水線以及imgBLAS、imgNN等高效計(jì)算庫(kù),顯著提升了雷達(dá)點(diǎn)云數(shù)據(jù)、視覺(jué)SLAM等傳感器數(shù)據(jù)的處理速度,有效減輕了CPU和NPU的負(fù)擔(dān)。同時(shí),通過(guò)與OpenCL、Vulkan等開(kāi)放標(biāo)準(zhǔn)以及CoreAVI安全驅(qū)動(dòng)的兼容,確保了在復(fù)雜場(chǎng)景下系統(tǒng)的實(shí)時(shí)響應(yīng)和穩(wěn)定運(yùn)行,使技術(shù)能力貫穿智能座艙、自動(dòng)駕駛等多個(gè)場(chǎng)景,鞏固了跨場(chǎng)景部署的技術(shù)基礎(chǔ)。
結(jié)語(yǔ)
從Imagination的E系列GPU等產(chǎn)品實(shí)現(xiàn)的架構(gòu)創(chuàng)新來(lái)看,用于智能汽車(chē)等端側(cè)應(yīng)用的AI芯片也在重塑其技術(shù)邏輯,更揭開(kāi)了端側(cè)AI計(jì)算革命的序幕。在智能汽車(chē)領(lǐng)域,功能安全、高效靈活的算力、生命周期管理與開(kāi)放軟件生態(tài)這四大要素構(gòu)建的技術(shù)護(hù)城河,正推動(dòng)行業(yè)從“硬件堆砌”向“智能進(jìn)化”轉(zhuǎn)型;而在更廣闊的端側(cè) AI場(chǎng)景中,,這種“軟件定義硬件”的理念正在幫助消費(fèi)電子、工業(yè)物聯(lián)網(wǎng)、智慧城市和智能商業(yè)等邊緣計(jì)算等領(lǐng)域全面擁抱AI技術(shù)。
這種變革的深層意義,在于打破了“云-邊-端”的技術(shù)壁壘。當(dāng)智能汽車(chē)的GPU架構(gòu)能夠通過(guò)軟件升級(jí)支持智慧城市的交通調(diào)度算法,當(dāng)工業(yè)設(shè)備的計(jì)算單元可復(fù)用至消費(fèi)電子的AI交互場(chǎng)景,端側(cè)AI正從單一功能模塊進(jìn)化為“可生長(zhǎng)的智能體”??蛇M(jìn)化的端側(cè)芯片將如同今日的CPU般,成為所有智能設(shè)備的“數(shù)字大腦”。