【AI加速了技術(shù)迭代】
許多技術(shù)專家似乎在一件事上達(dá)成了共識:創(chuàng)新的速度從未如此之快。為什么呢?
很顯然,這是因為人工智能(AI)。如今,各方都在競相提供差異化的硬件解決方案,以便在邊緣端和數(shù)據(jù)中心實現(xiàn)優(yōu)化的人工智能性能。
數(shù)據(jù)科學(xué)家、人工智能系統(tǒng)架構(gòu)師、集成電路設(shè)計師、光學(xué)工程師、像Samtec這樣的互連供應(yīng)商以及其他解決方案提供商,都在重新思考系統(tǒng)拓?fù)浣Y(jié)構(gòu)。GPU集群、分解式計算、緩存一致性內(nèi)存、光互連和 200 Gbps 通道等,這些解決方案都在塑造著人工智能系統(tǒng)架構(gòu)。
鑒于這些現(xiàn)實情況,許多系統(tǒng)架構(gòu)師都在思考,PCIe 7.0?技術(shù) 128 GT/s 的原始比特率是否足夠快。考慮到 GPU到GPU 以及 GPU到CPU 的橋接協(xié)議已經(jīng)超過了 200 Gbps,這種質(zhì)疑似乎是合理的。很多人都在想,作為 GPU 到異構(gòu)計算處理器(XPU)互連的替代方案,PCIe 7.0 是否能夠跟上發(fā)展的步伐。
但這個問題問得合理嗎?
【PCIe 7.0 與 GPU到XPU 的應(yīng)用場景】
坦率地說,將 PCIe 7.0 技術(shù)與 GPU到XPU 的互連進(jìn)行比較,并不是一種公平的對等比較。確切地說,這就好比拿關(guān)公的青龍偃月刀和魯班的木工刨子作比較,兩者用途和設(shè)計初衷大相徑庭 。
PCI Express?(及其前身 PCI?)在傳統(tǒng)上用于將 x86 CPU 與通用計算應(yīng)用(如臺式機(jī)、筆記本電腦、工作站、服務(wù)器等)中的各種輸入 / 輸出(I/O)設(shè)備相連。通用計算 I/O 設(shè)備的例子可能包括顯卡、存儲設(shè)備、網(wǎng)絡(luò)適配器,甚至是人工智能加速器。
PCI-SIG?是一個擁有并管理 PCI 規(guī)范(作為開放行業(yè)標(biāo)準(zhǔn))的聯(lián)盟,該組織一直與成員公司合作,每三年將 PCIe 規(guī)范的性能提升一倍。按照計劃,PCIe 7.0 規(guī)范將于?2025年發(fā)布,目前他們正按計劃推進(jìn)。
現(xiàn)在讓我們來看看 “魯班的木工刨子” 這邊。GPU到XPU 的互連是為了實現(xiàn)高速的、點對點的 GPU到GPU 通信而設(shè)計的。在加速計算的早期版本中,系統(tǒng)架構(gòu)可能是每個 CPU 搭配一個 GPU。簡單來說,這是一種 1 個 CPU 對 1 個 GPU 的架構(gòu)。
隨著人工智能模型的發(fā)展,1 個 CPU 對多個 GPU(n 個 GPU)的架構(gòu)迅速出現(xiàn)。由于大語言模型(LLM)和其他模型擁有數(shù)萬億個參數(shù),因此需要將數(shù)千個 GPU “集群” 起來,以處理必要的并行計算。結(jié)果就是,GPU到XPU 的互連速度越來越快。目前,200 Gbps 的 GPU到XPU 互連已成為標(biāo)準(zhǔn)。
那么最終的結(jié)果是什么呢?PCIe 7.0 技術(shù)是太快了,還是一推出就會被淘汰呢?
這取決于你問的是誰。在Samtec看來,對于那些可在通用計算、加速計算以及不斷發(fā)展的人工智能系統(tǒng)拓?fù)浣Y(jié)構(gòu)之間實現(xiàn)數(shù)據(jù)傳輸的 I/O 應(yīng)用場景,PCIe 7.0 技術(shù)將對 GPU到 XPU的互連起到補充作用。
不過,問題來了,PCIe 7.0 技術(shù)的實際情況究竟如何呢?
【Samtec/Alphawave在128G?PAM4上的協(xié)同性】
簡而言之,支持 PCIe 7.0 的技術(shù)是真實存在的,并且已經(jīng)可以用于原型實現(xiàn)。在24年歐洲光通信會議(ECOC)上,以及后來在開放計算項目峰會(OCP)上,Alphawave Semi和Samtec展示了 128 Gbps PAM4 系統(tǒng)的協(xié)同性。該演示設(shè)置將Alphawave Semi的IP與Samtec的高性能互連產(chǎn)品相結(jié)合。
Alphawave Semi PipeCORE? PCI-Express PHY 將?128 GT/s 的數(shù)據(jù)傳輸?shù)接筛鞣N Samtec 高性能互連系統(tǒng)組成的?2.5 米多長的傳輸線上。盡管系統(tǒng)總長度超過 2.5 米,并有 8 個連接點,但仍實現(xiàn)了?e-10 或更好的出色的pre-FEC誤碼率(BER)。
NovaRay? I/O 面板安裝電纜系統(tǒng)是一種高速、高密度的電纜系統(tǒng),可提供約 4 Tbps 的總數(shù)據(jù)速率。它是為電纜到電纜的隔板面板連接而設(shè)計的。本次演示中的電纜組件長度為 2.0 米。
【小 結(jié)】
那么,PCIe? 7.0 技術(shù)的出現(xiàn)是否為時尚早呢?它的速度足夠快嗎?
答案沒辦法很絕對,但可以這么回答:PCIe 7.0 技術(shù)在合適的時間,將是用戶合適的解決方案。
因此,我們沒法錯過他~ 而正如上文所提到的那樣,Samtec早已準(zhǔn)備就緒!