作者 | 方文三
AI正逐步接近基礎設施發(fā)展的極限,系統(tǒng)設計的復雜性亦隨之從芯片工藝制程的極限轉移到了[計算能力-連接性-軟件]三者協(xié)同的架構上。
未來AI系統(tǒng)的挑戰(zhàn),不僅在于單顆芯片的計算能力,更在于系統(tǒng)層面的協(xié)同效率。
從計算、網(wǎng)絡、架構設計到軟件協(xié)同,唯有全棧式創(chuàng)新,才能真正釋放AI的潛能。
AMD收購初創(chuàng)公司布局硅光子芯片
近日,AMD公司宣布對硅光子技術初創(chuàng)企業(yè)Enosemi實施收購。
成立于2023年、員工規(guī)模僅為16人的Enosemi,將作為AMD在下一代AI芯片互連技術布局中的關鍵組成部分。
Enosemi致力于光子集成電路(PIC)的研發(fā)工作,其核心理念是將原本需要多個光學組件才能實現(xiàn)的功能,集成到單一芯片之中,實現(xiàn)光在芯片內(nèi)部的高速數(shù)據(jù)傳輸。
相較于傳統(tǒng)的電信號傳輸方式,光傳輸不僅速度更快,而且能耗更低,特別適合于數(shù)據(jù)中心、高性能計算以及AI等對帶寬和效率要求極高的應用領域。
此次收購的深層目的在于解決AI計算領域日益凸顯的[互連瓶頸]問題。
隨著AI模型規(guī)模的不斷擴大,芯片間的數(shù)據(jù)交互量迅猛增長,而傳統(tǒng)的電子連接方式已無法滿足帶寬和能耗的雙重需求。
為了充分釋放AI芯片的潛能,互連技術必須同步發(fā)展。
因此,CPO技術被越來越多的專業(yè)人士視為未來發(fā)展的關鍵。
過去,這類技術多停留在理論研究階段,但在AI技術發(fā)展的推動下,正快速向實際應用領域轉化。
AMD此次對Enosemi的收購,不僅僅是對光學研發(fā)團隊的補充,更是旨在解決AI計算能力[最后一公里]的問題。
這一步棋,對于AMD而言,是其在AI計算與通信領域關鍵環(huán)節(jié)上的一次重要布局。
此亦表明,在未來數(shù)據(jù)中心及AI集群構建過程中,AMD將不僅能夠提供中央處理器、圖形處理器、系統(tǒng)級芯片以及現(xiàn)場可編程門陣列,還能提供全面的系統(tǒng)級能力。
特別是在對計算密度要求極高的應用場景中,共封裝的光電子器件可能會成為決定系統(tǒng)性能上限的關鍵因素。
Enosemi的核心技術——光子集成電路(Photonic Integrated Circuits,PICs),將使AMD在服務器機架內(nèi)部實現(xiàn)更為迅速的信號傳輸與更低的能耗。
這對于應對日益增長的AI模型訓練與推理需求而言,是不可或缺的能力。
相較于傳統(tǒng)電氣互連方式,CPO能夠提供更高的帶寬密度和更卓越的能效表現(xiàn)。
這標志著系統(tǒng)架構的根本性變革,使得計算與網(wǎng)絡之間的融合更為緊密,從而滿足高性能AI工作負載所需的計算能力與可擴展性。
Enosemi的加入,將有助于AMD迅速增強其在CPO領域的產(chǎn)品開發(fā)能力,縮短研發(fā)周期,提升產(chǎn)品系統(tǒng)性能,從而更有力地應對英偉達在AI服務器系統(tǒng)、GPU互連等領域的領先地位。
業(yè)界專家指出,AMD通過并購Enosemi,進一步鞏固了其在光子計算及AI加速技術方面的領先地位。
此舉將有助于提升未來AI芯片的性能與能效,以滿足市場需求的迅猛增長。
AMD正致力于在AI時代重塑其企業(yè)形象,從芯片制造商轉型為AI系統(tǒng)解決方案的提供者。
此次對Enosemi的收購,不僅彌補了公司在光通信領域的不足,也標志著AI硬件競爭已進入下一階段——系統(tǒng)全棧競爭。
面對英偉達在市場上的主導地位日益穩(wěn)固,AMD采取了高效整合生態(tài)資源、持續(xù)進行技術并購以及系統(tǒng)化能力建設的策略,以期打破現(xiàn)狀。
在AI基礎設施的升級競賽中,Enosemi的加入可能僅是序幕。
傳統(tǒng)巨頭轉型機遇與新興企業(yè)彎道超車
盡管AMD在AI芯片領域持續(xù)努力,但在與英偉達的競爭中,AMD似乎始終未能達到與其相當?shù)乃健?/p>
舉例來說,在性能相近的情況下,AMD的ROCm平臺相較于英偉達的CUDA和cuDNN平臺,其普及度和成熟度尚有差距,因此在應用生態(tài)更為豐富的英偉達面前,自然成為了首選。
鑒于此,AMD 只能尋求在性能上取得突破。CPO技術的核心優(yōu)勢在于其速度。
隨著AI模型復雜度的增加,[更快、更高效的數(shù)據(jù)傳輸]變得尤為重要。
據(jù)業(yè)界預測,到2027年,CPO技術在超大規(guī)模數(shù)據(jù)中心的普及率預計將達35%,有望成為取代傳統(tǒng)可插拔光模塊的主流解決方案。
若AMD能在短時間內(nèi)率先實現(xiàn)CPO技術的商業(yè)化應用,無疑將開啟新的市場機遇。
在硅光子領域,諸如英特爾、英偉達等業(yè)界巨頭實際上比AMD更早地進行了布局。
對于英特爾、思科等傳統(tǒng)科技巨頭而言,硅光子芯片帶來了轉型與持續(xù)引領市場的重大機遇。
雖然目前量子計算市場還處于發(fā)展初期,但Xanadu憑借其在硅光子芯片技術上的領先優(yōu)勢,已經(jīng)吸引了眾多投資者和合作伙伴的關注,有望在未來的量子計算市場中占據(jù)一席之地。
英特爾已交付超過八百萬個光子集成電路,其1.6Tbps CPO模塊的帶寬密度相較于傳統(tǒng)方案實現(xiàn)了40%的提升;
英偉達將硅光子技術整合至交換機與GPU集群中,打造了光電融合的數(shù)據(jù)平臺。
在AI加速領域,英偉達借助Mellanox確立了Infiniband高速網(wǎng)絡的基礎,并通過BlueField推動了智能網(wǎng)卡的發(fā)展。
此外,通過自主研發(fā)的硅光子平臺,公司成功推出了具備400TB/s交換能力的架構,從而構建了一個完整的、圍繞AI數(shù)據(jù)中心架構的生態(tài)系統(tǒng)。
英偉達最新推出的Blackwell架構和NVLink交換系統(tǒng),正是建立在高帶寬和低延遲的光互連技術基礎之上。
自2016年推出硅光子平臺以來,英特爾已向市場交付超過800萬個光子集成電路(PIC)和超過320萬個集成片上激光器,這些產(chǎn)品已被眾多大型云服務提供商所采用。
英特爾的硅光技術采用CMOS制造工藝,將激光器、調制器、探測器等光學器件與電路集成在同一硅基片上,實現(xiàn)了電子與光學的融合。
該技術支持波分復用(WDM)技術,允許單根光纖同時傳輸多種波長的光信號。
同時,它還具備高效的光電轉換技術,使得硅光模塊在數(shù)據(jù)中心等應用場景中能夠提供高性能的互連解決方案。
英特爾之前推出的100G和400G硅光模塊已經(jīng)實現(xiàn)了大規(guī)模商用。
公司正與云計算巨頭和網(wǎng)絡設備制造商合作,推動硅光技術的標準化和普及。
英偉達還推出了新的生成式AI算法,增強了GPU加速計算光刻庫cuLitho,與基于CPU的傳統(tǒng)方法相比,顯著提升了半導體制造工藝。
在本年度的GTC大會上,英偉達發(fā)布了Spectrum-X Photonics,推出了一體化封裝的光學網(wǎng)絡交換機,將AI工廠擴展至數(shù)百萬GPU。
與傳統(tǒng)方法相比,這些產(chǎn)品集成了光學創(chuàng)新技術,激光器數(shù)量減少了四分之三,從而實現(xiàn)了能效提升3.5倍、信號完整性提升63倍、大規(guī)模網(wǎng)絡彈性提升10倍以及部署速度提升1.3倍的顯著優(yōu)勢。
思科作為網(wǎng)絡設備領域的領導者,也敏銳地抓住了硅光子芯片帶來的機遇。
通過收購硅光子學芯片專家Luxtera等公司,思科迅速獲取了硅光子芯片技術,并將其應用于自家的網(wǎng)絡設備中。
在電信行業(yè),思科公司占據(jù)了接近一半的市場份額,Lumentum和Marvel緊隨其后。
相干可插拔ZR/ZR+模塊促進了電信硅光市場的增長。
以Lightmatter為代表的新興企業(yè),則借助硅光子芯片技術實現(xiàn)了彎道超車,對行業(yè)格局產(chǎn)生了強大的沖擊。
Lightmatter專注于硅光子芯片在AI領域的應用,研發(fā)出了高性能的硅光子芯片和光子互連技術。
推出的Envise芯片結合了光子學和基于晶體管的系統(tǒng),能夠為AI工作負載提供強大的計算支持。
通過與云服務提供商和芯片制造商合作,Lightmatter 的技術得到了廣泛應用,推動了AI計算性能的提升。
短短幾年間,Lightmatter 就獲得了數(shù)億美元的融資,估值大幅提升,成為了硅光子芯片領域的一顆耀眼新星,打破了傳統(tǒng)芯片企業(yè)在AI計算領域的壟斷格局。
另一家新興企業(yè)Xanadu則專注于量子計算領域的硅光子芯片研發(fā)。
量子計算被認為是未來計算領域的重要發(fā)展方向,硅光子芯片在量子計算中具有獨特的優(yōu)勢。
Xanadu通過創(chuàng)新的設計和技術突破,研發(fā)出了適用于量子計算的硅光子芯片,為量子計算機的小型化和實用化提供了可能。
結尾:
盡管硅光子技術的發(fā)展前景廣闊,但其發(fā)展仍遭遇三大主要障礙:
首先是熱管理問題:在光子器件與計算芯片共同封裝的過程中,由于發(fā)熱導致硅波導折射率發(fā)生漂移,因此需要開發(fā)新型的熱補償算法。
其次是產(chǎn)業(yè)鏈成熟度不足:關鍵組件如連續(xù)波激光器、鍺硅探測器等尚未實現(xiàn)標準化,其成本占光模塊總成本的比重高達60%。
第三是生態(tài)協(xié)作需求較高:需要構建一個跨芯片制造商、光模塊供應商以及云服務提供商的開放聯(lián)盟,以統(tǒng)一CPO接口標準等。
部分資料參考:維科網(wǎng)光通訊:《AMD收購硅光[黑馬]》,科技圈觀察:《半導體巨頭再出手:收購硅光子初創(chuàng)企業(yè)Enosemi》,鎂客網(wǎng):《硅光子芯片,AMD不想缺席》