• 正文
    • 1、英偉達(dá)NVL72機(jī)柜:算力基礎(chǔ)設(shè)施的新突破
    • 2、DeepSeek:開源模型引領(lǐng)中國AI實驗室崛起
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

英偉達(dá)NVL72機(jī)柜單爆火,DeepSeek成全球第二大AI實驗室

18小時前
410
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

人工智能領(lǐng)域快速發(fā)展的當(dāng)下,英偉達(dá)與DeepSeek分別在硬件和模型研發(fā)層面取得了重大進(jìn)展,為行業(yè)的未來走向帶來深遠(yuǎn)影響。

1、英偉達(dá)NVL72機(jī)柜:算力基礎(chǔ)設(shè)施的新突破

英偉達(dá)NVL72機(jī)柜的加速出貨,為全球AI算力市場注入了強(qiáng)大動力。主流超大規(guī)模云廠商平均每周部署近1,000個NVL72機(jī)柜,且出貨節(jié)奏仍在持續(xù)加快 。NVL72機(jī)柜作為英偉達(dá)推出的機(jī)柜級超節(jié)點,在硬件配置與性能表現(xiàn)上亮點十足。

從硬件架構(gòu)來看,整個系統(tǒng)由18個Compute Tray和9個Switch Tray構(gòu)成。每個Compute Tray包含2個GB200超級芯片,每個GB200超級芯片又有2個Blackwell系列的B200 GPU,這使得整個機(jī)柜共擁有72個Blackwell GPU。并且每個Compute Tray還提供4個網(wǎng)絡(luò)接口卡用于Scale-out方向的擴(kuò)展,以滿足不同場景下的網(wǎng)絡(luò)需求。

在Switch Tray方面,1個Switch Tray包含2顆NVLINK Switch芯片,整個機(jī)柜共提供18個NVLink Switch芯片,整機(jī)柜后部通過線纜將Compute Tray和Switch Tray進(jìn)行互聯(lián),構(gòu)建起了一個高效的數(shù)據(jù)傳輸網(wǎng)絡(luò)。

性能上,B200采用最新一代的NVLink 5連接方案,對外可提供1.8TB/s(NVIDIA采用雙向計算,即單向7.2Tb/s)的NVLink連接,單個Compute Tray提供7.2TB/s(單向28.8Tb/s)帶寬,NVL72整機(jī)柜的Compute Tray提供129.6TB/S的NVLink帶寬。

而NVLink5 Switch對外可提供7.2TB/s(單向28.8Tb/s)的NVLink連接,單個Switch Tray提供14.4TB/s(單向57.6Tb/s)帶寬,NVL72整機(jī)柜的Switch Tray同樣提供129.6TB/s的NVLink帶寬,如此一來,超節(jié)點整機(jī)柜Compute Tray的GPU和Switch Tray的交換芯片之間就能夠?qū)崿F(xiàn)全連接,極大地提升了數(shù)據(jù)傳輸效率,解決了GPU之間的高速通信帶寬和效率問題。

通過NVLink,所有GPU都可以任意訪問其他GPU的內(nèi)存空間,同時,英偉達(dá)還設(shè)計了NVLink C2C,B200和Grace CPU之間采用NVLink C2C連接,創(chuàng)建了一個NVLink可尋址的內(nèi)存地址空間,B200和Grace CPU之間的內(nèi)存可以互相訪問,進(jìn)一步優(yōu)化了內(nèi)存的訪問效率。

每顆B200提供192GB的HBM3e內(nèi)存,每顆Grace CPU提供480GB的LPDDR5X內(nèi)存,使得每個GB200超級芯片提供384GB HBM內(nèi)存和480GB LPDDR5X內(nèi)存,NVL72整機(jī)柜支持13.5TB的HBM和17TB的LPDDR5X內(nèi)存容量,為大規(guī)模數(shù)據(jù)處理和復(fù)雜模型訓(xùn)練提供了充足的內(nèi)存支持 。

在能耗與散熱方面,GB200超級芯片的功耗為2700W,每個Compute Tray的功耗約為6.3kW,每個Switch Tray功耗超過800W,NVL72整機(jī)柜的功耗預(yù)計達(dá)到120kW,為保證設(shè)備穩(wěn)定運行,采用冷板液冷進(jìn)行散熱,有效解決了高功耗帶來的散熱難題。

此外,英偉達(dá)還對GB300配置進(jìn)行了優(yōu)化,通過新的Ultra架構(gòu),實現(xiàn)了單卡1.5倍的FP4性能提升,GPU的HBM容量從192GB提升到288GB;B300芯片功率上升到1400W,但通過電力調(diào)配技術(shù),NVL72機(jī)柜能耗保持不變,單位算力能耗降低33% ;網(wǎng)絡(luò)接口卡從CX7提升到CX8,光模塊從800G提升到1.6T,進(jìn)一步提升了網(wǎng)絡(luò)傳輸性能。

2、DeepSeek:開源模型引領(lǐng)中國AI實驗室崛起

獨立基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis的最新報告顯示,中國AI實驗室DeepSeek憑借其R1-0528模型,以68分的智能指數(shù)評分躍居全球第二大AI實驗室,與谷歌Gemini 2.5 Pro并列,超越了馬斯克的xAI、扎克伯格的Meta和Anthropic等硅谷巨頭,標(biāo)志著中國大模型研發(fā)正從“追趕”邁向“并跑”階段。

DeepSeek的R1模型自發(fā)布以來便備受關(guān)注,其在多個領(lǐng)域展現(xiàn)出了卓越的性能。在數(shù)學(xué)推理任務(wù)中,準(zhǔn)確率高達(dá)97.3%,超越了GPT-4等頂尖模型,在AIME和MATH-500等基準(zhǔn)測試中也展現(xiàn)出了卓越的推理能力和更快的響應(yīng)速度。近期完成的小版本升級,即當(dāng)前的DeepSeek-R1-0528版本,更是在性能上實現(xiàn)了質(zhì)的飛躍。新版本仍然使用DeepSeek V3Base模型作為基座,但在后訓(xùn)練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力 。

在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升,在AIME2025測試中,新版模型準(zhǔn)確率由舊版的70%大幅提升至87.5%,在整體表現(xiàn)上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。

此次升級還在降低幻覺率、提升前端代碼生成能力和工具調(diào)用等方面取得了突破?;糜X率降低了45% - 50%,使得模型在生成內(nèi)容時更加準(zhǔn)確可靠,減少了無意義或錯誤信息的輸出。在前端代碼生成方面,能力得到了顯著增強(qiáng),能夠生成更穩(wěn)定、高質(zhì)量的代碼。模型還新增了工具調(diào)用功能,例如在處理網(wǎng)頁內(nèi)容總結(jié)任務(wù)時,它能夠自動爬取網(wǎng)頁并輸出結(jié)果,大大提高了工作效率。

DeepSeek還推出了基于Qwen3-8BBase微調(diào)的DeepSeekR1-0528-Qwen3-8B模型,在數(shù)學(xué)測試AIME2024中僅次于原R1版本,性能超越了阿里的Qwen3-235B。盡管這是一個僅有80億參數(shù)的小模型,但在數(shù)學(xué)測試?yán)锓謹(jǐn)?shù)比擁有2350億參數(shù)的大模型還高,甚至能和Google的Gemini 2.5打平,充分證明了其訓(xùn)練方法的有效性,也為資源有限的團(tuán)隊提供了新的思路和方向。

DeepSeek能夠取得如此成就,離不開背后研發(fā)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司以及其創(chuàng)立者幻方量化的支持?;梅搅炕诹炕顿Y領(lǐng)域多年積累的深厚底蘊和強(qiáng)大實力,為DeepSeek的模型訓(xùn)練、算法優(yōu)化等筑牢了堅實的硬件根基,其儲備的萬張A100芯片,為DeepSeek在技術(shù)發(fā)展的賽道上飛速馳騁提供了保障。

開源策略上,DeepSeek完全開源R1等模型,采用MIT協(xié)議,允許開發(fā)者自由定制和二次開發(fā),極大地吸引了全球開發(fā)者,促進(jìn)了技術(shù)共享與社區(qū)協(xié)作;開放API的定價僅為OpenAI同類產(chǎn)品的1/10,輸入每百萬token僅需0.55美元,輸出2.19美元,這一親民的價格降低了中小企業(yè)進(jìn)入AI領(lǐng)域的門檻,使得更多企業(yè)能夠基于DeepSeek的技術(shù)進(jìn)行應(yīng)用開發(fā),進(jìn)一步推動了其在各行業(yè)的廣泛應(yīng)用。

英偉達(dá)NVL72機(jī)柜的加速出貨為AI算力提供了強(qiáng)大的硬件支撐,而DeepSeek成為全球第二大AI實驗室則彰顯了中國在AI模型研發(fā)領(lǐng)域的實力。隨著硬件與模型技術(shù)的不斷創(chuàng)新與發(fā)展,AI產(chǎn)業(yè)將迎來更加繁榮的未來,為各行業(yè)的數(shù)字化轉(zhuǎn)型智能化升級注入源源不斷的動力。

本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計算芯知識(知識星球)星球下載全部資料。

英偉達(dá)

英偉達(dá)

NVIDIA(中國大陸譯名:英偉達(dá),港臺譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達(dá),港臺譯名:輝達(dá)),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。收起

查看更多

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄