當(dāng)下這個(gè)階段,如果你的芯片沒(méi)有一個(gè)某某性能最強(qiáng)的標(biāo)志,那么奉勸你不要來(lái)國(guó)產(chǎn)芯片發(fā)布的圈子湊熱鬧?,F(xiàn)在,這里是“地表最強(qiáng)”芯片的舞臺(tái)。
8 月 23 日,華為在深圳總部推出 AI 處理器 Ascend 910(昇騰 910)。華為輪值董事長(zhǎng)徐直軍表示,昇騰 910 總體技術(shù)表現(xiàn)超出預(yù)期,作為算力最強(qiáng) AI 處理器,當(dāng)之無(wú)愧。
圖片來(lái)源于華為官網(wǎng)
無(wú)獨(dú)有偶。9 月 25 日,杭州云棲大會(huì)上,達(dá)摩院院長(zhǎng)張建鋒現(xiàn)場(chǎng)展示了最強(qiáng)的 AI 推理芯片含光 800。張建鋒表示,在業(yè)界標(biāo)準(zhǔn)的 ResNet-50 測(cè)試中,含光 800 推理性能達(dá)到 78563 IPS,比目前業(yè)界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。
看到這里,大家發(fā)現(xiàn)阿里、華為對(duì)于“最”字的應(yīng)用是不是過(guò)于隨意了?這看起來(lái)更像是文字游戲,之后所有在某一領(lǐng)域拔尖的芯片都可以用這樣的方式冠以“地表最強(qiáng)”的稱號(hào)。
但我們無(wú)力反駁。昇騰 910 確實(shí)是目前算力最強(qiáng)的 AI 芯片,而含光 800 也確實(shí)是目前 AI 推理能夠力最強(qiáng)的芯片。
無(wú)論如何,昇騰 910 和含光 800 在中國(guó)芯片歷程上都有著自己突出的貢獻(xiàn),在我們的芯片發(fā)展史也都會(huì)寫(xiě)下濃墨重彩的一筆。
昇騰 910- 最快的訓(xùn)練芯片
昇騰 910 搭載的是華為自研的達(dá)芬奇架構(gòu),達(dá)芬奇從 IP 到指令集都是華為自己的專家創(chuàng)造的,并且支持全場(chǎng)景人工智能應(yīng)用。昇騰 910 的算力是國(guó)際頂尖 AI 芯片的 2 倍,相當(dāng) 50 個(gè)當(dāng)前最新最強(qiáng)的 CPU。因此,昇騰 910 的訓(xùn)練速度比當(dāng)前最新最強(qiáng)的芯片提升了 50%-100%。
昇騰 910 AI 處理器內(nèi)置 32 個(gè)達(dá)芬奇 AI Core,基于臺(tái)積電 7nm 增強(qiáng)版 EUV 工藝。除了基于達(dá)芬奇架構(gòu)的 AI 核外,昇騰 910 還集成了多個(gè) CPU、DVPP 和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢(shì)。在算力方面,昇騰 910 芯片達(dá)到了設(shè)計(jì)規(guī)格(半精度(FP16)256Tera-FLOPS;整數(shù)精度(INT8)512Tera-OPS)。此外,昇騰 910 芯片達(dá)到規(guī)格算力所需功耗(310W)低于設(shè)計(jì)值(350W)。
在華為全聯(lián)接 2019 大會(huì)上,華為發(fā)布了全球最快 AI 訓(xùn)練集群華為 Atlas 900。其就是基于數(shù)千顆昇騰 910 AI 處理器互聯(lián)構(gòu)成,總算力達(dá)到 256P~1024P FLOPS @FP16,相當(dāng)于 50 萬(wàn)臺(tái) PC 的計(jì)算能力。
圖片來(lái)源于華為官網(wǎng)
含光 800- 最強(qiáng)的推理芯片
含光 800 是一款云端 AI 推理芯片,峰值性能為 7.8 萬(wàn) IPS(每秒能處理 7.8 萬(wàn)張照片),峰值能效達(dá)到 500IPS/W。據(jù)介紹,1 顆含光 800 的算力相當(dāng)于 10 顆 GPU,目前基于含光 800 的 AI 云服務(wù)已在阿里云上線。
圖片來(lái)源于平頭哥官方宣傳圖
含光 800 不同于基于馮·諾依曼架構(gòu)的傳統(tǒng)通用處理器,而是根據(jù)神經(jīng)網(wǎng)絡(luò)推理運(yùn)算特征,設(shè)計(jì)特定的硬件神經(jīng)元、高速連接的存儲(chǔ)結(jié)構(gòu)以及專用指令集,對(duì)內(nèi)存和計(jì)算單元實(shí)現(xiàn)高效組織管理,實(shí)現(xiàn)單條指令完成多個(gè)操作,提高計(jì)算效率和內(nèi)存訪問(wèn)效率。
含光 800 在算法方面也得到了加強(qiáng)。阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室過(guò)去兩年構(gòu)建了完整的算法體系,涵蓋語(yǔ)音智能、語(yǔ)言技術(shù)、機(jī)器視覺(jué)、決策智能等方向,并且取得多個(gè)世界領(lǐng)先水平的成果。
不管是訓(xùn)練還是推理都需要強(qiáng)大的算力支撐,而兩塊芯片都表現(xiàn)了優(yōu)異的性能。
經(jīng)實(shí)測(cè),昇騰 910 打造的 Atlas 900 可以在 60 秒完成基于 Resnet-50 模型訓(xùn)練,比第 2 名快 15%。這可以讓研究人員更快的進(jìn)行圖像、語(yǔ)音的 AI 模型訓(xùn)練,讓人類更高效的探索宇宙奧秘、預(yù)測(cè)天氣、勘探石油,加速自動(dòng)駕駛的商用進(jìn)程。在一張匯聚有 20 萬(wàn)顆星星的南半球星空?qǐng)D上,天文學(xué)家想找出某種特征的星體,需要 169 天的工作量,Atlas 900 只需要 10 秒。
在城市大腦中實(shí)時(shí)處理杭州主城區(qū)交通視頻,需要 40 顆傳統(tǒng) GPU,延時(shí)為 300ms,使用含光 800 僅需 4 顆,延時(shí)降至 150ms。
昇騰 910 和含光 800 有一個(gè)共同點(diǎn),都不單獨(dú)對(duì)外銷(xiāo)售。昇騰 910 通過(guò) AI 加速模塊、AI 加速卡、AI 服務(wù)器等形式對(duì)第三方銷(xiāo)售;含光 800 將通過(guò)阿里云對(duì)外輸出 AI 算力。
昇騰 910 和含光 800 可謂是術(shù)業(yè)有專攻,各自有各自的特點(diǎn)。不管是訓(xùn)練還是推理,在 AI 應(yīng)用落地中都至關(guān)重要,兩款芯片能夠在各自的領(lǐng)域做到世界第一,足見(jiàn)各自背后團(tuán)隊(duì)的真功夫。同時(shí),這些有著中文古典名字的芯片不斷涌現(xiàn)也代表著國(guó)產(chǎn)芯的欣欣向榮。如果有其他的企業(yè)能夠做到這一點(diǎn),相信大家也愿意繼續(xù)被這樣的“文字游戲”所套路。
參考文章:
《解密華為 Atlas 900:數(shù)千顆昇騰 910 構(gòu)成全球最快 AI 訓(xùn)練集群》
《阿里第一顆芯片問(wèn)世 平頭哥發(fā)布 AI 芯片含光 800》
《華為推出昇騰 910 芯片 但不以獨(dú)立芯片形式面向市場(chǎng)》
《阿里發(fā)布 AI 推理芯片“含光 800”,歷時(shí)一年半完成設(shè)計(jì)與驗(yàn)證》
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!