?
當下沒有比 AI 這個話題更火熱的了,憑借多年布局與卓越的 GPU 性能,英偉達成為 AI 芯片一哥,并以 AI 公司進行自身定位。然而,眾多實力玩家對這個一哥位子垂涎欲滴。英偉達若想笑傲 AI 芯片江湖,先要把 FPGA、ASIC、TPU、類腦芯片打敗才行。
在這幾大威脅中,F(xiàn)PGA 是最被熟知的,畢竟號稱是“萬能芯片”。透過以“All Programmable”定位的賽靈思進行云計算、嵌入式視覺、工業(yè)物聯(lián)網(wǎng)以及 5G 無線全布局,就可以看到 FPGA 在多個市場的滲透,因其靈活性在多領域受寵。
近年來,F(xiàn)PGA 越來越多地用于內存數(shù)據(jù)庫加速和搜索,圖像處理中的轉碼與分析等方面。
賽靈思與英特爾的博弈只是剛剛開始
近日,百度正式在全新的公有云加速服務器中,采用賽靈思 FPGA 產品線包括 Kintex FPGA、工具和軟件。百度 FPGA 云端服務器是百度云的一項新服務,可為每位用戶提供一個獨享的 FPGA 加速平臺,每個 FPGA 都是一款專用的加速平臺,而實例或用戶之間不會共享,包含深度學習加速、加解密等 FPGA 加速實例。
當然百度并非首家,國內首家被年初宣布推出 FPGA 云服務器的騰訊搶去了。不過,騰訊的合作伙伴不止賽靈思一家,還有收購 Altera 的英特爾。
其實云平臺上支持最新的 FPGA 異構計算架構仍處于起步期。去年 10 月,亞馬遜 AWS 推出 FPGA 云服務 EC2 F1;微軟在 Ignite 技術大會上演示了 FPGA 加速機器翻譯,并已經使用 FPGA 加速 Bing 搜索和 Azure 云。
FPGA 結合云計算形成新的 FPGA-as-a-Service 或者 Accelerator-as-a-Service 平臺,則可以整合多方資源解決上述問題。平臺廠商與 FPGA 硬件廠商合作,在云端提供統(tǒng)一硬件平臺與中間價,可大大降低加速器的開發(fā)與部署成本。加速器開發(fā)商的加速器上傳到云,可以形成服務銷售給加速器用戶,消除加速技術與最終用戶的硬件壁壘。而加速器用戶則能夠在無需了解底層硬件的情況下,直接按需購買和使用加速服務,較傳統(tǒng)方案更快更省地完成數(shù)據(jù)處理。
?
業(yè)內人士認為,“FPGA+云”開啟了云 2.0 時代,云計算未來競爭焦點無疑是大數(shù)據(jù)和人工智能,這也將成為新時代云計算格局巨變的誘因。FPGA 云服務器可在芯片核心底層釋放人工智能潛力。
英特爾預測,到 2020 年,超過三分之一的云計算節(jié)點將部署 FPGA 加速器。而微軟為了加快人工智能的發(fā)展時程而大力支持 FPGA。據(jù)業(yè)內人士分析,這也是英特爾以 167 億美元收購 Altera 的原因之一。
可見,賽靈思與英特爾在這一領域必將刀戈相向。
與非網(wǎng)小編也簡單盤點了下熱門 FPGA 云加速器上用的是哪顆芯。
云服務器上的 FPGA 芯
百度云,賽靈思 KU115 FPGA
百度自研 FPGA 加速卡使用賽靈思 20nm KU115 FPGA。FPGA 板卡帶有 4 通道 DDR4,每個通道 72bit,帶 ECC,容量 2GB,速率 2400Mhz。FPGA 通過 PCIE 3.0x8 和 CPU 相連。板卡的結構框圖如下所示:
基于上面的 FPGA 板卡,百度還提供的 FPGA 標準開發(fā)環(huán)境,其系統(tǒng)結構如下圖:
亞馬遜 EC2 F1,賽靈思 16nm Virtex UltraScale+ FPGA
AWS F1 使用的是 Xilinx 最新一代 UltraScale +架構的高配 FPGA VU9P。FPGA 提供可編程的硬件加速器。 AWS 為 FPGA 開發(fā)了新的鏡像格式,稱為 AFI。用戶可使用 aws ec2 create-fpga-image 命令將編譯好的加速器注冊為 AWS AFI,然后可在任意 F1 實例上使用 AFI Management Tools 部署執(zhí)行。
AFI 是 F1 實例上對 FPGA 編程的唯一方式,從安全和管理角度考慮,Amazon 目前沒有今后應該也不會提供直接下載 Bitstream 到 FPGA 的接口。這樣,AMI 定義虛擬機系統(tǒng)鏡像,AFI 定義 FPGA 加速器鏡像,兩者合起來就能配置一臺完整的帶 FPGA 加速的服務器。加速器開發(fā)商可以將加速器 AFI,或者 AMI+AFI 發(fā)布到 AWS Marketplace 進行銷售。而加速器用戶只需使用傳統(tǒng)的 EC2 流程即可購買開啟 FPGA 加速實例。
?
騰訊云,賽靈思 Kintex UltraScale KU115 FPGA
騰訊云有賽靈思和英特爾兩種方案,推出的全新 FPGA 型 FX2 實例包含 3 個版本,都是搭載賽靈思 Kintex UltraScale KU115 FPGA??蓱糜谏疃葘W習與實時圖像處理領域。
在深度學習方面,使用 FPGA 云服務器對深度學習模型中 CNN 算法的 Alexnet 模型進行加速計算。采用 Alexnet 模型對圖像進行分類檢測對比測試,在性能上,F(xiàn)PGA 云服務器處理性能是 CPU 云服務器的 5 倍。
在圖像處理方面, 盡管 WEBP 圖片格式因其比 JPEG 圖片格式存儲空間小 30%,但其壓縮計算復雜度是 JPEG 壓縮的 10 倍以上。因此采用 CPU 進行 WEBP 轉碼成本很高。為了增強圖片轉碼能力,使用 FPGA 云服務器進行加速。對 JPEG 格式圖片轉成 WEBP 格式圖片進行測試對比,測試圖片大小為 853x640,F(xiàn)PGA 云服務器處理延時相比 CPU 服務器降低 20 倍,F(xiàn)PGA 云服務器處理性能是 CPU 服務器的 6 倍。
下一階段也會推出基于 Intel 的 FPGA 硬件平臺。
FPGA 備受青睞,但常人卻難以“消化”
FPGA 云服務器只是折射出了 FPGA 應用領域的一角,可見 FPGA 備受熱門應用青睞。然而,自 Xilinx 在 1984 年創(chuàng)造出 FPGA 以來,卻一直被廣大工程師認為是難以“消化”的技術,其主要障礙還在于編程方面。
為了解決這一痛點,Xilinx 將 Vivado 產品作為重點推廣內容,它可用 C 語言進行設計,軟件工程師就可輕松進行硬設計。于此同時,Altera 有一個已經開發(fā)的 OpenCL 環(huán)境。兩家公司都在試圖創(chuàng)建一個新環(huán)境,讓用戶可以使用更熟悉的編程(如 C 和 OpenCL),而不受 Verilog、VHDL 的限制。
FPGA 全球格局
FPGA 門檻之高在芯片行業(yè)里無出其右,因此這個領域被實力玩家壟斷。曾經這還是四大巨頭賽靈思、Altera、Lattice、美高森美的的爭奪地。而如今在收購、兼并、重組的大環(huán)境下,格局已大變。
? Altera:2015 年 12 月,全球第二大 FPGA 制造商 Altera 被芯片巨頭英特爾以 167 億美元完成收購,這也是英特爾歷史上最大的一起收購。
? Lattice:2016 年 4 月紫光宣布在公開市場收購 Lattice 6.07%股權,致使 Lattice 的股票股價大漲 18%;2016 年 11 月 3 日, Lattice 被 Canyon Bridge 以 13 億美元收購(還未正式確定)。
? Microsemi:2017 年 3 月 21 日,美高森美宣布關閉位于上海的制造工廠。預期,上海美高森美半導體有限公司正式關閉時間為 2017 年 10 月底。
本期《芯榜單》就到這里,下期見。
更多相關文章,歡迎訪問與非網(wǎng)《芯榜單》系列!
?
與非網(wǎng)原創(chuàng)內容,未經許可,不得轉載!
?