• 正文
  • 相關推薦
申請入駐 產業(yè)圖譜

CCF HPC China 2022 | 第二屆異構計算軟件棧與應用論壇成功召開

2022/12/15
947
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

以“新算力 新賦能 新未來”為主題的2022 CCF全國高性能計算學術年會(CCF HPC China 2022)在線上正式召開。作為高性能計算領域全球最具影響力的三大超算盛會之一,大會邀請到2021年圖靈獎獲得者Jack Dongarra,中國科學院院士陳國良、錢德沛,中國工程院院士陳左寧、孫凝暉、王軍成,加拿大工程院院士K. Nandakumar等業(yè)界專家齊聚一堂,共話超算新趨勢。

12月15日上午,由張先軼博士主持的第二屆異構計算軟件棧與應用論壇成功召開。

演講嘉賓們奉獻了精彩的報告,如下是各報告的摘要。
報告主題:異構計算軟件棧的國產自主與國際化愿景

講者簡介

張先軼,算力軟件棧領軍人物。本科和碩士畢業(yè)于北京理工大學,博士畢業(yè)于中國科學院大學,之后分別在UT Austin和MIT進行博士后研究工作。ACM SIGHPC China執(zhí)行委員,CCF高性能計算專委會委員。曾榮獲中國計算機學會科學技術獎,中國科學院杰出科技成就獎。國際知名開源矩陣計算項目OpenBLAS發(fā)起人和主要維護者。

報告摘要:介紹了高性能計算的軟硬件體系和發(fā)展概況,結合澎峰科技的算力基礎軟件棧PerfMPL(數(shù)學計算庫)、PerfXAPI(異構計算軟件棧)和PerfXPy(新一代科學計算工具),介紹了如何通過開源創(chuàng)新實現(xiàn)共建算力生態(tài)的目標,以及立足國內,走向國際的發(fā)展愿景。

報告主題:面向天河新一代的異構并行應用開發(fā)
講者簡介
龔春葉,博士,國防科技大學計算機學院副研究員,應用教研室主任,主任設計師,天河高性能并行應用方向負責人。長期從事高性能并行計算研究,包括網(wǎng)格生成、密碼分析及CFD并行計算等卡脖子技術。發(fā)表論文二十余篇,獲省科技進步獎一等獎1項。
報告摘要:介紹了MT-DSP體系結構,hThreads并行編程模型。結合密碼破譯、復雜城市風場模擬、慣性約束聚變等離子體不穩(wěn)定性數(shù)值模擬等典型應用分享了軟硬融合的算法加速研究成果,提出異構程序性能優(yōu)化五大準則,和算力生態(tài)的展望。

報告主題:華為高性能數(shù)學庫建設進展
講者簡介
李志豪,工學博士,主要研究方向為高性能計算。他于2015~2021年于中科院計算所攻讀博士學位,現(xiàn)就職于華為公司2021實驗室。攻讀博士期間發(fā)表高性能計算領域高水平論文,如IEEE TPDS、SC、JPDC、ICAPDS、HPCC和計算機學報等,申請發(fā)明專利多項。曾獲中國科學院院長優(yōu)秀獎,中科院計算所所長特別獎,ACM SIGHPC China優(yōu)博獎等榮譽。
報告摘要:數(shù)學庫是使能處理器在數(shù)值計算領域的基礎軟件庫,是發(fā)揮硬件算力的基石,目前常用函數(shù)大約有一萬個。介紹了華為在數(shù)學庫的建設進展,并結合電路仿真、電磁仿真、網(wǎng)絡自治關鍵算法、語音識別、加密水印、OCR等應用場景,展示了高性能數(shù)學庫在應用領域的加速效果。

報告主題:EasyView: Enabling and Scheduling Tensor Views in Deep Learning Compilers
講者簡介
蔣麗娟,2020年于中國科學院軟件研究所并行軟件與計算科學實驗室獲得博士學位,博士期間主要從事國產眾核平臺上高性能數(shù)學庫以及基準測試程序HPCG的深度優(yōu)化工作,畢業(yè)之后主要從事深度學習編譯器方面的學習研究,在ICPP、TACO等會議以及期刊上發(fā)表多篇文章。
報告摘要:訪存密集型算子子圖在神經網(wǎng)絡的訓練和推理中占據(jù)了越來越多的時間比例,基于在線編譯的自動算子融合技術被證明是一種優(yōu)化該類子圖有效的手段。介紹了針對在網(wǎng)絡實現(xiàn)中高頻出現(xiàn)的tensor view類算子的端到端在線編譯自動融合方法,包含view lowering,內存活動追蹤,讀寫關系一致的算子拓撲序列獲取,以及計算內存優(yōu)化策略等內容。

報告主題:面向異構加速器的自適應精度模擬

講者簡介
馬子軒,清華大學計算機科學與技術系在讀博士生。2019年本科畢業(yè)于清華大學計算機科學與技術系。主要研究方向為高性能計算、異構程序優(yōu)化、編譯優(yōu)化等。相關研究成果發(fā)表于PPoPP、ICS、OSDI、SIGMOD、SC等國際會議。
報告摘要:是否有可能利用異構加速器針對低精度類型的高效計算能力, 加速高精度類型的計算負載? 講者提出了APE,一個BLAS-like的數(shù)學庫,支持在不同異構加速器上利用低精度類型加速高精度計算,并設計了一種數(shù)據(jù)相關的自適應方法。在NVIDIA GPU上的實驗表明,APE可以有效加速矩陣乘法3.12x,和多種應用達到1.78x的加速性能。

感謝各位老師的精彩報告!

相關推薦