張通社 zhangtongshe.com
5.0”大模型亮相前夕,商湯科技再獲20億港元投資。
近日,商湯科技在港交所發(fā)布公告,宣布了一筆通過配售獲得的20億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現有股東增持。資金將用于擴大商湯科技大裝置規(guī)模、支持大模型研究及產品開發(fā)的生成式AI 進一步發(fā)展。
商湯科技成立于2014年,是人工智能算法供應商,專注于計算機視覺和深度學習原創(chuàng)技術。2021年,公司在港股上市,成為港股AI第一股,也是“AI四小龍”中首家上市企業(yè)。
上市之后,商湯科技卻不斷虧損。2021年至2023年,商湯科技同期歸母凈利潤分別虧損171億元、60億元、64億元。在下滑的營收和虧損的數據中,生成式AI成為商湯科技的業(yè)績亮點,其年報顯示,2023年生成式AI收入突破11.84億元,實現199.9%的飛速增長,逐步成為其核心業(yè)務。
在今年7月,商湯科技還將發(fā)布新版大模型,其具備更強的知識、數學、推理及代碼能力,綜合性能全面升級。
01、2023年,生成式AI業(yè)務爆發(fā)式增長199.9%
在2023年的業(yè)務重組中,商湯科技明確了新的三大業(yè)務板塊,生成式AI、傳統(tǒng)AI和智能汽車。其中,生成式AI業(yè)務為其重點發(fā)展方向。得益于在生成式AI業(yè)務上的不斷投入,2023年,商湯科技成功實現了生成式AI大模型從研發(fā)到商業(yè)化應用的革新。
2023年4月,商湯科技推出“日日新SenseNove”大模型體系,這是商湯科技首個發(fā)布的大語言模型之一,同時還包括“秒畫”文書圖模型、3D內容生成等多種生成式AI模型。
在2023年的7、8月份,商湯科技快速迭代了2.0和3.0版本,通過提高訓練數據質量,實現了基礎語言能力的顯著提升。其新的“模型即服務”商業(yè)模式,使客戶能夠輕松地在大裝置微調和調用各類生成式AI能力,無需自己建設和管理底層基礎設施。據了解,“日日新”成為國內首個超越了GPT
3.5-turbo性能的基模型,也作為首批通過國家備案的大模型,正式面向用戶開放服務。
在算力規(guī)模上,“日日新”大規(guī)模體系實現了突破性增長。據了解,商湯科技大裝置的總算力達到12000petaFLOPS,連管GPU數量達45000卡。
對于商湯科技而言,生成式AI不僅僅是AI技術領域的變革性創(chuàng)新,更逐步成為其核心業(yè)務。據商湯科技公布的年報顯示,“日日新”大模型+大裝置帶動生成式AI收入突破11.837億元,業(yè)務實現199.9%的爆發(fā)式增長,占集團收入的比例由2022年的10.4%提升至34.8%。這是商湯科技成立十年以來,以最快速度從無到有、超過10億元收入體量的業(yè)務。
在弗若斯特沙利文發(fā)布的《2023年中國AI開發(fā)平臺市場報告中》,商湯科技在增長指數和創(chuàng)新指數兩大評估維度的綜合評分中位居國內首位。這一成績不僅展示了商湯在生成式AI領域的領先地位,更是對其創(chuàng)新能力和市場擴張速度的國際認可。
02、獲20億港幣投資,將用于AI大模型
2024年,國內的“百模大戰(zhàn)”進入深水區(qū),MiniMax、智譜AI、訊飛星火、華為、抖音等企業(yè)相繼推出大模型。作為已入局者,商湯科技不斷追求創(chuàng)新,提升大模型技術實力。
今年2月,商湯科技發(fā)布了“日日新”4.0版本,它在代碼編寫、數據分析和醫(yī)療問答等多種場景中達到與GPT-4相匹配的能力。同時,商湯科技開源了7B和20B兩種參數規(guī)格的基模型InternLM2,其性能超過了Meta的Llama2和Google的Gemma等同級別開源模型。此外,“秒畫”文生圖模型也經歷了四次更新至4.0版本,提升到百億參數量,疊加十倍級推理加速的優(yōu)化。
為了進一步鞏固并擴大商湯科技在大模型、大裝置領域的領先地位,6月21日,商湯科技在港交所發(fā)布公告,根據一般授權配售新B類股份。在香港聯交所交易時段前,配售1673446000股配售股份,每股配售價為1.20港元。商湯科技表示,目前通過配售已獲得20.08億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現有股東增持。
據了解,配售事項的所得款項凈額將主要用于繼續(xù)擴大商湯科技的領先優(yōu)勢,包括擴大商湯科技大裝置規(guī)模、支持大模型研究及產品開發(fā)的生成式AI 進一步發(fā)展,以及用作公司的一般營運資金。
在2024年戰(zhàn)略目標中,商湯科技也不斷強調將著力發(fā)展大模型。具體來說,將進一步發(fā)揮“大裝置+大模型”的深度協同優(yōu)勢,持續(xù)擴充算力規(guī)模、提升基礎設施和大模型的綜合服務能力;持續(xù)投入日日新模型體系的迭代,讓模型能力保持業(yè)界領先。
同時,商湯科技還將致力于實現大模型推理效率提升的摩爾定律,通過云+端結合等創(chuàng)新優(yōu)化策略,讓模型推理成本迅速降低,從而打開更廣闊的應用場景。
03、“日日新SenseNova 5.0”大模型發(fā)布在即
在7月的WAIC世界人工智能大會上,商湯科技將發(fā)布其新版大模型——“日日新SenseNova 5.0”。
“日日新SenseNova 5.0”大模型,具備更強的知識、數學、推理及代碼能力,綜合性能全面升級。這主要得益于以下三個方面的提升:一是采用混合專家架構(MoE),激活少量參數就能完成推理,且推理時上下文窗口達到200K 左右;二是基于超過10TB tokens訓練、覆蓋數千億量級的邏輯型合成思維鏈數據;三是商湯AI大裝置SenseCore算力設施與算法設計的聯合調優(yōu)。
日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級“日日新SenseNova 5.0”大模型進行了全方位綜合性測評,結果顯示在SuperCLUE綜合基準上,日日新5.0以總分80.03分的優(yōu)異成績刷新國內最好成績,這也是國內大模型首次在SuperCLUE中文基準測試中實現登頂。
在端側大模型應用上,為了滿足移動終端用戶對大模型技術的應用需求,商湯科技推出日日新·端側大模型,性能實現同等尺度性能最優(yōu),跨級尺度全面領先。其日日新·端側大語言模型的推理速度達到了業(yè)內最快,可在中端平臺實現18.3字/s的平均生成速度,旗艦平臺更是達到了78.3字/s。
對于金融、代碼、醫(yī)療、政務等重點行業(yè)邊緣側日益增長的AI應用需求,商湯科技正式推出企業(yè)級大模型一體機,可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現本地化部署,即買即用,降低企業(yè)應用大模型的門檻。相比行業(yè)同類產品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。
此外,商湯科技前瞻洞察中心化算力需求向端側擴展的未來趨勢,以及企業(yè)級在邊緣側的AI需求,在業(yè)內首次推出“云、端、邊”全棧大模型產品矩陣,其中包括應用于終端設備的“商湯端側大模型”,以及面向金融、代碼、醫(yī)療、政務等多個領域的邊緣產品“商湯企業(yè)級大模型一體機”。
憑借在大裝置+大模型深度協同優(yōu)勢、云端協同能力,以及多場景落地的豐富經驗,商湯科技將在人工智能2.0的風口上實現長遠的飛躍式發(fā)展。
文字|張文琪? ? ??編輯|呂穎穎