6月19日,騰訊云行業(yè)大模型及智能應用技術峰會在京召開,騰訊集團高級執(zhí)行副總裁、云與智慧產業(yè)事業(yè)群CEO湯道生在會上發(fā)布了騰訊云MaaS(Model as a Service,模型即服務)服務解決方案,并詮釋了騰訊對于MaaS的理解。
記者在峰會現場了解到,騰訊云將基于騰訊TI平臺打造行業(yè)精選模型商店,覆蓋金融文旅、政務、傳媒教育等十大行業(yè),提供超過50個解決方案。在這些能力模型的基礎上,企業(yè)用戶只需要加入自己獨有的場景數據,就可以快速生成專屬模型。
行業(yè)大模型仍需針對性“錘煉”
過去半年,整個產業(yè)界都在為大語言模型的發(fā)展感到興奮?;诖罅康闹R與公開信息的訓練,大模型已經能夠對不同領域的提問生成人性化的回復,能夠更連貫的與用戶進行交互式對話。越來越多的企業(yè)管理者正在思考如何把大模型技術應用到自己的業(yè)務場景中,更好地為企業(yè)經營管理帶來降本增效。
然而,“在具體的企業(yè)場景中,通用大模型可能還不能滿足很多企業(yè)需求,比如它不一定懂行業(yè)的專業(yè)術語,也不了解企業(yè)內部獨特的情況,回答會比較虛或者比較籠統(tǒng),信息也不夠及時?!睖郎赋?,“大家既期待能力越來越強大的通用大模型,同時也在思考如何在使用大模型的同時保護企業(yè)數據產權與隱私,如何降低大模型的使用成本,這些都是企業(yè)要考慮的現實問題?!?/p>
以基于通用大語言模型的聊天機器人為例,它不一定是大模型唯一的服務方式,也不一定是滿足行業(yè)場景需求的最優(yōu)解?;趶V泛的公開文獻、網絡信息去訓練大模型存在一定風險。網絡信息可能會有錯誤、有謠言,甚至有偏見,許多專業(yè)的知識與行業(yè)數據的積累不足,會導致模型的行業(yè)針對性與精準度不夠,數據噪音過大。然而,在很多的產業(yè)場景中,用戶對于企業(yè)所提供的專業(yè)服務要求高,容錯性低,一旦企業(yè)提供了錯誤信息,可能會引起不可避免的法律責任與公關危機。
“企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須要反復與充分測試,才能上線。我們認為客戶需要在具備行業(yè)針對性的行業(yè)大模型上,加上企業(yè)自身的數據去做訓練和精調,才能夠打造出實用性更高的智能服務大模型?!睖郎硎?。他認為,企業(yè)所需要的是在實際的場景中真正解決某個問題,而不是在一百個場景中解決百分之七十到八十的問題。
以文旅大模型為例,基于文旅大模型打造的機器人客服,可自動判斷用戶的意圖,并自主調用相應的 API高質量地完成用戶咨詢服務。如用戶提問“節(jié)假日有哪些比較經濟的旅游景點可以推薦”,基于通用大模型的客服機器人只能給出一些簡單的景點介紹與路線規(guī)劃。而通過大量有針對性的行業(yè)數據所訓練出來的行業(yè)大模型,則可以通過模型精調,讓客服機器人的回答更為細致,可規(guī)劃出每天的交通景點安排,給出經濟實惠的定制化推薦方案。
在數據與成本之間需要尋找平衡點
眾所周知,模型的訓練數據越多,模型越大,訓練和推理的成本也越高。實際上,大部分企業(yè)場景需求可能并不需要通用人工智能來滿足。因此,如何在合理的成本下選擇合適的模型是企業(yè)用戶真正需要去思考與決策的地方。
“數據是大模型的原材料,針對具體場景,相關數據的覆蓋與質量都是至關重要。標注數據的管理也是模型迭代中非常重要的工作。模型最終要在真實的場景落地,要達到理想的服務效果,往往需要把企業(yè)自身的數據也用起來。在模型研發(fā)的過程中,既要關注敏感數據的保護,也要關注安全合規(guī),還要管理好大量的數據與標簽,不斷測試與迭代模型?!睖郎硎?。
據介紹,基于騰訊云IT平臺行業(yè)大模型精調解決方案,將幫助模型開發(fā)者與算法工程師一站式解決數據處理問題,高效率、高品質、低成本地創(chuàng)建與使用大模型?!拔覀兛梢酝ㄟ^TI平臺以及模型私有化部署、全棧式管控、數據加密等方式,讓企業(yè)用戶在打造大模型、使用大模型的時候更放心?!睖郎劦?。
據悉,騰訊云攜手中央電視臺打造了央視人工智能開放平臺,重新構建了一套傳媒專屬的數據標簽體系,同時也研發(fā)了創(chuàng)新的標簽權重引擎,讓數據標簽顆粒度更細。在數據標簽體系的支撐下,視頻編輯用自然語言就能實現跨模態(tài)檢索,比如輸入“居民消費力”,系統(tǒng)就可提供商場超市相關素材,再搭配智能剪輯就能快速生成視頻。
算力是模型持續(xù)運轉的基礎
“大模型的持續(xù)云轉,需要高性能、高彈性與高穩(wěn)定的算力支撐,需要借助專業(yè)的云服務。在大模型的訓練與使用過程中,需要大量的異構算力來支持,同時對于網絡速度與穩(wěn)定性要求也非常高?!睖郎硎尽?/p>
GPU服務器比一般的服務器穩(wěn)定性更低一些,服務器運維問題的排查也會更頻繁,整體運維的難度與工作量會高很多。例如在訓練集群中,一旦網絡有波動,訓練的速度就會大受影響。只要一臺服務器過熱宕機,整個集群都可能要停下來,大模型的訓練任務就需要重啟。這些事件會使得訓練的時間大大增加,所以投入在大模型的成本也會變。
湯道生介紹稱,騰訊云所提供的穩(wěn)定計算高速網絡與專業(yè)的運維,可以為算法工程師大大減輕設備運維的壓力,讓他們把精力放在模型的構建與算法的優(yōu)化上。同時,騰訊云打造的面向模型訓練的新一代HCC(High-Performance Computing Cluster)高性能計算集群,整體性能比過去提升了三倍。在計算集群的硬實力以外,騰訊云還推出了更適合AI運算的軟能力——向量數據庫,能夠更高效的處理圖像,處理向量音頻、文本等非結構化的數據。
“人工智能的發(fā)展是數據積累、算法創(chuàng)新與算力突破共同推動的,也是全球科技企業(yè)、高校、研究機構開放共建的結果。今天我們再一次站在數字科技革命的起點上,大模型只是一個開端, AI與產業(yè)的融合將綻放出更有創(chuàng)造力的未來?!睖郎硎?。
據了解,截至目前,騰訊自身的企業(yè)級應用已率先應用了行業(yè)大模型。例如騰訊會議即將推出的覆蓋會議全流程場景的智能小助手,只需簡單的會議指令,便可協助用戶執(zhí)行會議安排、會議管控、智能總結、智能錄制等操作,提升用戶開會與信息流轉的效率。新一代騰訊企點智能客服也將基于行業(yè)模型,結合客戶業(yè)務需求進行訓練與精調,提供更精準、更詳細的回答,甚至可以調用業(yè)務系統(tǒng)數據提供實時分析。
作者丨宋婧? 編輯丨劉晶
美編丨馬利亞? 監(jiān)制丨連曉東