DeepSeek作為人工智能領(lǐng)域的創(chuàng)新先鋒,憑借其突破性技術(shù)為現(xiàn)有AI Agent賦予了更強大的任務(wù)執(zhí)行與決策支持功能。而企業(yè)接入DeepSeek將帶來哪些創(chuàng)新與實踐價值,DeepSeek該如何打破發(fā)展瓶頸,其落地場景與效果表現(xiàn)如何等問題仍需探索。
本文將結(jié)合數(shù)勢科技的實踐,探討如何通過DeepSeek和現(xiàn)有大模型的整合,推動企業(yè)在數(shù)字化經(jīng)營中的新變革。
分享嘉賓|岑潤哲 數(shù)勢科技 數(shù)據(jù)智能產(chǎn)品總經(jīng)理
01DeepSeek的到來,對于大數(shù)據(jù)分析和應(yīng)用領(lǐng)域,是“天然的利好”
數(shù)據(jù)應(yīng)用賽道中,DeepSeek帶來了諸多改變與優(yōu)勢。在數(shù)據(jù)分析領(lǐng)域,DeepSeek接入后,其在數(shù)學(xué)及編程能力的增強具有顯著優(yōu)勢,極大地提升了對復(fù)雜數(shù)據(jù)的處理、統(tǒng)計與分析能力。在數(shù)據(jù)應(yīng)用領(lǐng)域,代碼能力與數(shù)學(xué)能力至關(guān)重要。DeepSeek到來后,無論是前期的數(shù)據(jù)清洗和特征挖掘,中期構(gòu)建指標體系與指標語義層,還是后期的數(shù)據(jù)可視化及報告生成等環(huán)節(jié),其數(shù)學(xué)能力與推理能力的提升,對數(shù)據(jù)應(yīng)用的全鏈路機制都產(chǎn)生了積極影響。特別是在復(fù)雜數(shù)據(jù)清洗、數(shù)據(jù)可視化以及深度報告生成方面,DeepSeek都帶來了諸多利好。
從技術(shù)視角來看,其思維鏈對數(shù)據(jù)分析極為有利。在數(shù)勢服務(wù)的眾多金融機構(gòu)中,以往大模型存在一個問題:雖然能給出答案,但答案的推導(dǎo)過程是黑盒化的。而在DeepSeek的論文中,能夠從V3的基礎(chǔ)模型做強化模型成為DeepSeek-R1-Zero,強化學(xué)習(xí)不僅獎勵準確性,還注重過程與結(jié)構(gòu)的規(guī)范性。這一機制的優(yōu)勢在于,不僅能準確進行數(shù)據(jù)分析,還能將條理清晰的推理思路總結(jié)呈現(xiàn)給用戶。例如,用戶進行企業(yè)經(jīng)營分析時,應(yīng)該從哪些維度選取何種指標,DeepSeek能將思考過程以步驟的形式呈現(xiàn)出來。這種激勵機制,極大地增強了數(shù)據(jù)分析報告的說服力,是數(shù)據(jù)應(yīng)用領(lǐng)域的一大亮點。
作為推理模型,R1在推理時十分注重Token輸出,輸出的Token越多,思考越細致,出錯概率越低。在進行復(fù)雜代碼生成、數(shù)據(jù)數(shù)學(xué)計算及決策時,R1的表現(xiàn)明顯優(yōu)于蒸餾后的版本或千問模型。然而R1存在速度慢的問題,因為處理復(fù)雜任務(wù)需要消耗更多Token進行思考。因此可以采用結(jié)合的思路,即使用蒸餾后的相對小參數(shù)量(如32B)的模型,先進行任務(wù)分類與實體抽取,該模型在這方面與R1效果相差不大,且速度更快。然而,當用戶的數(shù)據(jù)分析任務(wù)極為復(fù)雜時,可能會調(diào)用如R1這類推理模型進行深度推理與規(guī)劃,以更好地滿足用戶的分析需求。
通過近期就模型選用問題與多家金融機構(gòu)進行的交流來看,若場景主要是滿足用戶的快速數(shù)據(jù)檢索需求,例如詢問今年某月份的余額增速情況,此時無需調(diào)用R1這類長推理模型進行復(fù)雜任務(wù)拆解,使用V3模型進行讀取識別與要素解析,即可快速提取數(shù)據(jù)。但如果用戶的分析需求并非簡單的數(shù)據(jù)提取,而是像撰寫信貸報告或詳細的銀行信貸資產(chǎn)增速分析報告,這類高階的數(shù)據(jù)推理或行動計劃輸出任務(wù),V3模型的快速思考可能無法很好地完成。這種情況下,R1的推理模型更為適用,它能夠?qū)⑷蝿?wù)進行拆解。比如在分支行業(yè)績對比復(fù)盤時,確定應(yīng)關(guān)注的指標,并將任務(wù)細化為具體步驟。因此,現(xiàn)在很多主流AI產(chǎn)品都會設(shè)置“是否啟用深度思考”的按鈕。從某種意義上講,這是通過產(chǎn)品的功能操作,讓用戶能夠選擇此次是進行快思考還是慢思考。未來,此類融合方案或許會成為眾多產(chǎn)品的標配。
02?數(shù)勢SwiftAgent的革新與應(yīng)用
?目前數(shù)勢在SwiftAgent中加入了“深度思考”按鈕,一旦用戶開啟該按鈕,便會調(diào)用R1模型進行深度推理與分析。數(shù)勢的工具主要面向一些頭部企業(yè),通過接入DeepSeek后對部分能力特性進行了升級,從四個方面極大地提升了大模型的能力。
前端代碼生成能力極為出色。實驗得出,直接讓R1基于原始數(shù)據(jù)生成代碼,此時它在前端快速獲取可視化呈現(xiàn)的能力非常強。以往,大家更多地是借助BI工具來配置一系列看板或駕駛艙,而現(xiàn)在,直接將原始數(shù)據(jù)交給R1生成H5或JS代碼,其表現(xiàn)十分出色,這極大地增強了可視化能力。
其次推理能力顯著提升了報告的深度。以往模型可能只能給出一些較為基礎(chǔ)、缺乏深度的表述,而現(xiàn)在它能夠真正思考指標是否存在問題,是否需要進行假設(shè)推斷等,這大幅提升了報告的質(zhì)量和深度。數(shù)據(jù)分析報告的難點在于,指標口徑的準確性至關(guān)重要,結(jié)論需基于指標異常進行推斷,甚至有時還需結(jié)合企業(yè)內(nèi)部知識庫或相關(guān)文檔生成合理建議。當數(shù)據(jù)需要可視化呈現(xiàn),如轉(zhuǎn)化為表格以進行對比,或進行異常結(jié)論挖掘時,相較于以往如千問模型的思考深度更優(yōu),且整個過程對用戶具有可觀測性。
以財務(wù)數(shù)據(jù)異常分析為例,用戶輸入財務(wù)數(shù)據(jù),模型能夠明確告知用戶,因某指標下降故而進行異常分析,其思考過程中的每一個節(jié)點都能直觀地向用戶解釋分析的原因。如此一來,在呈現(xiàn)報告時,用戶能夠清晰理解報告撰寫的邏輯,而不像以往大模型輸出結(jié)果時,雖有內(nèi)容卻難以理解分析的依據(jù)。從這個層面來看,大模型思考過程的白盒化是一項重大變革,極大地增強了用戶對結(jié)果的可信度,也提升了數(shù)據(jù)解讀報告的能力。過去報告可能僅有純文字,如今則可融入圖片、表格等數(shù)據(jù)可視化元素,為用戶帶來更好的使用體驗。
此外哪些能力適合由大模型直接生成代碼去完成,哪些更適合通過工具調(diào)用。目前大模型寫代碼的能力很強,但有時仍需編寫Function Code,而非直接讓大模型生成代碼。這主要分為兩種情況:如果代碼的范式能夠固化,此時大模型直接寫代碼的準確率會非常高?。所謂固化范式,以圖表為例,基本圖表具有固定范式,從數(shù)據(jù)分析可視化的角度來看,其模式早已固定,無論何時,餅圖的呈現(xiàn)方式基本一致。在這種情況下,大模型編寫代碼時表現(xiàn)出色,基本不會出錯。然而,對于業(yè)務(wù)邏輯靈活的代碼,大模型則不太適合直接編寫。業(yè)務(wù)邏輯通常涉及數(shù)據(jù)庫中事實表與維度表的關(guān)聯(lián),這種關(guān)聯(lián)具有很強的業(yè)務(wù)邏輯,且不同公司內(nèi)部表與表之間的關(guān)系各不相同。若讓大模型強行編寫涉及三到四個表的復(fù)雜關(guān)聯(lián)代碼,其生成的代碼往往會出現(xiàn)問題。所以建議通過指標平臺的API取數(shù)接口,實現(xiàn)指標維度的拼接來獲取數(shù)據(jù),這種方式更為妥當。
03?金融行業(yè)案例與展望
以下將詳細分享某城市商業(yè)銀行開展智能數(shù)據(jù)分析的成功案例,近期該銀行將內(nèi)部的千問模型替換為DeepSeek V3和R1后,取得了一定的效果提升。該客戶產(chǎn)品面臨的主要問題是解決行領(lǐng)導(dǎo)在數(shù)據(jù)提取和分析方面的痛點。這家銀行以往依靠分析師角色,通過人工提取數(shù)據(jù)表格的方式,為領(lǐng)導(dǎo)提供諸如收入、存貸款情況、同業(yè)負債情況等報表。對于銀行領(lǐng)導(dǎo)而言,其數(shù)據(jù)需求較為靈活,今日可能關(guān)注幾個分支行的余額增速,明日則可能關(guān)注業(yè)績排名。然而,銀行缺乏足夠的分析師來滿足這些多樣化需求。因此,銀行期望通過自然語言查詢機制,一方面釋放分析師的時間,提升取數(shù)效率;另一方面,為領(lǐng)導(dǎo)提供更敏捷的歸因分析及報告分析能力,以便洞察行內(nèi)指標變化的異動原因,從而顯著提升工作效果與效率。項目完成后的第一周,領(lǐng)導(dǎo)們提交了數(shù)千條查詢請求,系統(tǒng)使用率較高。同時,結(jié)合指標語義層,數(shù)據(jù)準確性高,從問詢到輸出數(shù)據(jù)的時間基本僅需5秒左右。
這家銀行開展此項目,以及眾多企業(yè)尋求類似服務(wù),本質(zhì)上源于兩個問題。
需求與供給的錯配。即便頭部銀行或大型企業(yè)擁有分析師及ETL人員,但隨著業(yè)務(wù)不斷拓展,需求持續(xù)增長,企業(yè)不可能招募等量工程師編寫腳本以滿足所有需求,導(dǎo)致人力供給與需求不匹配。因此,企業(yè)期望借助AI agent滿足日常取數(shù)和用數(shù)的分析訴求,解放人力。
指標口徑層面存在黑盒問題。不同部門對同一指標名稱可能存在不同理解,在底層數(shù)倉中口徑不一致。所以,構(gòu)建指標語義層,統(tǒng)一指標口徑,使部門間擁有共通的數(shù)據(jù)語言,成為亟待解決的問題。?
在實施方案中融合了大模型能力與指標語義層交互能力。當用戶提出問題時,首先由大模型進行判斷。若任務(wù)復(fù)雜,如需要生成深度歸因報告,則通過路由將需求轉(zhuǎn)至DeepSeek R1處理;若只是簡單的數(shù)據(jù)提取,如按時間、機構(gòu)、貸款余額等條件提取數(shù)據(jù),使用V3或更快的模型即可。即先由大模型進行意圖理解,若為復(fù)雜任務(wù),則進入任務(wù)規(guī)劃階段,由規(guī)劃層進行多任務(wù)編排。在指標查詢環(huán)節(jié),通過指標語義層,提取用戶自然語言中的要素。例如用戶詢問各分支行業(yè)績情況,其中分支行為維度,過去三個月為時間,業(yè)績對應(yīng)若干指標,存在一套映射邏輯。最后將這些指標語義邏輯翻譯成SQL語句執(zhí)行,并通過R1這樣的推理模型對報告進行總結(jié),反饋給用戶。目前大模型在完整的數(shù)據(jù)提取方面能力有限,因為其對SQL底表邏輯的理解存在局限,不過大模型在任務(wù)識別與報告生成方面表現(xiàn)出色。因此,將大模型擅長與不擅長的部分區(qū)分開來,進行方案融合,以更好地實施相關(guān)項目。
該銀行的技術(shù)團隊曾嘗試直接使用R1模型生成SQL。當表結(jié)構(gòu)較為簡單,例如查詢近7日資產(chǎn)時,R1生成的SQL能夠正常運行。然而,當問題中的任務(wù)指令較多,不僅需要提取數(shù)據(jù),還涉及歸因分析以及報告撰寫等任務(wù)時,單純通過代碼生成工具來完成就較為困難。此時會先利用R1進行多任務(wù)規(guī)劃,第一個任務(wù)可能是取數(shù),第二個任務(wù)通過歸因分析小模型進行維度歸因,最后借助知識庫生成報告。通過這種結(jié)合Agent架構(gòu)與Function Code形式,能夠更好地滿足業(yè)務(wù)方在真實復(fù)雜業(yè)務(wù)場景下的分析需求,這些需求不僅包括數(shù)據(jù)提取,還涵蓋高階的數(shù)據(jù)洞察、歸因、異常檢測以及報告撰寫等,這也是企業(yè)實際會面臨的問題。
在為該金融機構(gòu)提供服務(wù)時,采取分場景推進的方式。因為不可能一開始就覆蓋所有場景。在項目一期,首先解決行領(lǐng)導(dǎo)對行內(nèi)業(yè)績指標對比的自然語言分析與報告生成需求。到了項目二期,則聚焦于實際業(yè)務(wù),如信貸、對公貸款業(yè)務(wù),進行風險評估、財務(wù)分析或信用卡分析等,從總部視角逐步擴展到各個業(yè)務(wù)線的領(lǐng)域和場景。項目一期上線后,用戶體驗良好。以往,無論是行長還是分支行領(lǐng)導(dǎo),數(shù)據(jù)提取流程都是向分析師提出需求,由分析師進行加工,這個過程來回可能需要4個小時。而現(xiàn)在,算法能夠主動幫助用戶發(fā)現(xiàn)指標問題,例如告知用戶行內(nèi)不良率或貸款余額近期的變化,提醒領(lǐng)導(dǎo)關(guān)注。領(lǐng)導(dǎo)若想進一步了解各機構(gòu)業(yè)務(wù)表現(xiàn)不佳的原因,進行詳細的數(shù)據(jù)歸因洞察,可按照分支行、產(chǎn)品類型、客戶類型等維度進行問詢。
最后,若領(lǐng)導(dǎo)需要向總行領(lǐng)導(dǎo)匯報,系統(tǒng)可結(jié)合企業(yè)已有的數(shù)據(jù)庫和知識庫生成包含異常原因及應(yīng)對措施等內(nèi)容的簡單報告。在接入DeepSeek后,該銀行認為其思維鏈生成及數(shù)據(jù)解讀模塊得到了顯著增強。以往報告可能只有純文字,現(xiàn)在則融合了表格、副文本、圖表與文字,大大提高了報告的易讀性和可解釋性,這也是DeepSeek接入后的優(yōu)勢所在。
最后分享一下對于DeepSeek的未來,尤其是推理模型演進方向的展望。
第一,DeepSeek的出現(xiàn)實現(xiàn)了AI平權(quán)。這一成果意義重大,意味著無論是頭部企業(yè)還是中型企業(yè),都具備了部署開源模型的資源與能力,在這一點上,大企業(yè)和小企業(yè)處于同等地位,這是AI平臺發(fā)展的體現(xiàn)。未來,數(shù)據(jù)應(yīng)用組件將以DeepSeek為核心,分析組件作為執(zhí)行部分協(xié)同運作,這樣能使強大的核心與不同的技能池有效配合,更好地滿足企業(yè)需求。
第二,目前DeepSeek仍無法掌握企業(yè)內(nèi)部的私域知識及數(shù)據(jù)編織邏輯。在此情況下,數(shù)據(jù)應(yīng)用產(chǎn)品需承擔“翻譯器”的角色。即在推理模型與企業(yè)級復(fù)雜數(shù)據(jù)結(jié)構(gòu)之間構(gòu)建語義層,以此作為連接用戶自然語言與底層數(shù)據(jù)表格架構(gòu)的橋梁,但這是大模型的通用能力所無法實現(xiàn)的。原因在于,DeepSeek當前的上下文處理能力為64K或128K,然而企業(yè)實際數(shù)據(jù)量,大型機構(gòu)通??蛇_幾十PB甚至上百PB。顯然,無法將全部數(shù)據(jù)輸入模型進行分析。因此,未來其64K或128K的上下文更適合用于推理,將任務(wù)細致拆解,再由“手腳”組件逐一執(zhí)行,獲取數(shù)據(jù)、開展相關(guān)分析,并將結(jié)果反饋給核心進行總結(jié)報告,這種模式更具有可行性。
第三,目前在使用R1時,存在無法控制思維鏈長度的問題,這導(dǎo)致其輸出有時較為啰嗦。若R1未來取得進展,希望它能夠?qū)崿F(xiàn)對模型輸出的控制。例如能夠在某些場景下將Token控制在1000個以內(nèi),而在另一些場景下,允許2000個Token的輸出。如果未來能夠?qū)崿F(xiàn)對Token的控制,那么在眾多應(yīng)用場景中,將能夠靈活選擇輸出風格。比如,選擇“謹慎型”輸出,回答問題更加嚴謹;或者選擇相對活潑、簡潔的輸出風格。