国产一级性片,欧美极品在线,天天夜干,一级黄免费

中國企業(yè)報集團主管主辦

中國企業(yè)信息交流平臺

微博 微信

雙向賦能:AI與數(shù)據(jù)庫的修行之道

2024-06-29 10:52 來源:商丘網(wǎng) 次閱讀
 
雙向賦能:AI與數(shù)據(jù)庫的修行之道

  一個“技術(shù)問題”,導(dǎo)致巴菲特 的伯克希爾-哈撒韋公司股價暴跌近100%

  想必很多小伙伴已經(jīng)感受過了這則鋪天蓋地的消息,所帶來的億點點震撼 。

  而根據(jù)事后的消息來看,這個大故障是紐交所的合并報價系統(tǒng)(CTA)在更新軟件 時出現(xiàn)了問題。

  許多專家都對此做了分析,有人認為是CTA軟件在進行版本更新時出現(xiàn)了數(shù)據(jù)一致性問題;也有人提出最大的問題應(yīng)該是出現(xiàn)在了數(shù)據(jù)庫。

  但總而言之,這并非是紐交所今年來第一次出現(xiàn)的故障,而是眾多里的一個:

  甚至某開源數(shù)據(jù)庫聯(lián)合創(chuàng)始人Jason直言不諱地表示:

  >紐交所在CTA軟件上相關(guān)的IT水平還不及中國的大型金融機構(gòu)和互聯(lián)網(wǎng)公司,在中國已經(jīng)很少會發(fā)生這種低級錯誤了。

  即便如此,這也不禁令人產(chǎn)生更大的顧慮和擔(dān)憂——

  傳統(tǒng)軟件問題尚能引發(fā)如此大的問題,那么站在大模型時代當(dāng)下,AI+金融,是否又能做到準(zhǔn)確可信?

  正所謂實踐是檢驗真理唯一標(biāo)準(zhǔn),要回答的這個問題,我們不妨了解一下已經(jīng)在金融領(lǐng)域“上崗”了的AI大模型。

  大模型上崗金融,都在做什么?

  誠然AI大模型的發(fā)展已然呈現(xiàn)勢不可擋的趨勢,但在金融領(lǐng)域真正應(yīng)用的時候,依舊存在一些顯著的困難和挑戰(zhàn)。

  例如數(shù)據(jù)隱私和安全 方面,金融數(shù)據(jù)往往高度敏感,涉及個人和企業(yè)的財務(wù)信息,確保數(shù)據(jù)隱私和安全是首要挑戰(zhàn)之一。

  并且這些數(shù)據(jù)具有多源和異構(gòu)的特點,需要進行有效的整合和處理,才能確保它們的準(zhǔn)確性和完整性。

  再如模型本身 ,大模型往往被視為“黑箱”,因為其內(nèi)部決策過程難以解釋;在金融領(lǐng)域,尤其是涉及風(fēng)險管理和監(jiān)管合規(guī)時,可解釋性和決策透明性是非常重要的。

  還有在實時性和資源消耗 方面,金融市場瞬息萬變,需要實時數(shù)據(jù)處理和決策支持,大模型的推理涉及到大量的矩陣乘法計算,對硬件的矩陣乘法計算能力提出較高要求,計算復(fù)雜性可能導(dǎo)致響應(yīng)時間延遲,不利于實時應(yīng)用。

  加之大模型訓(xùn)練和推理過程需要大量的計算資源和能量消耗,這對企業(yè)的成本和環(huán)保要求提出了挑戰(zhàn)。

  而成立于1998年的老牌金融科技公司金證 ,面對上述固有的重重困難,卻有著自己的一套解法。

  在金證看來,大模型的優(yōu)勢在于文本及非結(jié)構(gòu)化數(shù)據(jù)處理能力、人機交互能力、生成能力和邏輯推理能力較強。

  而相比小模型而言,大模型也存在明顯的劣勢,例如大模型“幻覺”問題(即大模型答非所問),大模型的部署算力要求高造成算力資源浪費,部署成本高等問題。

  因此,金證的解法就是——通過組合式AI ,即大模型+小模型+工具 ,以此來支撐各個業(yè)務(wù)場景AI需求。

  大模型方面,包含金證去年年底推出的K-GPT以及業(yè)內(nèi)眾多頂流的大模型,在特定的金融任務(wù)中發(fā)揮大模型的特長。

  小模型則是指諸如OCR、NLP、人臉識別、文字識別、財務(wù)分析等傳統(tǒng)模型,可以細分任務(wù)做到快準(zhǔn)狠地處理。

  至于工具,則是指地圖、天氣、CRM、郵件、OA等。

  一言蔽之,在某個金融領(lǐng)域任務(wù)中,這種模式可以讓大模型、小模型和工具做到“專業(yè)的人干專業(yè)事”,尤其能極大地提高效率。

  值得一提的是,相比于通用大模型,金證的K-GPT在數(shù)據(jù)查詢的準(zhǔn)確性方面表現(xiàn)更佳,能夠更好地理解金融術(shù)語,提供專業(yè)且數(shù)據(jù)扎實的回復(fù)。

  據(jù)了解,K-GPT 還支持查看引用的知識源,并具備與實時數(shù)據(jù)和模塊化集成的能力,可以調(diào)取實時數(shù)據(jù)和組件。

  依托龐大的金融知識庫,K-GPT專為金融場景服務(wù),其核心優(yōu)勢在于對金融的深入理解、數(shù)據(jù)準(zhǔn)確、可驗證性以及支持調(diào)用Agent功能。

  從效果上不難看出,金證已然讓大模型在金融領(lǐng)域中合格地上崗,那么針對成本和資源上的痛點,金證又是如何解決的呢?

  背后是高帶寬內(nèi)存(HBM)的至強處理器在發(fā)力

  金證K-GPT方案中,還有一點比較特別:與英特爾合作,采用了基于CPU的大模型推理方案。

  據(jù)了解,他們主要是看中的是英特爾? 至強? CPU Max 系列處理器。

  這是英特爾唯一一款基于x86架構(gòu)并采用高帶寬內(nèi)存(HBM)的CPU系列,采用了片上HBM設(shè)計,內(nèi)存帶寬高達4TB/s。和傳統(tǒng)DDR5內(nèi)存相比,HBM具有更多的訪存通道和更長的讀取位寬,理論帶寬可達DDR5的4倍之多。

  要知道,大模型推理涉及大量的權(quán)重數(shù)據(jù)讀取,對硬件平臺的內(nèi)存訪問帶寬提出了很高的要求。

  至強? CPU Max具有64GB HBM,每個內(nèi)核可以分攤到超過1GB的內(nèi)存,對于包括大模型推理任務(wù)在內(nèi)的絕大多數(shù)計算任務(wù),HBM都可以容納全部的權(quán)重數(shù)據(jù)。

  內(nèi)存帶寬還不是金證選擇這款CPU的全部理由。

  英特爾? 至強? CPU Max系列還內(nèi)置了英特爾? 高級矩陣擴展 (英特爾?? AMX)引擎,大幅提升了大規(guī)模矩陣乘法運算性能。

  金證K-GPT基于Transformer架構(gòu),其核心特點包括多頭注意力機制和前饋神經(jīng)網(wǎng)絡(luò)層,這其中都包含大量矩陣運算,而英特爾? AMX通過1024位TMUL指令和8個獨立的矩陣計算單元,可以每時鐘周期執(zhí)行8次獨立的矩陣乘累加操作,為這些運算提供強大的加速能力。

  如此一來,大模型推理的效果如何呢?

  在只用單顆 CPU 的情況下,推理130億參數(shù)大模型,首個詞元生成時間就能壓到1秒左右,模型推理TPS超過10 tokens/s,用戶提問后約2秒內(nèi)就能得到響應(yīng)。

  別忘了遇到負載高峰等情況,還可以同時啟用2顆CPU,性能還能提升將近一倍,可以說足以滿足金融場景的大部分應(yīng)用需求了。

  除了硬件層面的突破,英特爾還提供了經(jīng)過優(yōu)化的軟件工具來挖掘硬件潛力。

  比如廣泛使用的OpenVINO? 工具套件,就被用來專門調(diào)優(yōu)加速模型的Embedding處理進行。

  金融場景涉及大量專業(yè)文檔的輸入任務(wù),Emedding正是把文本從離散變量轉(zhuǎn)變?yōu)檫B續(xù)向量的過程,好讓AI能夠理解。

  經(jīng)過OpenVINO? 工具套件優(yōu)化后,K-GPT大模型的批量Embedding性能提升到3倍之多。



圖注:OpenVINO? 工具套件優(yōu)化前后 Embedding 性能比較

  再比如金證與K-GPT配合使用的開源向量數(shù)據(jù)庫Faiss,英特爾也提供了優(yōu)化版本,以提升在至強? CPU Max上的模型推理性能。

  在大規(guī)模向量相似性檢索任務(wù)中,經(jīng)英特爾優(yōu)化過的版本性能可提升至4倍左右。



圖注:英特爾優(yōu)化版 Faiss 與原始 Faiss 性能對比(越高越好)

  除了性能方面之外,金證選擇英特爾? 至強? CPU Max系列作為算力底座還帶來其他方面的優(yōu)勢:

  首先是靈活性。由于與主流的 x86 架構(gòu)完全兼容,金證可以繼續(xù)使用原有的機器,靈活搭配適合自身業(yè)務(wù)的配置。而且 CPU 能同時應(yīng)對推理和通用計算,可根據(jù)負載情況隨時調(diào)配資源。

  第二是總擁有成本 (TCO)。從長遠來看,CPU路線能以更低的部署和維護開銷,實現(xiàn)與專用加速器相媲美的性能。這對于需要控制預(yù)算的金融機構(gòu)來說至關(guān)重要。

  綜合看下來,英特爾? 至強? CPU Max系列處理器在硬件能力、軟件優(yōu)化、生態(tài)適配、總擁有成本優(yōu)勢等方面都與金融場景非常契合,不失為業(yè)界大模型落地的一種新思路。

  如何評價?

  隨著數(shù)字化轉(zhuǎn)型的不斷深入,大模型為金融行業(yè)帶來的機遇與挑戰(zhàn)并存。

  越來越多的金融機構(gòu)開始探索如何將 AIGC 技術(shù)與實際業(yè)務(wù)相結(jié)合,在提質(zhì)增效的同時控制成本。但總的來說,大模型在金融行業(yè)的應(yīng)用仍處于初步探索階段。

  金證攜手英特爾打造的這套大模型推理方案,可謂是應(yīng)用層、模型層、算力層的深度融合,為業(yè)界樹立了標(biāo)桿。

  不久前舉辦的金證科技節(jié),就吸引了眾多金融機構(gòu)前來"取經(jīng)"。

  作為連接金融與科技的重要平臺,金證科技節(jié)吸引了眾多來自銀行、證券、保險等領(lǐng)域的金融行業(yè)玩家參與,共同探討 AI 技術(shù)在金融領(lǐng)域的應(yīng)用前景與優(yōu)質(zhì)實踐。

  可以預(yù)見,在英特爾的算力加持下,金證將在大模型技術(shù)上不斷突破,助力更多金融機構(gòu)實現(xiàn)數(shù)字化轉(zhuǎn)型,為用戶帶來更智能、高效的服務(wù)體驗。

點贊()
上一條:看懂這兩個案例,就拿到服務(wù)商今年在抖音電商增長的密碼了。2024-06-28
下一條:中國喜德盛受邀參加2024環(huán)法自行車賽開幕式,國際合作猜想再引熱議2024-06-29

相關(guān)稿件

?人大金倉總裁杜勝:偉大的數(shù)據(jù)庫產(chǎn)品都是進化而來的 2023-09-13
持續(xù)完善水質(zhì)數(shù)據(jù)庫建設(shè),促進礦井防治水安全 2023-04-25
雅捷GPU分布式數(shù)據(jù)庫讓商業(yè)應(yīng)用場景更廣闊 2023-08-29
酷克數(shù)據(jù)攜手中移在線入選2023大數(shù)據(jù)“星河”數(shù)據(jù)庫優(yōu)秀案例 2023-12-26
DolphinDB常見數(shù)據(jù)庫錯誤代碼大全 2024-03-29
國務(wù)院國有資產(chǎn)管理委員會 中國企業(yè)聯(lián)合會 中國企業(yè)報 中國社會經(jīng)濟網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財經(jīng) 鳳凰財經(jīng) 中國報告基地 企業(yè)社會責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟網(wǎng) 華訊財經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報道 金融界 中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團 中國保利集團公司 東風(fēng)汽車公司 中國化工集團公司 中國電信集團公司 華為技術(shù)有限公司 廈門銀鷺食品有限公司 中國恒天集團有限公司 濱州東方地毯集團有限公司 大唐電信科技股份有限公司 中國誠通控股集團有限公司 喜來健醫(yī)療器械有限公司 中國能源建設(shè)股份有限公司 內(nèi)蒙古伊利實業(yè)集團股份有限公司 中國移動通信集團公司 中國化工集團公司 貴州茅臺酒股份有限公司