數(shù)字時(shí)代,以大模型為代表的新一代人工智能作為國(guó)家重大戰(zhàn)略需求,是支撐并強(qiáng)化更高水平人機(jī)智能協(xié)同的關(guān)鍵技術(shù)方向。特別地,大模型在數(shù)據(jù)、信息、知識(shí)、智慧的跨鏈增值上,已呈現(xiàn)“智能涌現(xiàn)”的規(guī)?;瘍?yōu)勢(shì),并且這些功能可以輔助并強(qiáng)化人類工作的知識(shí)性助益?;诖竽P偷闹R(shí)助手,是當(dāng)前商業(yè)價(jià)值最大化而潛在風(fēng)險(xiǎn)最小化的大模型落地場(chǎng)景,能夠廣泛提升人與AI應(yīng)用協(xié)同工作的體驗(yàn)與效率,實(shí)現(xiàn)工作效益的切實(shí)變革。
北京中關(guān)村科金技術(shù)有限公司(簡(jiǎn)稱“中關(guān)村科金”),已實(shí)現(xiàn)大模型知識(shí)助手在企服賽道的成功切入。中關(guān)村科金通過(guò)自主研發(fā)的領(lǐng)域大模型、大數(shù)據(jù)智能搜索、多模態(tài)文檔解析等關(guān)鍵技術(shù),在知識(shí)問答、知識(shí)構(gòu)建、知識(shí)歸納、知識(shí)推薦等核心場(chǎng)景,實(shí)現(xiàn)高效率、低成本、規(guī)?;膹?qiáng)人工智能創(chuàng)新應(yīng)用,打通企業(yè)知識(shí)應(yīng)用的“最后一公里”。
一、大模型時(shí)代下的新型人機(jī)協(xié)同,知識(shí)助手成功開啟商業(yè)藍(lán)海
當(dāng)前,以大模型為代表的通用人工智能正在飛速演進(jìn),正在成為重組數(shù)據(jù)要素資源、重塑人機(jī)協(xié)同新型生產(chǎn)關(guān)系的關(guān)鍵力量。較短時(shí)間內(nèi),基礎(chǔ)大模型的研究和發(fā)布呈蓬勃發(fā)展態(tài)勢(shì),接下來(lái)將進(jìn)一步呈現(xiàn)商業(yè)落地的競(jìng)速比拼。
然而,大模型的落地時(shí)間表還與具體場(chǎng)景要求息息相關(guān)。大模型的商業(yè)化變現(xiàn)仍面臨幻覺傾向、數(shù)據(jù)偏向、準(zhǔn)確率不足等挑戰(zhàn),需根據(jù)具體商用場(chǎng)景甄別實(shí)際風(fēng)險(xiǎn),從而制定相關(guān)技術(shù)路線和制度規(guī)范體系。
根據(jù)落地場(chǎng)景的容錯(cuò)性和通用性要求,大模型知識(shí)助手將率先開啟商業(yè)藍(lán)海。具體而言,可以按照容錯(cuò)性、通用性兩個(gè)維度將應(yīng)用場(chǎng)景劃分為以下四個(gè)象限(如圖1所示)。其中,服務(wù)企業(yè)內(nèi)部員工的知識(shí)助手,既具備專業(yè)性、又具有較高的容錯(cuò)性,是短時(shí)間內(nèi)大模型技術(shù)落地應(yīng)用的最佳切入點(diǎn)。
圖1:應(yīng)用場(chǎng)景劃分
二、聚焦效率與體驗(yàn),大模型知識(shí)助手已成三大應(yīng)用模式
基于大模型的知識(shí)助手,能夠提供面向搜索的精準(zhǔn)問答,從而打造企業(yè)知識(shí)應(yīng)用的新范式。尤其是,對(duì)比傳統(tǒng)企業(yè)知識(shí)庫(kù)、QA機(jī)器人等傳統(tǒng)知識(shí)管理手段,大模型知識(shí)助手能夠帶來(lái)知識(shí)歸納、構(gòu)建、問答、推薦等全流程效率和體驗(yàn)變革。一方面降低知識(shí)歸納和構(gòu)建過(guò)程的成本,特別是現(xiàn)有信息抽取模型技術(shù)的大量標(biāo)注、定制化開發(fā)模型時(shí)間長(zhǎng)、純?nèi)斯た偨Y(jié)的私域數(shù)據(jù)規(guī)模太大等難題;另一方面提升服務(wù)問答和推薦環(huán)節(jié)的問題覆蓋范圍,避免語(yǔ)義理解環(huán)節(jié)的匹配度低、無(wú)法覆蓋長(zhǎng)尾等問題。
圖2:傳統(tǒng)知識(shí)庫(kù)架構(gòu)
大模型知識(shí)助手,可以由淺至深分為三種應(yīng)用模式,如圖3所示:
一是“通用大模型+提示工程”。對(duì)于知識(shí)總量有限、專業(yè)性要求不高的企業(yè),可以直接使用通用大模型,針對(duì)企業(yè)具體的場(chǎng)景需求,由業(yè)務(wù)專家探索出提示詞,此時(shí)企業(yè)需要的是一套靈活好用的提示詞管理工具。
二是“通用大模型+領(lǐng)域知識(shí)庫(kù)+提示工程”。對(duì)于長(zhǎng)尾碎片知識(shí)(如SKU)較多的企業(yè),需要在通用大模型的基礎(chǔ)上,外掛領(lǐng)域知識(shí)庫(kù),針對(duì)具體場(chǎng)景、企業(yè)特有的問題可以讓大模型去知識(shí)庫(kù)里找答案,最后再在提示詞的引導(dǎo)與約束下返回輸出結(jié)果。
三是“領(lǐng)域大模型+領(lǐng)域知識(shí)庫(kù)+提示工程”。對(duì)于領(lǐng)域常識(shí)總量大的企業(yè),需要構(gòu)建企業(yè)專屬的領(lǐng)域大模型,將領(lǐng)域里的通識(shí)輸入到大模型的“大腦”里,既保持通用的常識(shí)和推理,又具備領(lǐng)域內(nèi)的專業(yè)知識(shí)和技能,讓大模型由本科生變成領(lǐng)域?qū)<摇?br />
圖3:大模型知識(shí)助手的三種模式與四項(xiàng)挑戰(zhàn)
目前,中關(guān)村科金基于領(lǐng)域大模型的知識(shí)助手產(chǎn)品已在和諾亞財(cái)富的合作中得以應(yīng)用。中關(guān)村科金通過(guò)融合自研的金融領(lǐng)域大模型、智能客服等人工智能技術(shù),為諾亞財(cái)富打造的智能知識(shí)庫(kù),具備多模態(tài)文檔分析、QA問答對(duì)自動(dòng)抽取、知識(shí)內(nèi)容自動(dòng)標(biāo)簽化處理能力。通過(guò)集成諾亞財(cái)富的企業(yè)微信和旗下財(cái)富管理平臺(tái)iNoahAPP應(yīng)用,為其員工和用戶提供基于企業(yè)知識(shí)文檔的智能問答查詢功能。通過(guò)大模型技術(shù)為智能客服產(chǎn)品賦能,大幅提升客服系統(tǒng)問答意圖識(shí)別準(zhǔn)確率和回復(fù)準(zhǔn)確率,預(yù)期后期可減少70%以上的系統(tǒng)運(yùn)營(yíng)工作,有效幫助企業(yè)降本增效。
三、風(fēng)險(xiǎn)與價(jià)值的雙向平衡,核心攻關(guān)四大技術(shù)能力
中關(guān)村科金憑借領(lǐng)先的AI技術(shù)實(shí)力、系統(tǒng)的解決方案能力、深度的行業(yè)服務(wù)經(jīng)驗(yàn),研發(fā)與企業(yè)用例的整體風(fēng)險(xiǎn)容忍度相一致的知識(shí)助手,并且完善相關(guān)技術(shù)路線和參與共建行業(yè)制度規(guī)范以減輕相應(yīng)風(fēng)險(xiǎn)。在知識(shí)助手的基礎(chǔ)上,公司研發(fā)“基于大規(guī)模語(yǔ)言模型的營(yíng)銷助手”,榮獲中國(guó)信通院2023可信AI案例大模型研發(fā)應(yīng)用和工具平臺(tái)優(yōu)秀案例,并且設(shè)計(jì)“企業(yè)超級(jí)員工”成功入選“2023WAIC全球創(chuàng)新項(xiàng)目路演TOP20榜單”。目前,中關(guān)村科金可為企業(yè)提供開箱即用、系統(tǒng)無(wú)縫銜接、成本可負(fù)擔(dān)的大模型服務(wù)。
圖4:知識(shí)助手產(chǎn)品示意圖
中關(guān)村科金聚焦形成四項(xiàng)核心技術(shù)能力,以平衡大模型的風(fēng)險(xiǎn)防范與價(jià)值創(chuàng)造。
一是避免產(chǎn)生幻覺(Hallucination)傾向的外掛知識(shí)庫(kù)技術(shù)?;糜X傾向是指大模型經(jīng)常生成一些看似合理、實(shí)在不符合事實(shí)的語(yǔ)句。有時(shí)杜撰出來(lái)的信息一看便知真假,有時(shí)則讓人一時(shí)無(wú)法分清事實(shí)?;糜X是目前大模型的一項(xiàng)固有屬性,中關(guān)村科金通過(guò)外掛知識(shí)庫(kù)在很大程度上杜絕該現(xiàn)象。
二是領(lǐng)先的多模態(tài)文檔解析技術(shù)。企業(yè)內(nèi)高頻、事實(shí)性知識(shí)(KnowWhat)往往存儲(chǔ)于結(jié)構(gòu)化數(shù)據(jù)庫(kù)中,流程性知識(shí)(KnowHow)和一些低頻事實(shí)性知識(shí)往往存在于非結(jié)構(gòu)文檔中,如:產(chǎn)品手冊(cè)、操作規(guī)章、培訓(xùn)視頻等。這類數(shù)據(jù)以往只能打上一些粗粒度標(biāo)簽,中關(guān)村科金通過(guò)自研的ASR、OCR等預(yù)處理后,能夠做結(jié)構(gòu)化的解析和表示,輸入到大模型中實(shí)現(xiàn)細(xì)粒度的語(yǔ)義理解和流程挖掘。
三是基于大數(shù)據(jù)智能的思維鏈歸納技術(shù)。企業(yè)內(nèi)外部真實(shí)問答場(chǎng)景中,往往流程性知識(shí)問答占比較高,中關(guān)村科金通過(guò)自主研發(fā)的領(lǐng)域大模型,從文檔中的顯性文字描述中理解這類知識(shí)、從日志中的隱性事件中挖掘出這類知識(shí),實(shí)現(xiàn)了優(yōu)于傳統(tǒng)技術(shù)的增值點(diǎn)。
四是避免災(zāi)難性遺忘的領(lǐng)域模型訓(xùn)練技術(shù)。領(lǐng)域常識(shí)注入通用大模型的過(guò)程中,往往造成大模型通用能力的下降,中關(guān)村科金通過(guò)訓(xùn)練數(shù)據(jù)和訓(xùn)練任務(wù)等一系列技巧,可以使其在具體任務(wù)上性能顯著提升且保持通用性。
大模型是大勢(shì)所趨,所有業(yè)務(wù)或場(chǎng)景都會(huì)涉及其中。目前,知識(shí)助手是企業(yè)服務(wù)賽道上最佳的切入點(diǎn)。未來(lái),在其合規(guī)性、安全性、可解釋性等得到保障并贏得用戶的數(shù)字信任后,可進(jìn)一步布局營(yíng)銷、客服、運(yùn)營(yíng)等全鏈業(yè)務(wù)生態(tài),實(shí)現(xiàn)新型人機(jī)協(xié)同的價(jià)值釋放。
相關(guān)稿件