近日,2024全球開發(fā)者先鋒大會(huì)在上海舉行。為期兩天的大會(huì),匯聚了國(guó)內(nèi)外超過100家開發(fā)者社區(qū)、100余家知名投資機(jī)構(gòu)。OpenAI前高管扎克·卡斯、硅谷“創(chuàng)投之父”史蒂夫·霍夫曼等“大咖”也來(lái)滬與全球開發(fā)者交流。在此次大會(huì)的舉辦地徐匯濱江,上海首個(gè)大模型創(chuàng)新生態(tài)社區(qū)已然成形。僅僅成立半年,就吸引了近60家大模型企業(yè),以及200余家產(chǎn)業(yè)鏈上下游企業(yè)資源匯聚。
以應(yīng)用牽引,發(fā)布市級(jí)應(yīng)用場(chǎng)景;培育生態(tài),做好算力、數(shù)據(jù)等關(guān)鍵要素供應(yīng);加大開源、開放力度,降低廣大創(chuàng)新創(chuàng)業(yè)團(tuán)隊(duì)和中小企業(yè)的大模型訓(xùn)練門檻……近年來(lái),上海積極培育人工智能產(chǎn)業(yè)沃土,逐漸成為大模型產(chǎn)業(yè)高密度創(chuàng)新的苗圃基地。
大模型產(chǎn)業(yè)“風(fēng)起云涌”
大會(huì)上,上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華用“風(fēng)起云涌”來(lái)形容近幾年全球大模型產(chǎn)業(yè)的發(fā)展。
2022年,ChatGPT橫空出世,大模型開始走入大眾視野,成為全球焦點(diǎn)。2023年2月,Meta公司發(fā)布LLaMa并催生發(fā)展出開源社區(qū),大模型從“只會(huì)聊天的工具”,變成了有可能會(huì)進(jìn)入到“嚴(yán)肅生產(chǎn)領(lǐng)域”的生產(chǎn)力。邁入2024年,Sora的出世、Claude 3.0展現(xiàn)出的強(qiáng)大推理能力,以及馬斯克剛剛開源的Grok,都代表著整個(gè)行業(yè)處在“方興未艾”的賽道。
“大模型行業(yè)的發(fā)展有兩個(gè)非常重要的驅(qū)動(dòng)力量。一個(gè)是源于所有研究者和從業(yè)者對(duì)于技術(shù)理想的追求,不斷突破邊界,尋求越來(lái)越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同時(shí)產(chǎn)業(yè)界也看到了大模型帶來(lái)產(chǎn)業(yè)革命的可能性,無(wú)數(shù)企業(yè)投入巨大資源到這個(gè)賽道中。兩股力量交織在一起,形成了我們今天看到的大模型產(chǎn)業(yè)‘波瀾壯闊’的局面。”林達(dá)華表示。
而在國(guó)內(nèi),大模型產(chǎn)業(yè)的發(fā)展同樣突飛猛進(jìn)。去年3月份,百度發(fā)布“文心一言”,此后,阿里巴巴的“通義千問”、科大訊飛星火大模型、騰訊混元大模型陸續(xù)發(fā)布上線?;ヂ?lián)網(wǎng)大廠之外,華為、京東、字節(jié)跳動(dòng)、商湯科技,乃至三大電信運(yùn)營(yíng)商、各科研院所和高校的大模型產(chǎn)品也不斷推出。有統(tǒng)計(jì)數(shù)據(jù)顯示,中國(guó)研發(fā)大模型的公司已有100多家,邁入“百模大戰(zhàn)”階段。
同時(shí),大模型行業(yè)也在不斷涌現(xiàn)出新的課題。以算力為例,微軟原全球執(zhí)行副總裁沈向洋稱,發(fā)展大模型產(chǎn)業(yè),算力是門檻。隨著大模型參數(shù)的增加,對(duì)算力的需求幾乎是幾何級(jí)增長(zhǎng)的。另外,包括ChatGPT在內(nèi),大模型還帶來(lái)了“一本正經(jīng)地胡說(shuō)八道”、“深度偽造”等倫理問題,需要各方加強(qiáng)治理。
此外,當(dāng)前主流的大模型都是建立在Transformer架構(gòu)堆疊的基礎(chǔ)上,但這一架構(gòu)對(duì)計(jì)算資源的消耗特別大。騰訊混元大模型算法負(fù)責(zé)人康戰(zhàn)輝表示,當(dāng)下越來(lái)越多的企業(yè)看到了MoE(即:混合專家模型)展現(xiàn)出來(lái)的優(yōu)良特性,未來(lái)可能還會(huì)有更加高效的架構(gòu)出來(lái)。
產(chǎn)業(yè)應(yīng)用“繁花綻放”
有行業(yè)人士將2024年比作大模型應(yīng)用的“元年”,認(rèn)為行業(yè)的競(jìng)爭(zhēng)焦點(diǎn)正在從基礎(chǔ)模型到應(yīng)用遷移。從目前來(lái)看,大模型確實(shí)已經(jīng)落地到各行各業(yè),生根發(fā)芽。
“大模型+科學(xué)”可以產(chǎn)生哪些化學(xué)反應(yīng)?上海人工智能實(shí)驗(yàn)室青年科學(xué)家白磊介紹,實(shí)驗(yàn)室發(fā)布“風(fēng)烏”大模型,可用以預(yù)測(cè)氣象。由于大氣系統(tǒng)的復(fù)雜性,全球中期天氣預(yù)報(bào)的有效性每10年才提高1天。此前,全球范圍內(nèi)最好的物理模型有效預(yù)報(bào)時(shí)長(zhǎng)最大為8.5天,而“風(fēng)烏”達(dá)到了10.75天,且預(yù)測(cè)時(shí)間僅需30秒。
機(jī)器人與大模型的結(jié)合領(lǐng)域“具身智能”也是熱點(diǎn)?!皞鹘y(tǒng)的機(jī)器人需要編程,需要寫固定的代碼,造成之前的人機(jī)交流非常僵硬?,F(xiàn)在,我們告訴機(jī)器人它的手臂快碰到天花板了,在沒有任何方向性指示的情況下,它能夠理解,且做出正確反應(yīng)。這在傳統(tǒng)的機(jī)器人編程中,是不可想象的。我們期待,大模型能給機(jī)器人一顆通用的大腦?!?中電科21所高級(jí)專家劉一帆表示。
“過去藝術(shù)家們通過AI軟件進(jìn)行藝術(shù)作品的設(shè)計(jì),今天有更多的藝術(shù)家通過AI完成藝術(shù)作品的創(chuàng)作。此外,從去年下半年開始,包括電商、營(yíng)銷等領(lǐng)域,也有非常多的大模型產(chǎn)品涌現(xiàn)出來(lái)?!敝窍笪磥?lái)產(chǎn)品總監(jiān)弓子健說(shuō)。
林達(dá)華認(rèn)為,圍繞大模型應(yīng)用,產(chǎn)業(yè)分工會(huì)逐漸形成?!白龌A(chǔ)模型的企業(yè)并不會(huì)壟斷一切。如果從業(yè)者能夠憑借自己在行業(yè)里積累的數(shù)據(jù)和經(jīng)驗(yàn),并基于自身的資源稟賦和數(shù)據(jù)優(yōu)勢(shì)積極尋找差異化發(fā)展路徑,最終形成競(jìng)爭(zhēng)力,我們的大模型產(chǎn)業(yè)一定會(huì)‘一路繁花’。”
著力建設(shè)“大模型之都”
人工智能是上海重點(diǎn)發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一。伴隨著新一代人工智能的發(fā)展,大模型熱潮掀起,上海正在著力建設(shè)“大模型之都”。
懷著“栽好梧桐樹,引得鳳凰來(lái)”的美好愿景,上海以徐匯西岸為核心,啟動(dòng)了首個(gè)人工智能發(fā)展集聚區(qū)建設(shè)。如今,作為上海首個(gè)大模型創(chuàng)新生態(tài)社區(qū),誕生于徐匯人工智能產(chǎn)業(yè)沃土的“模速空間”,已成為大模型產(chǎn)業(yè)高密度創(chuàng)新的苗圃基地。
上海徐匯區(qū)委常委、副區(qū)長(zhǎng)俞林偉對(duì)“模速空間”名字的由來(lái)進(jìn)行了解釋。他說(shuō),“‘?!馕吨汕先f(wàn)的開發(fā)者在這里創(chuàng)新創(chuàng)業(yè),百花齊放。這里是場(chǎng)景的試驗(yàn)田,也是應(yīng)用的孵化器?!佟瘎t指通過市、區(qū)攜手,為企業(yè)提供全方位的加速服務(wù)。”
轉(zhuǎn)眼間,“模速空間”掛牌已近半年。如今有超過60家大模型企業(yè)與他們身后200余家產(chǎn)業(yè)鏈上下游企業(yè)的資源匯聚在黃浦江畔這一方天地。
對(duì)于大模型企業(yè)來(lái)說(shuō),數(shù)據(jù)的體量、質(zhì)量、多樣性缺一不可,均對(duì)大模型能力的提升有重要意義。如何能夠生產(chǎn)大規(guī)模、高質(zhì)量的數(shù)據(jù),也是各個(gè)大模型研發(fā)機(jī)構(gòu)某種意義上“競(jìng)爭(zhēng)壁壘”所在。
此外,算力同樣重要,不管是大模型研發(fā)企業(yè),還是應(yīng)用類公司,高算力成本都令人頭痛。如何提供普惠的算力,通過較低成本把大模型在垂直行業(yè)真正用起來(lái),讓更多的中小企業(yè)、個(gè)人開發(fā)者加入大模型的開發(fā)中,也是行業(yè)關(guān)注的問題。
記者了解到,“模速空間”五個(gè)公共服務(wù)平臺(tái)作為“土壤雨露”,可為創(chuàng)新企業(yè)提供開放數(shù)據(jù)、算力調(diào)度、能力評(píng)測(cè)、備案輔導(dǎo)、融資服務(wù)等公共服務(wù),提供關(guān)鍵要素保障。
以算力調(diào)度平臺(tái)為例,“模速空間”聯(lián)合運(yùn)營(yíng)商和云廠商共同保障大模型企業(yè)算力,目前商湯、儀電、火山超5萬(wàn)張GPU可供調(diào)配。其開放數(shù)據(jù)平臺(tái)依托浦江實(shí)驗(yàn)室牽頭的大模型語(yǔ)料數(shù)據(jù)聯(lián)盟,持續(xù)開源發(fā)布高質(zhì)量數(shù)據(jù)集,數(shù)據(jù)總量近5TB,下載量近14萬(wàn)次,行業(yè)覆蓋10余類。
面向未來(lái),大模型產(chǎn)業(yè)的發(fā)展尚有許多挑戰(zhàn)。對(duì)此,上海已明確,未來(lái)將加強(qiáng)核心技術(shù)的突破,推動(dòng)智能芯片關(guān)鍵技術(shù)和應(yīng)用適配,打造更多元開放的智能計(jì)算生態(tài)。同時(shí),完善標(biāo)準(zhǔn)體系、安全準(zhǔn)則、倫理規(guī)范,推動(dòng)人工智能、區(qū)塊鏈、元宇宙等前沿技術(shù)的開發(fā)和應(yīng)用。
上海市副市長(zhǎng)陳杰表示,未來(lái)上海將進(jìn)一步加大開源開放的力度,探索大模型的新型開源和推廣模式,以降低廣大創(chuàng)新創(chuàng)業(yè)團(tuán)隊(duì)、中小企業(yè)等大模型訓(xùn)練的門檻,推出更多具有示范性、標(biāo)志性的應(yīng)用場(chǎng)景,來(lái)牽引大模型在金融、教育、醫(yī)療、制造等典型領(lǐng)域的垂直應(yīng)用。(記者 杜康 上海報(bào)道)
相關(guān)稿件