近日,美國OpenAI公司正式發(fā)布文生視頻模型Sora,再次在全球掀起了人工智能關(guān)注浪潮。業(yè)內(nèi)人士認(rèn)為,從當(dāng)前展示效果來看,Sora顯著領(lǐng)先于其他文生視頻模型,后續(xù)潛在的商業(yè)化有望對短視頻、電影、游戲等下游領(lǐng)域產(chǎn)生深遠(yuǎn)影響,并進(jìn)而傳導(dǎo)到上游算力基礎(chǔ)設(shè)施,算力需求有望再次迎來爆發(fā)。
文生視頻探索新高度
美國OpenAI公司發(fā)布的全新的Sora文生視頻模型,可以根據(jù)用戶輸入的文本指令,一次生成60秒的長視頻,且視頻的畫面精細(xì)度、流暢度超越了以往的文生視頻模型。由于Sora能夠模擬對世界狀態(tài)產(chǎn)生簡單影響的行為,有分析人士認(rèn)為,這將文生視頻能力推向了全新的高度。
在Sora發(fā)布之后,有博主對當(dāng)前市場上其他主流文生視頻產(chǎn)品做了對比評測,在對Sora、Pika、Runway和Stable Video四個(gè)模型輸入了相同的提示詞后,Sora在視頻生成質(zhì)量和時(shí)間上均對同行“降維打擊”,其更加清晰連貫、符合描述。
在OpenAI官方的技術(shù)報(bào)告中,對Sora的定位為“作為世界模擬器的視頻生成模型”?!爸皫卓钪髁髂P蜕傻囊曨l時(shí)長僅在20秒以內(nèi),Sora不僅能夠深入理解用戶提示,還學(xué)會了物理世界的部分規(guī)律,比如:一個(gè)人吃漢堡后會留下咬痕、火車車窗上會產(chǎn)生逼真的倒影,Sora還可在單個(gè)視頻中設(shè)計(jì)出多個(gè)鏡頭。”華金證券計(jì)算機(jī)首席分析師方聞千說。
360集團(tuán)創(chuàng)始人周鴻祎表示,以往文生視頻軟件都是在2D平面上對圖形元素進(jìn)行操作,可以把視頻看成是多個(gè)真實(shí)圖片的組合,并沒有真正掌握這個(gè)世界的知識。這次OpenAI利用它的大語言模型優(yōu)勢,讓Sora實(shí)現(xiàn)了對現(xiàn)實(shí)世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是“真實(shí)”的。
業(yè)內(nèi)人士表示,雖然OpenAI表示當(dāng)前Sora仍有弱點(diǎn),例如難以準(zhǔn)確模擬復(fù)雜場景中的物理現(xiàn)象,可能無法理解具體的因果關(guān)系,但從當(dāng)前展示的效果來看,Sora顯著領(lǐng)先于其他文生視頻模型,推動(dòng)AI視頻生成“進(jìn)入了一個(gè)全新的時(shí)代”。
通用人工智能加速到來
目前,Sora暫未公開使用權(quán)限,僅對一部分視覺藝術(shù)家、設(shè)計(jì)師和電影制作人開放。業(yè)內(nèi)人士認(rèn)為,隨著技術(shù)的進(jìn)一步成熟,Sora將會推向所有用戶。Sora預(yù)示AGI(通用人工智能)將加速到來,其后續(xù)潛在的商業(yè)化有望對短視頻、電影、游戲等下游領(lǐng)域產(chǎn)生深遠(yuǎn)影響。
值得一提的是,日前大火的游戲《幻獸帕魯》的開發(fā)團(tuán)隊(duì)僅有4人,市場猜測該團(tuán)隊(duì)使用了AI生成技術(shù)制作游戲角色,以節(jié)省成本。根據(jù)OpenAI發(fā)布的最新Sora技術(shù)報(bào)告,Sora能夠模擬視頻游戲的數(shù)字化過程。這意味著,開發(fā)制作游戲的門檻可能會被進(jìn)一步降低。
“有了強(qiáng)大AI能力的加持,OpenAI通往商業(yè)成功之路缺的并不是程序員,而是能實(shí)現(xiàn)商業(yè)閉環(huán)的‘金點(diǎn)子’。一旦任務(wù)明確,OpenAI就可以很快復(fù)制,解決任何能力短板。”中經(jīng)社區(qū)塊鏈?zhǔn)紫?jīng)濟(jì)分析師郭興華說。
天風(fēng)證券認(rèn)為,隨著OpenAI發(fā)布Sora文生視頻模型能力大幅提升,內(nèi)容創(chuàng)作工作流有望被顛覆,下一個(gè)億級用戶的互聯(lián)網(wǎng)平臺雛形已然出現(xiàn)。2000億美元的短視頻創(chuàng)作生態(tài)有望率先被顛覆,生成式AI在視頻創(chuàng)作和世界模型領(lǐng)域的大踏步進(jìn)步將實(shí)現(xiàn)對視頻、3D、游戲等下游應(yīng)用場景的滲透。
此前,A股有不少上市公司曾披露文生視頻有關(guān)布局。因賽集團(tuán)1月26日發(fā)布的調(diào)研紀(jì)要顯示,公司的Insight GPT預(yù)計(jì)于2024年3月底前開發(fā)實(shí)現(xiàn)文生視頻功能,之后推出公測版正式啟動(dòng)商業(yè)化,公司目前已收到幾家汽車、快消行業(yè)知名品牌方發(fā)出的AIGC(生成式人工智能)營銷項(xiàng)目投標(biāo)邀請。
“Sora的誕生意味著AGI實(shí)現(xiàn)可能從10年縮短至一兩年?!敝茗櫟t認(rèn)為,Sora只是小試牛刀,它展現(xiàn)的不僅僅是視頻制作的能力,而是大模型對真實(shí)世界有了理解和模擬之后,會帶來新的成果和突破。有了大模型技術(shù)作為基礎(chǔ),再加上人類知識的引導(dǎo),可以創(chuàng)造各個(gè)領(lǐng)域的超級工具,例如在生物醫(yī)學(xué)、蛋白質(zhì)、基因研究,物理、化學(xué)、數(shù)學(xué)的學(xué)科研究方面,大模型都會發(fā)揮作用。
算力需求再迎爆發(fā)
業(yè)內(nèi)認(rèn)為,Sora強(qiáng)大的文生視頻能力將快速推進(jìn)應(yīng)用端商業(yè)化落地、拉動(dòng)產(chǎn)業(yè)規(guī)模,進(jìn)而傳導(dǎo)到上游算力基礎(chǔ)設(shè)施,算力需求將再次迎來爆發(fā)。
據(jù)了解,Sora所需token(文本處理最小單位)數(shù)量相較于文本及圖片模型的推理呈數(shù)量級增長。經(jīng)中信證券簡單估算,對于一個(gè)60幀的視頻(約6至8秒),Sora要生成至少約120萬個(gè)token,這是相當(dāng)大的計(jì)算量。
“最強(qiáng)AI比拼的終點(diǎn)就是算力?!惫d華表示,為了更快和更好地實(shí)現(xiàn)對視頻的渲染和合成,高性能計(jì)算機(jī)和計(jì)算芯片的需求將進(jìn)一步釋放??萍急ǖ谋澈笮枰懔ε蛎泚砥ヅ?#xff0c;AI芯片將是這場變革中最核心的高地。
OpenAI的CEO薩姆·奧爾特曼表示,正在與投資者進(jìn)行洽談,旨在提高全球芯片產(chǎn)能,擴(kuò)大其支撐AI性能的能力,該項(xiàng)目可能需要籌集至多5萬億至7萬億美元資金。奧爾特曼建議,OpenAI、投資者、芯片制造商和電力供應(yīng)商建立合作關(guān)系,共同出資建立芯片工廠。
中信證券表示,本次OpenAI的模型更新仍然是圍繞底層算法層面,除去應(yīng)用端的投資機(jī)會,硬件端的需求也必然會隨著多模態(tài)的技術(shù)進(jìn)步而不斷提升。持續(xù)看好AI算力層面,尤其是得益于商業(yè)端成熟而帶來的更多的AI推理側(cè)算力的機(jī)會。
華金證券認(rèn)為,AI技術(shù)的快速發(fā)展催生了算力需求的快速提升,為國內(nèi)外算力產(chǎn)業(yè)鏈帶來了巨大的發(fā)展機(jī)遇。邏輯芯片市場空間巨大,國產(chǎn)廠商具有巨大的替代空間。半導(dǎo)體行業(yè)在經(jīng)歷2022年、2023年的去庫存周期后,銷售額有望在2024年迎來復(fù)蘇。
相關(guān)稿件