9月11日,2024 IDC中國(guó)年度盛典暨頒獎(jiǎng)典禮在上海盛大啟幕。本次峰會(huì)以「AI時(shí)刻,歡迎來(lái)到下一個(gè)大事件」為主題,匯聚行業(yè)專(zhuān)家、意見(jiàn)領(lǐng)袖,深度探討生成式AI、中國(guó)企業(yè)出海、創(chuàng)新業(yè)務(wù)模式、科技可持續(xù)發(fā)展、數(shù)據(jù)安全、數(shù)字工業(yè)、數(shù)字金融等熱門(mén)話題。天翼云科技有限公司市場(chǎng)營(yíng)銷(xiāo)部總經(jīng)理王彥丹出席峰會(huì)主論壇并發(fā)表演講,分享了云智一體時(shí)代背景下,天翼云如何以堅(jiān)實(shí)的國(guó)云智算底座驅(qū)動(dòng)產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型加速,開(kāi)創(chuàng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展新未來(lái)。
以大模型為代表的生成式AI飛速發(fā)展,人工智能產(chǎn)業(yè)化、商業(yè)化進(jìn)程不斷提速,這不僅對(duì)基礎(chǔ)設(shè)施提出了全新挑戰(zhàn),更促使云廠商加速布局智算基礎(chǔ)設(shè)施建設(shè),不斷提升算力與存力,以滿足海量數(shù)據(jù)處理和模型訓(xùn)練等需求。云智一體,已經(jīng)成為云計(jì)算產(chǎn)業(yè)發(fā)展的必然趨勢(shì)。作為云服務(wù)國(guó)家隊(duì),天翼云構(gòu)建領(lǐng)先的“息壤”一體化智算服務(wù)體系,以豐富的智算資源供給、強(qiáng)大的智算服務(wù)能力和開(kāi)放的模型應(yīng)用生態(tài),為千行百業(yè)轉(zhuǎn)型升級(jí)注智賦能。
豐富的智算資源供給,高效實(shí)現(xiàn)算力供需匹配
天翼云自建豐富、形態(tài)多樣的智能算力資源。圍繞AI產(chǎn)業(yè)集聚地區(qū),天翼云規(guī)劃建設(shè)北京、上海、廣東、浙江、安徽人工智能公共算力中心,并先后建成上海、北京萬(wàn)卡池,這也是全國(guó)最早建成并真正投產(chǎn)運(yùn)行的兩個(gè)國(guó)產(chǎn)化、全液冷、單集群萬(wàn)卡公共智算中心;在內(nèi)蒙古、貴州、寧夏等清潔能源集聚地建設(shè)智算中心,為用戶提供綠色算力。此外,天翼云還在280多個(gè)地市的一城一池節(jié)點(diǎn)和1000多個(gè)邊緣節(jié)點(diǎn)按需下沉AI云電腦算力和推理算力;提供國(guó)內(nèi)外主流的GPU、NPU算力方案,面向不同場(chǎng)景為用戶提供公有云、私有云、邊緣云多種形態(tài)服務(wù)。
在自建算力的同時(shí),天翼云發(fā)揮“息壤”的強(qiáng)大算網(wǎng)調(diào)度能力,大規(guī)模匯聚社會(huì)各方算力,促進(jìn)算力互聯(lián)互通、高效利用和供需匹配。基于在算力統(tǒng)一接入、算數(shù)網(wǎng)整體調(diào)度、算力便捷使用三個(gè)方面的顯著技術(shù)突破,“息壤”可服務(wù)于三大算力場(chǎng)景:一是天翼云自營(yíng)公共算力服務(wù)平臺(tái),目前已接入39家算力伙伴,實(shí)現(xiàn)三方各類(lèi)算力可調(diào)度,顯著擴(kuò)大算力規(guī)模和品類(lèi),滿足公有云客戶的多元算力需求;二是幫助客戶構(gòu)建行業(yè)算力互聯(lián)網(wǎng),例如高校算力聯(lián)盟等,實(shí)現(xiàn)行業(yè)內(nèi)算力利用率的有效提升;三是幫助地方政府構(gòu)建城市算力互聯(lián)網(wǎng),實(shí)現(xiàn)區(qū)域內(nèi)多方算力的一體化統(tǒng)籌調(diào)度,助力地方經(jīng)濟(jì)和產(chǎn)業(yè)發(fā)展。
強(qiáng)大的智算服務(wù)能力,降低大模型應(yīng)用創(chuàng)新開(kāi)發(fā)門(mén)檻
“息壤”具備高效的異構(gòu)計(jì)算能力,可為萬(wàn)億參數(shù)基礎(chǔ)大模型提供高性能計(jì)算服務(wù)。在大算力需求方面,天翼云建設(shè)PB級(jí)并行文件存儲(chǔ),并組建低延時(shí)超大規(guī)模RDMA網(wǎng)絡(luò),通過(guò)計(jì)算、內(nèi)存和通訊的多維優(yōu)化,提升綜合算效。在性能方面,對(duì)AI框架進(jìn)行升級(jí)、存儲(chǔ)加速,實(shí)現(xiàn)checkpoint文件快速保存、加載,將國(guó)產(chǎn)算力的綜合算效提升到了行業(yè)可比水平。在穩(wěn)定性方面,通過(guò)多項(xiàng)指標(biāo)的監(jiān)控分析,實(shí)現(xiàn)故障訓(xùn)前發(fā)現(xiàn),有效控制大模型訓(xùn)練中斷恢復(fù)時(shí)長(zhǎng),實(shí)現(xiàn)訓(xùn)練任務(wù)長(zhǎng)期穩(wěn)定、高可用運(yùn)行?;趪?guó)產(chǎn)萬(wàn)卡智算集群和自研智算平臺(tái),天翼云已具備支撐萬(wàn)億參數(shù)基礎(chǔ)大模型訓(xùn)練的能力。
“息壤”一站式訓(xùn)推服務(wù)能力,可降低大模型應(yīng)用創(chuàng)新開(kāi)發(fā)門(mén)檻。天翼云將大模型精調(diào)場(chǎng)景簡(jiǎn)化操作至選數(shù)據(jù)、選硬件和選模型三個(gè)步驟,顯著提升部署效率;通過(guò)自研AI框架、3D并行加速、自研訓(xùn)練加速庫(kù)、容器調(diào)度優(yōu)化等核心技術(shù),大幅提升訓(xùn)練效率;通過(guò)模型量化壓縮、自研推理加速算子庫(kù)、自研AI推理加速框架等核心技術(shù),提高推理效率;通過(guò)全鏈路故障檢測(cè)、定位、告警,全鏈路日志監(jiān)控與可視化、斷點(diǎn)續(xù)訓(xùn)快速恢復(fù)等核心技術(shù),實(shí)現(xiàn)訓(xùn)推過(guò)程全鏈路監(jiān)控。
開(kāi)放的模型應(yīng)用生態(tài),加快推動(dòng)AI應(yīng)用落地
開(kāi)放合作共享的生態(tài)是產(chǎn)業(yè)進(jìn)一步繁榮發(fā)展的基礎(chǔ)。天翼云全新升級(jí)AI電腦,開(kāi)放AI云電腦平臺(tái),打造AI應(yīng)用中心,具備AI助手、AI空間、AI客服、AI低代碼等AI創(chuàng)新應(yīng)用,使AI應(yīng)用能夠更廣泛地接入和使用。
此外,天翼云魔樂(lè)(Modelers)開(kāi)發(fā)者社區(qū),攜手伙伴為開(kāi)發(fā)者提供一個(gè)交流、學(xué)習(xí)和創(chuàng)新的平臺(tái)。魔樂(lè)社區(qū)集成了開(kāi)發(fā)工具鏈、模型庫(kù)、數(shù)據(jù)集和體驗(yàn)空間等核心組件,覆蓋自然語(yǔ)言處理、視覺(jué)、音頻等領(lǐng)域,提供原生模型、易用開(kāi)發(fā)工具、豐富的生態(tài)資源,致力于聚合優(yōu)質(zhì)中文AI資源,使能AI應(yīng)用創(chuàng)新,加速伙伴商業(yè)閉環(huán),通過(guò)提供極致易用的工具鏈,端到端支持AI應(yīng)用開(kāi)發(fā)的全流程。
伴隨新一輪人工智能浪潮涌動(dòng)以及AI規(guī)模化落地應(yīng)用,智算基礎(chǔ)設(shè)施的重要性愈發(fā)凸顯。作為云計(jì)算原創(chuàng)技術(shù)策源地、數(shù)字中國(guó)建設(shè)主力軍,天翼云將不斷夯實(shí)國(guó)云智算底座,持續(xù)突破技術(shù)創(chuàng)新的邊界,強(qiáng)化服務(wù)能力,以普惠智能算力賦能千行百業(yè)蝶變,攜手各界伙伴共繪數(shù)智化新藍(lán)圖。
相關(guān)稿件