AI大模型空前火爆,應(yīng)用服務(wù)加速,正在走進(jìn)人們的工作和生活。其中,大語言模型(LLM)以其在圖像、語音、自然語言處理等方面表現(xiàn)出的卓越能力,使其成為最重要的AI技術(shù)之一。 作為中國AI服務(wù)器市場(chǎng)的TOP3和中國領(lǐng)先的計(jì)算產(chǎn)品方案提供商,寶德堅(jiān)持技術(shù)創(chuàng)新,基于英特爾AI軟硬件技術(shù)基礎(chǔ)等打造多樣性的AI算力和解決方案,為AI產(chǎn)業(yè)快速發(fā)展和AI大模型落地應(yīng)用做出積極的貢獻(xiàn)。
英特爾?至強(qiáng)?CPU Max系列,大語言模型工作負(fù)載的實(shí)力擔(dān)當(dāng)
一直以來,英特爾以廣泛的AI硬件和軟件組合助力大語言模型的普及,推動(dòng)AI發(fā)展惠及各行各業(yè)。其中,第四代英特爾?至強(qiáng)?可擴(kuò)展處理器以其原生AI加速能力和全面提升的整體性能,充分滿足大模型工作負(fù)載以及復(fù)雜AI計(jì)算場(chǎng)景的需求。
第四代英特爾?至強(qiáng)?可擴(kuò)展處理器具有英特爾高級(jí)矩陣擴(kuò)展(AMX)的AI加速功能,有全新的指令集與電路設(shè)計(jì),可幫助諸如圖像識(shí)別、對(duì)象探測(cè)等任務(wù)中的張量處理獲得多倍效率提升,并可用于INT8、BF16等不同數(shù)據(jù)格式以加速深度學(xué)習(xí)訓(xùn)練和推理工作負(fù)載等多種類型的AI模型,性能高達(dá)上一代10倍。
英特爾?至強(qiáng)?CPU Max系列
在此基礎(chǔ)上,英特爾?至強(qiáng)?CPU Max系列更是大模型的算力擔(dān)當(dāng),它每顆CPU提供64GB的高帶寬內(nèi)存(HBM2E),兩顆共128GB,有效解決大語言模型工作負(fù)載經(jīng)常受到內(nèi)存帶寬限制的窘境。數(shù)據(jù)顯示,其針對(duì)建模、人工智能、深度學(xué)習(xí)、高性能計(jì)算 (HPC) 和數(shù)據(jù)分析等實(shí)際工作負(fù)載的性能提升了 4.8 倍。
基于英特爾?至強(qiáng)?CPU Max系列的寶德服務(wù)器,為大模型推理應(yīng)用提供澎湃算力
寶德自研雙路服務(wù)器PR2715E
寶德自研雙路服務(wù)器PR2715E,支持兩顆英特爾?至強(qiáng)?CPU Max系列,以比較基礎(chǔ)的32核心+64GB HBM緩存的Max 9462為例,該產(chǎn)品就可輕松支持60B參數(shù)下8路推理需求。它采用CPU+GPU異構(gòu)計(jì)算設(shè)計(jì),有8個(gè)標(biāo)準(zhǔn)PCIe5.0插槽,可以支持8張單寬或3張雙寬包括英特爾?GPU Flex系列的GPU計(jì)算卡,強(qiáng)大的AI算力和安全技術(shù),能夠?yàn)榇竽P虯I推理工作負(fù)載加速和護(hù)航。另外,該機(jī)型有32個(gè)DDR5內(nèi)存插槽,最大可支持8TB,支持400Gb/s高速網(wǎng)絡(luò),優(yōu)化低延遲應(yīng)用體驗(yàn);它最大支持12個(gè)2.5”( 3.5”)和4個(gè)后置2.5 ” SATA/SAS/NVMe熱插拔硬盤,或24個(gè)2.5”SATA/SAS/NVMe和2個(gè)后置2.5 ”SATA/SAS熱插拔硬盤,支持內(nèi)置1個(gè)M.2(NVMe/SATA),保障了整機(jī)性能的強(qiáng)勁可靠。此外,PR2715E支持液冷散熱方案,通過選用冷板液冷方案,可以有效減少AI大模型算力集群和數(shù)據(jù)中心的整體碳排放和顯著降低客戶TCO(總體擁有成本)。
寶德四子星服務(wù)器PR2745TE
尤其值得一提的是,寶德四子星服務(wù)器PR2745TE,在2U 機(jī)架中提供多達(dá) 4個(gè)雙路節(jié)點(diǎn)和高容量存儲(chǔ),使得它1臺(tái)服務(wù)器就可以支持多達(dá)八顆英特爾?至強(qiáng)?CPU Max系列,從而完美支持60B參數(shù)下32路推理需求。而且,它在2U規(guī)格內(nèi)提供超常的吞吐量、存儲(chǔ)、網(wǎng)絡(luò)、I / O、內(nèi)存和處理能力,形成一個(gè)靈活的平臺(tái),為要求苛刻的AI、高性能和橫向擴(kuò)展等工作負(fù)載提供強(qiáng)勁動(dòng)力。PR2745TE為簡化部署和維護(hù)而設(shè)計(jì),并以最高質(zhì)量組裝,以確保最大容量的連續(xù)操作。客戶可以通過它提供的解決方案滿足最具挑戰(zhàn)性的IT 需求,并受益于特殊的總擁有成本(TCO)。 作為業(yè)界雙子星/多子星服務(wù)器的首創(chuàng),寶德四子星服務(wù)器久經(jīng)市場(chǎng)考驗(yàn),已經(jīng)幫助AI用戶、數(shù)據(jù)中心、 高性能計(jì)算和云計(jì)算環(huán)境的客戶獲得了來自數(shù)據(jù)中心資源的強(qiáng)大競(jìng)爭優(yōu)勢(shì),也將是大模型推理應(yīng)用堅(jiān)實(shí)的算力基礎(chǔ)之一。
相關(guān)稿件