算力突圍:打造AI浪潮下的堅實底座
北京人工智能公共算力平臺點亮、京津冀最大綠色算力中心投產(chǎn)運營、京津冀算力廊道正在謀劃中、上海首個垂直領(lǐng)域AI千卡集群落地、全國首個算力交易平臺上線……在全國多地,算力中心布局落地的消息頻傳新進展。
所謂算力,就是對數(shù)據(jù)的處理能力。小到手機、個人電腦,大到服務(wù)器、超級計算機,算力正走進千家萬戶、服務(wù)千行百業(yè),成為像水、電、燃氣一樣的公共基礎(chǔ)資源,提供“即取即用”的社會化服務(wù)。AI浪潮席卷而來,算力需求不斷加大,作為新時代技術(shù)“底座”的智能算力產(chǎn)業(yè)方興未艾。
智算中心加速崛起
在北京朝陽區(qū)酒仙橋核心地帶,北京數(shù)字經(jīng)濟算力中心正在如火如荼建設(shè)中。該算力中心由北京電子控股有限責任公司旗下提供規(guī)?;冗M智算算力、AI云及AI轉(zhuǎn)型服務(wù)的高科技企業(yè)——北京電子數(shù)智科技有限責任公司(以下簡稱“北電數(shù)智”)承建,預(yù)計2024年完成基礎(chǔ)設(shè)施建設(shè),達產(chǎn)后實現(xiàn)多元異構(gòu)的1000P智能算力供給。北京市經(jīng)濟和信息化局局長姜廣智近日披露,初步統(tǒng)計,北京已形成1.2萬P的總算力供給規(guī)模,下一步將加速算力基礎(chǔ)設(shè)施建設(shè),打造京津冀算力廊道,形成以智能算力為主、通用算力和超級算力多元協(xié)同的首都地區(qū)算力供給體系。
今年以來,ChatGPT的橫空出世掀起一波席卷全球的大模型浪潮,這種強勁的需求瞬間傳導(dǎo)至上游,支撐大模型訓(xùn)練和推理的算力成為“兵家必爭之地”。作為智能時代的新型基礎(chǔ)設(shè)施,智能算力中心迎來飛速增長的機遇窗口。2023年10月,工信部等六部門聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,其中提出2025年建成50個智能計算中心等量化指標。而計算力方面,到2025年規(guī)模將超過300EFLOPS,智能算力占比達到35%。
中國工程院院士、清華大學(xué)計算機系教授鄭緯民說,從整體而言,我國算力基礎(chǔ)設(shè)施規(guī)模已位居世界前列,但人均算力尚低。在數(shù)字經(jīng)濟時代,人工智能的進一步發(fā)展需要通過軟硬件密切協(xié)同,才能進一步加速算力提升和使用效率。在未來,新型數(shù)據(jù)中心將是提供多樣性計算綜合能力的算力集群,以滿足千行百業(yè)智能化的需求。
11月中旬,算力租賃概念股匯納科技宣布,由于算力需求大幅增加,其內(nèi)嵌英偉達A100芯片的高性能服務(wù)器算力服務(wù)收費將上調(diào)100%。匯納科技的動向,只是我國算力市場環(huán)境的縮影。多家券商在10月發(fā)布的研報提出,隨著行業(yè)需求的攀升,算力租賃行業(yè)將進入新一輪漲價周期。
“我們觀察到,未來9到12個月算力需求還是會非常緊張?!卑俅ㄖ悄芗夹g(shù)聯(lián)合創(chuàng)始人陳煒鵬在今年3個多月前的一場行業(yè)論壇中說道。多家大模型企業(yè)均遇到了不同程度的算力缺口。算力緊缺,已成為影響我國大模型產(chǎn)業(yè)發(fā)展重要因素。
“大模型是新型基礎(chǔ)設(shè)施的關(guān)鍵底座之一,大模型的競爭也是國家科技戰(zhàn)略的競爭,中國一定要布局全棧自主創(chuàng)新的大模型產(chǎn)品,同時要構(gòu)建國產(chǎn)化算力?!编嵕暶裉嵝选?/p>
鄭緯民表示,目前一些國外廠商在芯片生產(chǎn)上有著更多的話語權(quán),國內(nèi)則因起步較晚,自研的芯片在性能上仍稍顯不足。但性能上的差距可以在生態(tài)上得到彌補。所謂好的生態(tài)就是讓芯片用起來不費勁,建立這樣的生態(tài),并讓市場接受,需要一個過程。國產(chǎn)生態(tài)只要解決好編程框架、并行加速、調(diào)度器、內(nèi)存分配系統(tǒng)、容錯系統(tǒng)、存儲系統(tǒng)等問題,即使只有國外芯片60%的性能,國產(chǎn)芯片也會大受歡迎。
鄭緯民提出,除了人均算力水平尚低、算力關(guān)鍵技術(shù)等限制外,隨著數(shù)據(jù)爆發(fā)式增長與算力單點性能極限之間的矛盾日益突出,我國算力節(jié)點通過網(wǎng)絡(luò)靈活高效調(diào)配算力資源的能力仍存在不足,算網(wǎng)協(xié)同和全局調(diào)度能力有待提高,難以滿足數(shù)據(jù)對算力隨需處理的需求,將領(lǐng)先算力高效轉(zhuǎn)化為解決科學(xué)與工程難題的能力依然面臨挑戰(zhàn)。
他表示,智算中心的建設(shè)和布局是一個重要趨勢,但也伴隨著包括資源分配、合作與競爭等方面的挑戰(zhàn),算力的統(tǒng)一調(diào)度是算力發(fā)展的路徑之一,其關(guān)鍵在于將分散的算力資源聚合,形成集群效應(yīng)。
同時,鄭緯民對算力互聯(lián)互通也提出了兩點建議:一是屏蔽異構(gòu)基礎(chǔ)設(shè)施,通過統(tǒng)一的資源管理與調(diào)度軟件實現(xiàn)算力的互通;二是提供更多的服務(wù)軟件,抓住算力應(yīng)用的機遇,提升算力普惠價值。
為滿足客戶對算力的靈活、高效、充分使用的需求,北電數(shù)智在算力靈活調(diào)度層面發(fā)力,整合分散的先進計算能力、充分發(fā)揮計算效果。同時,北電數(shù)智也在布局兼顧國內(nèi)外不同品牌訓(xùn)練芯片及推理芯片等多種算力集群,通過調(diào)度算法,更合理地分配和調(diào)度計算資源,實現(xiàn)最優(yōu)的計算性能和資源利用率。同時,其也在同步規(guī)劃能夠更高效地配置和使用計算能力的先進軟件,智能分析用戶提交的作業(yè)任務(wù),根據(jù)任務(wù)特性進行自動化配置,確保每一個任務(wù)都能夠得到最適合的計算資源。
算力狂飆也須兼顧“雙碳”
鄭緯民特別提醒道,在建設(shè)智能算力中心的同時,也要兼顧算力能耗與國家“雙碳”目標的平衡。未來數(shù)據(jù)中心的發(fā)展須考慮不同地區(qū)能源結(jié)構(gòu)的差異、同一地區(qū)不同行業(yè)的業(yè)務(wù)差異,提供更綠色的算力,并滿足實時應(yīng)用的需求。
在新建智算中心的同時,傳統(tǒng)數(shù)據(jù)中心的智算改造與升級,成為綠色算力的重要組成部分。北電數(shù)智相關(guān)負責人介紹,北電數(shù)智通過軟硬件升級和能耗方案的優(yōu)化,幫助傳統(tǒng)數(shù)據(jù)中心實現(xiàn)面向未來的整體智算升級與政策合規(guī);同時,以攜手改造、共同運營的全方位投入產(chǎn)出支持,幫助傳統(tǒng)數(shù)據(jù)中心獲得可持續(xù)增長,以滿足人工智能產(chǎn)業(yè)對數(shù)據(jù)中的高算力、高效率、更環(huán)保的需求。
鄭緯民還提醒,算力、網(wǎng)絡(luò)具備很強的公共基礎(chǔ)設(shè)施特性,加快建立一個開放性的產(chǎn)業(yè)生態(tài),把選擇權(quán)交給用戶,才能驅(qū)動行業(yè)百花齊放,從而真正促進大模型產(chǎn)業(yè)的健康發(fā)展。