據(jù)不完全統(tǒng)計,國產(chǎn)大模型數(shù)量目前已超過200個,覆蓋多個行業(yè)領域,應用場景不斷拓展。國家互聯(lián)網(wǎng)信息辦公室最新公布的數(shù)據(jù)顯示,截至今年3月,我國共有117個生成式人工智能服務完成備案。
目前,我國大模型數(shù)量不斷增加,且應用不斷加速,這需要海量智算的支撐。受需求影響,我國智算規(guī)模持續(xù)擴大,據(jù)中國信通院,截至2023年底,我國算力規(guī)模達到230EFLOPS,其中智能計算占比近30%,規(guī)模約69 EFLOPS,相較于2023年6月的50EFLOPS,半年時間規(guī)模增加38%。
伴隨智算的快速發(fā)展,數(shù)據(jù)中心也從主要提供通用算力轉向提供智算,數(shù)據(jù)中心向智算中心演進。對企業(yè)而言,這意味著巨大的產(chǎn)業(yè)機遇,但同時,也有著實際的挑戰(zhàn)需要面對。
一是數(shù)據(jù)中心提供智算并非簡單用GPU服務器替換原有服務器,從基礎設施上來看,供電、散熱、樓層承重等都有可能因此改變,需要進行一系列的優(yōu)化;一是市場競爭越發(fā)激烈,智算中心規(guī)模正快速增加,據(jù)中國IDC圈不完全統(tǒng)計,截止2024年5月23日,中國大陸已有智算中心283座,目前超過一半(53%,150座)智算中心都處于開工/在建狀態(tài)(點擊了解《283座智算中心的區(qū)域分布和規(guī)模詳情》)。在高漲的智算需求下,可以預見,未來還將建設更多智算中心,如何受到市場認可,提升上架率等問題也擺在企業(yè)面前。
智算中心項目整體建設進展
具體來看,數(shù)據(jù)中心向智算中心演進,其基本的區(qū)別在于智算中心搭載的主要是GPU,服務對象主要是人工智能應用,而GPU的功率較高,這就需要適配一整套軟硬件設施。
如供配電方面,高功率設備需要更大的電流和更高的電壓來保證其正常運行,這就要求供配電系統(tǒng)具備足夠的容量和穩(wěn)定性,可能需要優(yōu)化原有設備。
散熱方面,高功率對于制冷提出了更高的要求,傳統(tǒng)風冷有其散熱極限,制冷更高效率的液冷被公認為是智算標配,據(jù)《中國液冷數(shù)據(jù)中心市場深度研究報告》,單機柜密度<20KW,采用風冷可滿足散熱需求;單機柜密度≥20KW便需要采用液冷技術。
運維方面,液冷的應用及供配電等方面的改變會對運維造成較大影響,如液冷與風冷運維方式有較大差異,需要專業(yè)人才的檢查維護。
除此之外,大量數(shù)據(jù)的傳輸、存儲,還需要高效傳輸網(wǎng)絡、先進存儲的支撐,同樣也需要進行在硬件上進行革新,以提升網(wǎng)絡帶寬、提高存儲效率。硬件的應用也不能孤立進行,所有的硬件革新均需要軟件層面的適配,以實現(xiàn)更高效的資源利用,提升整體性能。
數(shù)據(jù)中心向智算中心演進,需要綠色安全、普惠易用,這樣才能在符合政策要求下,提升市場競爭力。
綠色方面,數(shù)據(jù)中心是高能耗產(chǎn)業(yè),“雙碳”目標下,綠色化是數(shù)據(jù)中心發(fā)展的必然趨勢,能耗效率不過關的數(shù)據(jù)中心正逐步改建、騰退,在數(shù)據(jù)中心向智算中心演進的過程中,節(jié)能低碳將實現(xiàn)進一步發(fā)展。
國家也正通過“東數(shù)西算”工程等來加快綠色發(fā)展,各地方也在限定PUE等一系列舉措來推進,以北京市2023年12月發(fā)布的地方標準《數(shù)據(jù)中心能源效率限額》為例,相較于2019年第一次修訂后的標準,PUE限定值從1.4降為1.35,先進值從1.2降為1.15。準入值不僅從原來的1.3有所降低,還更為細化,年能耗≤2萬噸標煤的PUE準入值為1.25,年能耗>2萬噸標煤的PUE準入值為1.2,
由此可見,只有綠色低碳的智算中心才符合政策標準,實現(xiàn)可持續(xù)發(fā)展。從行業(yè)來看,提升綠電使用比例、促進儲能發(fā)展,提升液冷應用等,均是推動智算中心綠色化的重要舉措,目前也已經(jīng)在被逐步應用。
安全方面,智算中心是指通過使用大規(guī)模異構算力資源,包括通用算力和智能算力,主要為人工智能應用提供所需算力、數(shù)據(jù)和算法的設施。
在提供算力、數(shù)據(jù)、算法的過程中存在數(shù)據(jù)、網(wǎng)絡與設備安全隱患等問題,需要加強通信網(wǎng)絡安全防護管理,提升網(wǎng)絡安全防護能力水平,創(chuàng)新數(shù)據(jù)中心災備建設,加強網(wǎng)絡穩(wěn)定性監(jiān)測,確保數(shù)據(jù)傳輸安全,建立健全算力網(wǎng)安全風險研判、防控協(xié)同、防范化解機制等
普惠易用方面,即智算成本低廉,且便于用戶使用,這是獲得更大市場的必要條件。
目前來看,想要實現(xiàn)這一點,需要從多方面入手,從企業(yè)自身出發(fā),可以通過應用液冷技術、優(yōu)化建設布局,運用智能運維等提升算力有效供給。如在用電成本較低的地區(qū)建設智算中心。用電占據(jù)著數(shù)據(jù)中心運營過程中的主要成本,智算中心同樣如此,如果用電投入減少,算力成本也就降低,能投推動算力的應用,提升上架率。從地理位置上來看,我國西部地區(qū)在電價上有較大優(yōu)勢,伴隨著“東數(shù)西算”工程的啟動與深入,西部樞紐智算中心建設正在加快,目前項目數(shù)量已達到56個(點擊了解《283座智算中心的區(qū)域分布和規(guī)模詳情》),將有效推動智算成本的降低。
圖:智算中心東西部地域投資額和算力規(guī)模
從行業(yè)出發(fā),算力調度的優(yōu)化、算力券的發(fā)布等都是降低智算成本的有效舉措,而這需要多主體共同協(xié)作,包括政府部門、算力服務方、算力調度方、算力用戶等,這能夠積極促進智算消納,形成良好的供需關系,提升智算中心的上架率,實現(xiàn)智算的即需即取。
綜合來看,大模型等人工智能快速發(fā)展下,數(shù)據(jù)中心加速向智算中心演進,這其中有著巨大的機遇,但也有著諸多挑戰(zhàn),企業(yè)想要從中獲益,需要清晰的了解數(shù)據(jù)中心與智算中心的區(qū)別,明確如何進行優(yōu)化革新,同時還要積極響應政策,推動智算中心的綠色安全、普惠易用,以提升自身競爭力,推動智算的有效供給。