中國儲能網(wǎng)訊:曾經(jīng),面對“什么東西看不見摸不著,卻時刻影響人們生活”的問題,許多人會脫口而出“空氣”。如今,“算力”也成為不少人心中的答案。數(shù)字時代,算力已然像水、電、燃氣一樣便捷可用。曾經(jīng),面對“什么東西看不見摸不著,卻時刻影響人們生活”的問題,許多人會脫口而出“空氣”。如今,“算力”也成為不少人心中的答案。數(shù)字時代,算力已然像水、電、燃氣一樣便捷可用。
織就數(shù)字時代的算力網(wǎng)
5月,工業(yè)和信息化部等六部門聯(lián)合發(fā)布的《算力基礎設施高質量發(fā)展行動計劃》(以下簡稱《行動計劃》)提出,要“探索構建布局合理、泛在連接、靈活高效的算力互聯(lián)網(wǎng)”。近日,我國正式啟動“算力互聯(lián)網(wǎng)試驗網(wǎng)”建設,拉開了構建數(shù)字經(jīng)濟時代新型信息基礎設施的序幕。
算力互聯(lián)網(wǎng),顧名思義是給算力搭建一個網(wǎng)絡空間,就像Internet(互聯(lián)網(wǎng))連通全球的網(wǎng)友和設備一樣,現(xiàn)在我們要把全國的算力都串聯(lián)起來。
“算力互聯(lián)網(wǎng)并不是一張新的網(wǎng)絡,而是在現(xiàn)有互聯(lián)網(wǎng)基礎上,將分散在各地的算力資源連接在網(wǎng)上,通過標準化的算力標識和協(xié)議接口,跨域資源互聯(lián)網(wǎng)絡,實現(xiàn)全網(wǎng)異構算力的智能感知、實時發(fā)現(xiàn)、隨需獲取?!敝袊畔⑼ㄐ叛芯吭涸洪L余曉暉說道,和以往的網(wǎng)絡互聯(lián)互通不同,算力互聯(lián)互通更加側重供需之間的互聯(lián),其目的是實現(xiàn)人工智能、科學計算、工業(yè)計算等計算任務在本地算力資源不足或隨時隨地隨需使用算力時,計算任務及其數(shù)據(jù)可以流動到另一個算力池進行計算,實現(xiàn)算力資源智能感知、實時發(fā)現(xiàn)和隨需獲取,使算力像水、電一樣便捷使用。
就像電力讓燈泡發(fā)光,算力也是AI的“燃料”。算力產業(yè)已被納入國家重要發(fā)展戰(zhàn)略。從2024年“加快形成全國一體化算力體系”到2025年“優(yōu)化算力資源布局”,政府工作報告連續(xù)兩年強調算力產業(yè)高質量發(fā)展的重要性。
算力基礎設施高質量發(fā)展需要各級政府以及基礎電信運營商、第三方數(shù)據(jù)中心服務商、互聯(lián)網(wǎng)企業(yè)等各類市場主體在算力基礎設施建設運營中發(fā)揮各自優(yōu)勢,互促互補、形成合力。如今,包括電信運營商、云服務巨頭、智算中心、科研機構在內的多方力量已紛紛入局,共同織就這張未來的“算力之網(wǎng)”。
從“資源孤島”到“一云多芯 ” 算力互聯(lián)網(wǎng)破局而生
如果說數(shù)據(jù)是數(shù)字經(jīng)濟的“石油”,那么算力就是驅動這一切運轉的“引擎”。算力是集信息計算力、網(wǎng)絡運載力、數(shù)據(jù)存儲力于一體的新型生產力,主要通過算力基礎設施向社會提供服務。從AIGC(人工智能生成內容)的驚艷問世,到自動駕駛汽車的決策,再到新藥研發(fā)周期的大幅縮短,都離不開海量算力的支撐。算力,已不再是少數(shù)科研機構的專屬工具,而是驅動社會創(chuàng)新和產業(yè)升級的核心生產力。
如最近爆火的電視劇《長安的荔枝》所描述的那樣,嶺南盛產荔枝(算力),遠在長安的楊貴妃想吃荔枝,就命令人在鮮荔枝腐壞前將其從嶺南轉運至長安。算力也得在數(shù)據(jù)“超時”前完成調度與計算。
“我國數(shù)據(jù)中心和算力資源總體上呈現(xiàn)‘東部需求旺盛,西部資源富集’的格局,需要通過構建新型算力網(wǎng)絡體系,將東部算力需求有序引導到西部,優(yōu)化數(shù)據(jù)中心建設布局?!敝袊こ淘涸菏縿㈨崫嵲诙鄠€場合強調,構建全國一體化的算力網(wǎng)絡體系是應對當前挑戰(zhàn)的必然選擇。
長期以來,各地的計算中心、數(shù)據(jù)中心如同一個個“資源孤島”,技術體系各異,標準難以統(tǒng)一,導致算力無法在更廣闊的范圍內高效流通和共享。
在談及行業(yè)痛點時,聯(lián)通數(shù)科云計算事業(yè)部云管平臺部總經(jīng)理溫源也表達了類似的看法:“當前行業(yè)面臨的主要阻礙,是算力資源碎片化、供需錯配問題突出,導致資源利用率不高。算力互聯(lián)網(wǎng)正是為了解決這些核心問題而生。”他具體闡述道,“首先是整合異構資源,通過統(tǒng)一的調度平臺和標準接口,納管通算、智算、超算,打破‘算力孤島’;其次是實現(xiàn)智能匹配供需,平臺可以按任務需求動態(tài)匹配最優(yōu)資源,例如在‘中訓邊推’(中部訓練、邊緣推理)場景中,聯(lián)通打造的‘星羅’調度平臺能夠實現(xiàn)任務與資源毫秒級匹配;最終實現(xiàn)降本增效,降低用戶獲取算力的門檻和成本,提升資源周轉率?!?/span>
與此同時,以大模型為代表的AI技術浪潮,為算力互聯(lián)網(wǎng)的發(fā)展按下了“快進鍵”。據(jù)OpenAI分析,自2012年以來,全球頭部AI模型訓練算力需求每3至4個月便翻一番,增長曲線極為陡峭。這種對巨量智能算力的“饑渴”,讓算力互聯(lián)網(wǎng)的價值越發(fā)凸顯。
溫源認為,算力互聯(lián)網(wǎng)正是滿足AI時代算力需求的理想架構。他指出,大模型對算力互聯(lián)網(wǎng)提出了新要求和新挑戰(zhàn),“例如,千億級模型訓練需要TB級的帶寬和毫秒級的時延互聯(lián),同時需要支持像‘西訓東推’‘中訓邊推’等復雜的調度場景?!倍懔ヂ?lián)網(wǎng)恰好能發(fā)揮獨特優(yōu)勢,“以聯(lián)通的實踐為例,我們依托400GROADM的全光底座,可以實現(xiàn)樞紐間毫秒級的時延直連;通過‘星羅’平臺的智能調度,能夠動態(tài)分配訓練和推理任務,使資源利用率達到75%以上;再結合‘東數(shù)西算’的布局,將訓練任務調度至呼和浩特等西部低碳樞紐,可將PUE(電源使用效率)降低至1.2以下。”
除了中國聯(lián)通,各大廠商也正從不同路徑探索解決方案,共同推動算力互聯(lián)網(wǎng)從理念走向現(xiàn)實。
阿里云很早就開始了對大規(guī)模、分布式計算的探索。其自研的“飛天”(Apsara)云操作系統(tǒng),本質上就是一套為統(tǒng)一管理和調度百萬級服務器而設計的“超級計算機”操作系統(tǒng)。在算力互聯(lián)網(wǎng)時代,阿里云正將其“公共云”的能力延伸,構建一個開放的算力調度體系。
面對來自英偉達、AMD以及國產芯片廠商,如海光、寒武紀等的異構算力,阿里云通過CIPU這一專用處理器,將網(wǎng)絡、存儲、安全等基礎設施能力從CPU中卸載,并對上層提供標準化的接口。這使得無論底層芯片如何變化,上層應用都能獲得一致、高性能的算力服務。
騰訊云則將重點放在了打造極致性能的“運載力”上。其推出的新一代算力網(wǎng)絡“星脈網(wǎng)絡”,是專門為AI和高性能計算場景設計的。
該網(wǎng)絡通過自研的網(wǎng)絡設備和擁塞控制算法,實現(xiàn)了3.2TB的超高端口帶寬和跨區(qū)域低至毫秒級的通信延遲。
華為云的算力互聯(lián)網(wǎng)戰(zhàn)略,深深植根于其“云邊端協(xié)同”的理念。其目標是構建一張無處不在的、架構統(tǒng)一的算力網(wǎng)絡,覆蓋中心云、邊緣節(jié)點乃至終端設備。這一戰(zhàn)略的核心是其“昇騰”(Ascend)AI計算架構和分布式云基礎設施“擎天”(QingTian)架構。
通過“擎天”架構,華為云能夠將部署在全國各地的昇騰AI算力中心(如武漢、西安、深圳的人工智能計算中心)進行邏輯上的統(tǒng)一資源化,形成一個巨大的分布式算力池。
用戶無需關心物理位置,即可通過華為云的統(tǒng)一入口,調用最優(yōu)的算力資源。這種模式尤其適用于自動駕駛、工業(yè)質檢等需要低延遲邊緣計算和高強度中心訓練協(xié)同的場景。模型在中心的昇騰集群上完成訓練,然后一鍵推送到遍布全國的邊緣節(jié)點進行實時推理。
除了商業(yè)公司,以鵬城實驗室為代表的國家級科研機構也在算力互聯(lián)網(wǎng)的建設中扮演著關鍵角色。其研發(fā)的“鵬城云腦”系列,特別是“鵬城云腦Ⅱ”,是全球首個E級(每秒百億億次)AI計算平臺,也是我國在算力網(wǎng)絡領域的重大戰(zhàn)略部署。
“鵬城云腦”不僅自身算力強大,更重要的使命是作為中國算力網(wǎng)的核心節(jié)點,探索如何將全國各大超算中心、智算中心進行高速互聯(lián)和協(xié)同調度。
從標準到算法 疏通算力輸送“大動脈”
想要富,先修路。而在算力產業(yè)中,網(wǎng)絡也是算力的路。
以中國聯(lián)通為代表的電信運營商,憑借得天獨厚的網(wǎng)絡優(yōu)勢和廣泛的算力節(jié)點布局,在算力互聯(lián)網(wǎng)中扮演著不可或缺的角色?!白鳛檫\營商,我們的核心優(yōu)勢在于‘云網(wǎng)融合’。網(wǎng)絡是算力的‘輸送帶’,只有把‘路’修好,算力才能跑得快、跑得穩(wěn)?!睖卦磸娬{。他詳細介紹了中國聯(lián)通基于“四位一體”架構的核心優(yōu)勢:
“第一是全光底座,我們的400GROADM網(wǎng)絡已覆蓋22個省,實現(xiàn)了算力樞紐間低于24ms的直連時延;第二是智能化產業(yè)互聯(lián)網(wǎng),通過SRv6+SDN技術實現(xiàn)業(yè)務級的SLA(服務水平協(xié)議)保障;第三是‘星羅’調度平臺,它能夠納管多元異構算力,使整體調度效率提升40%;第四是雙引擎基座,以裸金屬+容器化的雙棧架構支撐通用計算和智能計算的混合部署?!?/span>
“星羅”先進算力調度平臺,是聯(lián)通這套體系的“智慧大腦”。當被問及平臺的實際運作時,溫源以“中訓邊推”場景為例介紹道:“首先平臺會進行任務拆分,比如將模型訓練任務調度到西部的超算中心(如呼和浩特),同時將推理任務下沉至更靠近用戶的邊緣節(jié)點;然后是資源匹配,通過算力標識解析來定位最優(yōu)資源,并結合網(wǎng)絡狀態(tài)動態(tài)選擇最佳路徑;最后是數(shù)據(jù)加速,基于高通量數(shù)據(jù)傳輸技術,顯著提升跨域傳輸?shù)男省!?/span>
實現(xiàn)“算力如水,隨取隨用”的美好愿景,道阻且長。異構算力納管、海量數(shù)據(jù)安全高效流通、調度算法的公平與效率、綠色低碳等,都是擺在全行業(yè)面前的技術難題。
“這些挑戰(zhàn)是系統(tǒng)性的,需要產業(yè)鏈上下游共同努力,從標準、技術、架構等多個維度進行創(chuàng)新突破。”溫源表示。
在解決海量數(shù)據(jù)傳輸?shù)膯栴}上,構建一張泛在、彈性、高性能的網(wǎng)絡底座是關鍵。溫源介紹道:“在海量數(shù)據(jù)傳輸方面,我們開展了‘數(shù)據(jù)快遞’新業(yè)務,利用中國聯(lián)通高通量的網(wǎng)絡(400G骨干網(wǎng)+SRv6)來打造實現(xiàn)海量數(shù)據(jù)傳輸?shù)慕鉀Q方案,實現(xiàn)了傳輸效率的有效提升。”
任務調度是算力互聯(lián)網(wǎng)的核心,也是難點所在。面對這一挑戰(zhàn),產業(yè)界正在積極探索。溫源介紹了聯(lián)通為實現(xiàn)“算力水電化”愿景所探索的實踐路徑:“首先是架構創(chuàng)新,我們正在構建‘算力調度+光網(wǎng)絡’聯(lián)動的算網(wǎng)大腦;其次是算法突破,通過研發(fā)智能調度算法,能夠減少30%的冗余數(shù)據(jù)遷移;最后是網(wǎng)絡升級,我們已開展試點800G超高速傳輸技術,向實現(xiàn)全光網(wǎng)2.0邁進?!?/span>
發(fā)展算力互聯(lián)網(wǎng) 還需越過幾道坎
技術最終的價值應該體現(xiàn)在應用之中。算力互聯(lián)網(wǎng)正催生出一系列新業(yè)態(tài)、新應用,為千行百業(yè)和個人用戶帶來前所未有的體驗。
在消費端,云手機、云電腦、AI作畫等應用,都需要強大的云端算力實時渲染和計算。算力互聯(lián)網(wǎng)的普及,將讓這些高性能服務變得更加流暢和親民。
然而,發(fā)展算力互聯(lián)網(wǎng),仍然面臨較大的挑戰(zhàn)。我國算力互聯(lián)網(wǎng)尚處于發(fā)展初期,當前算力調度更多僅限于算力卡資源的簡單分配。要真正實現(xiàn)不同架構、不同主體、不同地域的多元算力互聯(lián)互通,實現(xiàn)算力資源的動態(tài)調配和自動優(yōu)化,主要面臨四方面挑戰(zhàn):
一是技術體系有待完善,二是數(shù)據(jù)流通仍存堵點,三是商業(yè)模式不成熟,四是發(fā)展機制有待健全。
“當前,我國各類算力提供主體超5000家且多元化,其技術體系、基礎架構、調用接口、資源描述等存在差異,建成的算力沒有形成全國范圍內可感知和可調度的標準化算力服務,用戶因此也難以快速找到位置、成本、性能均合適的算力資源,供需無法高效對接?!庇鄷詴熤毖裕绾卧诙嘣懔┙o的狀況下統(tǒng)合形成標準化可調度的算力服務,是當務之急。產業(yè)界在積極開展算力互聯(lián)路徑探索,但由于缺乏統(tǒng)一算力資源感知、任務數(shù)據(jù)流動、應用架構適配等關鍵互聯(lián)規(guī)則和標準,總體還是“算力局域網(wǎng)”分別發(fā)展的局面,未能形成全國全域的統(tǒng)一算力服務大市場。
《行動計劃》明確了“兩步走”目標,并制定了6方面16項重點任務,包括筑牢算力互聯(lián)基礎、優(yōu)化算力設施互聯(lián)、促進算力資源互用、創(chuàng)新算力業(yè)務互通、打造算力互聯(lián)應用場景、夯實算力網(wǎng)絡和數(shù)據(jù)安全保障。
“從長遠來看,推動算力互聯(lián)網(wǎng)像水、電、網(wǎng)一樣即插即用、按需付費,是我們這一代信息通信人的使命?!睖卦催@樣總結道。當算力真正像水電一樣觸手可及,我們將迎來一個算力驅動創(chuàng)新的新時代。



