中國智算如何實現“DeepSeek式突圍”

晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。
今年以來,我國以DeepSeek為代表的大模型企業通過算法優化、有針對性的訓練和開源生態協作,在使用“縮水版”GPU芯片的情況下,將千億參數模型訓練成本壓縮至同類模型的1/10,走出了一條從粗放式算力堆砌向內生式效能提升的新路徑。
在全球驚嘆中國非對稱創新奇跡的同時,也要清醒看到,就人工智能(AI)技術和產業自主可持續發展而言,我國仍未擺脫對高端乃至“縮水版”智算芯片等物理器件的依賴。在可以預見的未來,外部環境可能更趨惡劣,封鎖遏制常態化、供應鏈不確定性等挑戰難以回避。我國亟需在智能算力層面實現“DeepSeek式突圍”,用超限創新解耦當前硬件算力提升與制程工藝進步強綁定的關系。
換言之,我國要在AI領域獲得與競爭對手可博弈的能力,不僅要在算法層面繼續革命、突破“算力繭房”,而且要在算法與物理層面深度融合上實現換道超車,破解“制程工藝繭房”。以生成式變結構計算、軟件定義晶上系統(Software defined System on Wafer,SDSoW)為主要內容的晶上生成式體系架構,為解決算法模型與算力載體失配難題、增強軟硬件協同算力可持續發展提供了新的技術路徑。
讓計算架構的“鞋”適應算法的“腳”
先進的芯片制程工藝能夠提供更高的晶體管密度,提升芯片單位面積計算能力,為大模型訓練和推理提供更強大的計算資源支持。然而,基於還原論的工程設計范式,芯片制程工藝艱辛迭代獲得的物理算力提升,很難被大規模分布式物理系統上運行的軟件算法有效利用。芯片峰值計算能力與算法系統性收益存在結構性錯位,加之分布式系統在技術體制上受“大規模、低時延、高帶寬”不可能三角問題制約,靠簡單堆砌千張、萬張乃至十萬張以上GPU卡的方式,難以滿足“規模定律-Scaling low”驅動的大模型訓練之非線性算力增長需求。
簡而言之,由於存算分離體制的馮·諾依曼計算架構,硬件系統設計(如芯片制程、內存帶寬、並發單元等)與算法模型的運算特征(如計算密度、數據流模式、精度需求等)之間存在系統性錯位。即便芯片制程工藝有所進步,帶來了性能增益,也會由於“逐級插損”的系統工程范式大打折扣。
突破“制程工藝繭房”,在更高維度上尋求問題的解空間,需要變革傳統剛性計算架構及技術物理實現范式。
近80年來,傳統計算架構一直沿用運算器、控制器、內存儲器、輸入輸出設備幾大件組成的馮·諾依曼計算架構。無論是復雜的AI算法,還是簡單的數據處理任務,都被“硬塞”進剛性的計算架構之中,奢望“一勞永逸”地處理千變萬化的應用。這就好比不管你腳多大,都必須穿37碼的鞋才能走路。然而,鞋不合腳就走不快:小腳穿大鞋會絆腳﹔大腳穿小鞋則會感到疼,結局往往是“削足適履”。
化解剛性架構算力與多樣化算法間結構性矛盾,需要借助物理學增維求解法則,導入自適應計算架構新機理。
2009年,受“自然界偽裝大師”擬態章魚啟發,中國科學家在世界上首次提出領域專用軟硬件協同變結構計算——擬態計算。如同擬態章魚,可“隨機應變”地隱匿在沙質海底或珊瑚礁等環境之中,擬態計算能讓“鞋子”更好地適配穿著它走路的“腳板”。
2018年,計算機體系結構大師、圖靈獎得主大衛·帕特森和約翰·軒尼詩預言,基於軟硬件協同計算語言的領域專用軟硬件協同計算架構,將成為今后十年計算機體系架構黃金發展期的主流發展方向之一。前不久,特斯拉Dojo超算公布了其計算范式變革的解決方案,提出硬件架構像變形金剛般隨任務變形,實現從“算法適應硬件”到“算法定義硬件”的范式轉換。
用二流零部件構建一流系統
生成式變結構計算的核心在於按算法需求動態重構計算架構,要求算力的硬件載體能夠實現以軟件驅動物理結構變化,大幅度提升特定計算結構對特定算法的執行效能。SDSoW就是要推動計算架構從“剛性流水線”向“軟件可塑形”躍遷,打通生成式變結構計算從理論到技術物理實現的閉環,使得基於二流器件或部件構建一流系統成為可能。
具體來說,SDSoW具備五大能力。
一是系統破局能力。SDSoW擺脫“核心器件決定論”思維,改變“芯粒、芯片、模組、機匣、機架、系統”的逐級堆砌、逐級插損式工程技術路線,通過晶圓級異構集成實現功能解構—晶上重組,達成功能等價、系統最優的目標,將制程工藝短板通過系統工程方法轉化為非主要矛盾。
二是整體增效能力。借助晶圓級高密度互連、超短距離、異質異構封裝,獲得高帶寬、低延遲、低功耗的系統增益,SDSoW系統的帶寬可提升一個數量級,時延可縮小一個數量級,功耗可降低一個數量級,系統效能可提升三個量級。
三是通專融合能力。基於晶圓級系統硬件可編程/重定義架構,可通過軟件實時配置或由AI大模型生成SDSoW功能和性能。在同一物理載體上,能根據不同應用需求或使用場景,實現“一平台、多樣性”生成式變結構計算,既可滿足專用場景特殊算力需求,又能兼顧領域內相對靈活的通用算力要求。
四是開源協同能力。通過建立SDSoW開源社區,發布基礎互連協議、動態控制器及生成式變結構計算工具鏈等,SDSoW可構建“中國引領、全球參與”的生態環境,以開放破壟斷,形成相對Chiplet(小芯片)路線的比較優勢。
五是內生安全能力。SDSoW可從源頭上應對開放生態帶來的新域新質安全挑戰,通過引入內生安全架構實現開放可控,即便供應鏈欠安全,仍能保証開放條件下該系統具有“開箱即用、默認安全”的網絡彈性。
總之,晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。通過應用與設計、算法與算力的垂直整合,解耦當前我國算力基礎設施產品對芯片先進制程工藝的強依賴關系,最大程度獲取體系結構與工藝進步的綜合增益。晶上生成式變結構計算也能為全球智算普惠提供中國方案。
基於晶圓級集成/封裝的生成式變結構計算,開辟了算法架構突破與物理載體革命、算法工程實現與計算范式創新深度耦合的新方向。目前,應盡快推動根理論突破,重點攻關晶上熱力學、異構集成理論、可重構架構數學描述等底層理論﹔持續加強根技術攻堅,突破晶圓級鍵合、3D互連、晶圓級操作系統、生成式結構計算語言/編譯器等關鍵技術,實現從架構設計、物理實現到技術應用自主生態﹔多維推進根產業培育,以智能駕駛、具身智能、工業數字孿生、AI一體機等新興市場需求為牽引,通過“場景開放+體系創新+生態聚合”三位一體模式,以超限創新、超常規舉措突破“小院高牆”“遏制封鎖”,蹚出一條中國特色技術平權和產業可持續發展之路。
(作者系中國工程院院士)

分享讓更多人看到
推薦閱讀
- 組圖:“開往春天的列車”即將進站
- 人民網北京3月30日電(記者王天樂)隨著清明假期和春季旅游踏青高峰季的到來,已開行17年的北京“長城號”和諧內燃動車組,日前完成了首次涂裝大修換新,即將重新上線。 線路開通17年來,每到春季清明節前后,穿行於S2線上的“長城號”內燃動車組與沿線長城、群山、花海交相輝映,常被人們譽為“開往春天的列車”,也已成為首都北京一道靚麗的風景線和旅游網紅打卡地。…
- 北京按下數據跨境流動便利化改革“快捷鍵”
- 人民網北京3月30日電 (記者孫博洋)近日,在2025中關村論壇年會數據跨境流動創新發展論壇上,《北京市數據跨境流動便利化綜合配套改革實施方案》(以下簡稱《方案》)正式發布。 據介紹,《方案》堅持企業視角、問題導向、改革開路、前瞻引領、安全可控,在全面總結評估前期數據出境政策實施效果、深入調研了解企業急需訴求基礎上,從政策供給、數據利用、企業服務、技術應用、產業促進、安全監管等多個維度,統籌提出了一攬子創新舉措,突出系統性、體系化設計,實現了謀篇布局上“由點的突破到面的拓展”,是首個促進數據跨境流動便利化的綜合性配套改革文件,推動數據跨境流動從“以落實國家數據跨境流動基礎制度創新實踐1.0版”向“以促進數據資源高效便利安全跨境流通利用2.0版”加快迭代升級。…
- 評論
- 關注