當全球人工智慧競爭進入算力決勝局,晶片作為核心底層設施的戰略價值愈發凸顯。2025年12月17日,沐曦積體電路正式登陸科創板,上市首日股價盤中最高漲幅突破755%,從發行價元飆升至895元的高位。這一震撼市場的表現,不僅折射出資本市場對國產晶片替代的強烈信心,更標誌著中國GPU產業從技術追趕邁入與國際巨頭並行發展的關鍵轉折。而在這場國產算力崛起的浪潮中,商湯科技與沐曦的深度戰略合作,以“高效能算力底座+高適配技術協同”的創新模式,構建起覆蓋技術研發、產品落地、生態共建的完整閉環,為國產AI算力產業樹立了標杆。
一、時代必然:國產算力突圍的“雙向奔赴”
全球AI技術競爭的白熱化,讓算力成為國家核心競爭力的重要組成部分。長期以來,高階GPU市場被國際巨頭壟斷,國內AI產業面臨“算力卡脖子”的風險——不僅採購成本高昂,還存在供應鏈不穩定、技術適配受限等諸多隱患。在此背景下,國產GPU的自主創新與生態構建,成為突破技術壁壘、保障產業安全的必然選擇。
商湯科技與沐曦的合作,正是這場突圍戰中的關鍵佈局,源於雙方優勢互補的戰略契合。作為AI領域的領軍企業,商湯已構建起“大裝置+大模型+應用”的三位一體戰略格局,其自主研發的AI基礎設施“大裝置”,需要海量高效能算力支撐從模型訓練到行業落地的全鏈路需求。財報資料顯示,商湯2024年生成式AI業務收入達24億元,連續兩年實現翻倍增長,這種爆發式增長背後,是對穩定、高效、自主可控算力的剛性需求。
而沐曦作為國內少數系統掌握高效能GPU全棧研發技術的企業,其核心產品曦雲C系列GPU憑藉全自主研發的架構與指令集,打破了國際技術壟斷。曦雲C500、C550及在研的C600系列,具備高效能、高自主可控、高擴充套件性三大核心優勢,支援千億引數以上大模型訓練,且透過自研MXMACA軟體棧實現了對CUDA生態的高度相容,完美契合商湯大裝置的算力適配需求。一方是擁有場景、演算法與海量資料的AI巨頭,一方是手握自主核心技術的算力新銳,這場“算力供給”與“場景需求”的雙向奔赴,為國產AI算力生態的構建奠定了堅實基礎。
二、技術共研:“高效能+高適配”的協同突破
商湯與沐曦的合作,突破了傳統產業鏈上下游“採購-供應”的簡單協作模式,深入到底層技術共研的核心層面,形成“演算法牽引硬體最佳化,硬體支撐演算法迭代”的良性迴圈,最終實現“1+1>2”的效能突破。
1. 硬體效能:對標國際的國產算力底座
沐曦曦雲C系列GPU的硬核效能,為雙方合作提供了堅實基礎。以曦雲C500為例,其FP32算力達到19.5 TFLOPS,與英偉達A100 80GB持平,在ResNet-50訓練任務中比A100快7%,功耗卻低11%,展現出卓越的效能功耗比。該系列採用自研XCORE架構及指令集,配備標量、向量和張量計算單元,支援多種混合精度計算,搭載64GB HBM2e視訊記憶體與7個高速MetaXLink互連線口,可實現2卡至64卡的靈活互連拓撲,具備國內稀缺的高頻寬、超多卡互連能力。
在研的曦雲C600更是立足國產供應鏈,升級為XCORE 1.5架構,新增FP8 Tensor及Tensor轉置指令,搭載HBM3e視訊記憶體,視訊記憶體容量提升至144GB,進一步最佳化了大模型訓練的效能與適配性。這些硬體優勢,讓曦雲系列GPU成功嵌入商湯國產化算力佈局,成為支撐“日日新”大模型、世界模型等前沿AI產品訓練的核心硬體元件。
2. 軟硬適配:定製化最佳化釋放極致效能
如果說高效能硬體是“算力肌肉”,那麼深度適配的軟硬協同就是“神經網路”。商湯與沐曦建立了專屬的深度適配機制:商湯開放AI演算法框架與真實場景需求,將大模型訓練中的算力瓶頸、資料處理特性等關鍵資訊反饋給沐曦;沐曦則針對性最佳化GPU架構設計與軟體棧,透過底層技術調整讓硬體效能精準匹配演算法需求。
這種協同模式已結出豐碩成果:雙方聯合完成了“日日新”多模態大模型的全流程適配調優,實現了國產GPU與商湯算力平臺的全面相容認證。更值得關注的是,雙方合作攻克了GPGPU硬體架構適配難度遠高於NPU的行業難題,實現了PD()分離技術在國產GPU上的首次大規模商用落地,將推理價效比提升了150%。據測算,採用沐曦GPU叢集后,商湯大裝置的算力成本下降約30%,而模型訓練效率提升超過40%,完美詮釋了“高適配”帶來的價值增量。
三、場景共建:從技術驗證到產業落地的閉環
技術的價值最終要透過場景落地來體現。商湯與沐曦以“算力叢集+場景拓展”的融合模式,將協同創新成果快速轉化為行業解決方案,覆蓋智慧城市、智慧製造、醫療健康等六大重點領域,實現了從技術驗證到規模化商用的完整閉環。
1. 重點行業的標杆應用
在智慧城市領域,商湯的城市治理大模型需要處理海量影片監控、感測器資料,對實時推理算力要求極高。沐曦GPU的高平行計算能力與低延遲特性,讓模型能夠快速識別交通擁堵、異常事件等場景,為城市管理提供實時決策支援;在智慧製造場景中,雙方聯合開發的AI質檢解決方案,透過大模型對生產線上的產品缺陷進行精準識別,沐曦GPU的高效算力支撐讓檢測效率提升3倍以上,誤檢率下降50%;在醫療健康領域,商湯的醫學影像分析模型藉助沐曦GPU的高算力支援,能夠快速處理CT、MRI等大型醫療影像資料,輔助醫生進行疾病診斷,縮短診斷週期。
這些場景化應用不僅驗證了國產算力的可靠性,更讓技術在真實需求中持續迭代。例如,商湯內部測試時,用自研的NEO多模態模型處理智慧城市交通場景資料,在沐曦GPU的支撐下,僅用1億樣本就實現了95%的識別準確率,而傳統模型需要10億樣本才能達標 。
2. 多元化的產品解決方案
為滿足不同行業客戶的差異化需求,雙方聯合打造了一體機解決方案、平臺適配工具等豐富的產品矩陣。這些解決方案整合了沐曦的GPU硬體、商湯的大模型演算法與行業Know-how,實現了“開箱即用”的便捷體驗。
針對中小企業的算力需求,雙方推出的輕量化AI算力一體機,整合了曦雲C系列GPU與商湯簡化版大模型,無需複雜部署即可支援小規模模型訓練與推理;針對大型企業與智算中心,提供大規模GPU叢集解決方案,透過MetaXLink高速互連技術實現算力線性擴充套件,支援千億引數級大模型的全引數訓練——沐曦與中國科學院合作的國產千卡叢集已完成多個大模型全引數訓練,證實國產算力已具備大模型預訓練能力。
四、生態共享:“算力Mall”構建開放共贏格局
國產AI算力的崛起,離不開開放協同的產業生態。商湯與沐曦以“商湯大裝置算力Mall”為核心載體,構建起“算力+語料+演算法+場景”的端到端閉環生態,打破了傳統算力供給的封閉模式。
這一“面向未來的算力超級市場”,整合了商湯的AIDC資源、演算法框架、行業模型與沐曦的GPU技術,形成了“需求對接-供給最佳化-技術迭代”的閉環機制。開發者和企業客戶可以像選購商品一樣,自由組合和調配多樣化的算力資源、平臺工具和行業模型服務,精準破解大模型落地難題。目前,該平臺已吸引華為、寒武紀、壁仞科技等十餘家國產生態夥伴加入,實現了國產AI晶片與商湯大裝置的全面適配,讓國產AI晶片在商湯千億引數級的大模型訓練與推理任務中,接受工業級標準的嚴苛考驗。
這種開放生態模式帶來了多重價值:對商湯而言,豐富了算力供給來源,讓算力架構更具彈性,有效規避了高階晶片供應風險,為“日日新”大模型在金融、教育、交通等20餘個行業的商業化應用提供了穩定支撐;對沐曦來說,透過與商湯等頭部AI企業的合作,其曦雲系列GPU在主流應用場景的滲透率持續提升,品牌影響力顯著增強,已量產的曦思N100推理GPU出貨量超顆,客戶覆蓋BAT、位元組跳動等頭部企業與多家國有云服務商;對整個行業而言,生態共享降低了AI技術落地的門檻,透過規模化應用攤薄了研發成本,加速了國產算力產業鏈的成熟。
五、格局重塑:國產算力從“可用”到“好用”的跨越
商湯與沐曦的深度協同,不僅實現了雙方業務的共贏發展,更重塑了中國AI算力產業的競爭格局,推動國產算力從“可用”向“好用”的關鍵跨越。
在技術層面,雙方的合作突破了國產GPU“效能不達標、適配不充分”的傳統痛點,證明了國產算力完全能夠支撐千億引數級大模型的訓練與推理,打破了國際巨頭在高階算力領域的壟斷神話。沐曦GPU在商湯場景中的成功應用,為國產晶片樹立了“效能對標國際、適配貼合需求”的標杆,也為其他國產晶片企業提供了可借鑑的技術適配路徑。
在產業層面,這種“AI巨頭+晶片新銳”的協同模式,構建了自主可控的“晶片-框架-模型-應用”產業鏈條,降低了國內AI產業對國外算力的依賴。隨著合作成果在更多行業的複製推廣,國產AI產業將逐步形成技術自主、供應鏈穩定、生態完善的產業體系,為新質生產力的發展提供強大支撐。
在全球層面,商湯與沐曦的合作向世界展示了中國AI算力的創新實力。當曦雲系列GPU在效能上對標國際主流產品,當商湯大模型在國產算力支撐下實現商業化落地,中國AI產業正從“追隨者”轉變為“引領者”,為全球人工智慧競爭注入新的中國力量。
結語:算力同行,共築AI生態新未來
沐曦的科創板上市與商湯的深度戰略合作,是中國AI算力產業發展的重要里程碑。雙方以“高效能”為基石、“高適配”為紐帶、“生態化”為目標,構建起技術共研、場景共建、生態共享的三維驅動模式,不僅實現了自身的協同增長,更為主流國產AI算力產業鏈的發展提供了寶貴經驗。
隨著曦雲C600等新一代產品的推進,以及“商湯大裝置算力Mall”生態的持續擴容,國產AI算力將在更多核心場景實現突破。未來,商湯與沐曦有望攜手更多行業夥伴,持續深化軟硬體協同創新,拓展生態邊界,讓自主可控的算力賦能千行百業,推動中國AI產業在全球競爭中佔據更有利地位,共築國產AI生態的新未來。