通信世界網(wǎng)消息(CWW)一則看似平常的版本更新,讓整個AI圈驟然沸騰。
8月下旬,DeepSeek發(fā)布V3.1,大段更新說明中鮮有人留意的“UE8M0 FP8參數(shù)精度”,卻在官方評論區(qū)被點出一句:UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。
寥寥數(shù)字,卻瞬間點燃市場情緒。寒武紀(jì)股價盤中一度大漲近14%,總市值躍居科創(chuàng)板首位;半導(dǎo)體ETF半天上漲近6%,科創(chuàng)50指數(shù)創(chuàng)下三年半新高。國產(chǎn)芯片概念股集體狂飆,一場因技術(shù)細(xì)節(jié)而起的“漲停潮”在資本市場上演。
而另一邊,正值外界盛傳英偉達H20或?qū)⑼.a(chǎn)之際,這一“隱秘信號”更顯耐人尋味。它不僅意味著DeepSeek主動貼合國產(chǎn)芯片的最佳性能點,也被視作國產(chǎn)算力產(chǎn)業(yè)在關(guān)鍵時刻發(fā)出的軟硬協(xié)同沖鋒號。
那么,UE8M0 FP8究竟是什么?為何能提升國產(chǎn)芯片市場競爭力?
UE8M0 FP8
為什么能點燃市場?
“UE8M0 FP8”其實是一種低精度浮點數(shù)的表達方式,看似只是編碼細(xì)節(jié),卻被視為國產(chǎn)芯片能追趕國際算力的重要抓手。為什么這么說?先理解它的原理。
首先,UE8M0 FP8解決了“算力堵車”的問題。
芯片就像一條高速公路,數(shù)據(jù)就是車流。傳統(tǒng)FP32數(shù)據(jù)“體積”很大,占用帶寬;FP16雖然小一半,但在大模型時代依然吃緊。FP8把數(shù)據(jù)壓縮到只有1/4 大小,同樣的公路,能跑更多車。而UE8M0則是FP8的一種“聰明壓縮法”,既保證精度不丟太多,又讓傳輸和計算更快。
而它和芯片的關(guān)系,就像油品和發(fā)動機。
芯片是“發(fā)動機”,數(shù)值格式就是“燃料”。如果芯片只能燒“汽油95”,那就跑不起來新能源車的性能。國產(chǎn)芯片過去主要支持FP16/INT8,但大模型訓(xùn)練和推理越來越依賴FP8。如果芯片和大模型不對齊,就像“油不對口”,性能發(fā)揮不出來。
DeepSeek這次主動適配UE8M0,相當(dāng)于為國產(chǎn)芯片量身定制了“最合適的燃料”,讓它們能跑出接近國際頂尖的效果。
這也是為什么芯片廠商股價集體上漲。因為資本市場的邏輯很簡單,如果 DeepSeek這種大模型巨頭認(rèn)可并適配了某個精度標(biāo)準(zhǔn),而國產(chǎn)芯片廠商正好支持這個標(biāo)準(zhǔn),那就意味著他們有望和大模型生態(tài)“綁定”。未來推理、訓(xùn)練就能跑在國產(chǎn)硬件上,市場想象空間一下子打開。
下一代國產(chǎn)芯片
誰在“對號入座”?
在官方未明確點名的情況下,外界的目光迅速轉(zhuǎn)向了首批與DeepSeek宣布適配的8家廠商。
其中,市場最先聚焦的是寒武紀(jì)。理由在于其最新一代MLU370-S4、思元590與690系列均已支持FP8計算,并在低精度優(yōu)化方面走在前列。這也解釋了寒武紀(jì)股價率先出現(xiàn)大幅拉升。
與此同時,海光、沐曦、中昊芯英、摩爾線程等廠商也被陸續(xù)點名:
? 海光深算三號DCU:已具備FP8能力,仍有優(yōu)化空間;
? 沐曦曦云C600:今年7月發(fā)布,強調(diào)FP8支持;
? 中昊芯英“剎那”TPU:定位高性能訓(xùn)練,原生支持FP8;
? 摩爾線程MTT S5000:國內(nèi)少數(shù)原生支持FP8的GPU。
此外,華為昇騰雖在當(dāng)前版本(910B/910C)尚未開放FP8,但路線圖已明確“2025Q4原生FP8”,因此被普遍視為下一代的潛在落點。
在這種背景下,“下一代國產(chǎn)芯片”更像是一個面向未來的開放信號,而非單點指向。
從格式到生態(tài)
軟硬協(xié)同的“臨界點”
那么,這和英偉達H20停產(chǎn)有什么關(guān)系?
過去大家最擔(dān)心的是,如果英偉達對中國的芯片供貨受限,大模型是不是就會“沒飯吃”?而現(xiàn)在,DeepSeek通過UE8M0 FP8給國產(chǎn)芯片打了一個“強心針”,哪怕H20停了,國產(chǎn)GPU/NPU只要支持這個新精度,就能跑得動DeepSeek這樣的大模型。
過去,國產(chǎn)加速器多以FP16/BF16+INT8為主流通路,精度選擇與主流國際生態(tài)存在差距。如今,隨著UE8M0 FP8被引入,國產(chǎn)廠商得以與DeepSeek這樣的頭部大模型在精度格式上形成共識。
這至少意味著以下三點。
一是算力利用率提高:帶寬受限的情況下,F(xiàn)P8+UE8M0能跑更大模型;
二是生態(tài)效應(yīng)增強:DeepSeek主動適配,類似于為國產(chǎn)芯片量身定制“性能放大器”;
三是產(chǎn)業(yè)鏈協(xié)同:國內(nèi)廠商在統(tǒng)一精度規(guī)范下,形成類似 “Wintel” 的共生關(guān)系。
從長遠(yuǎn)看,這不僅關(guān)乎模型的推理和訓(xùn)練效率,更可能成為減少對國外算力依賴、提升國產(chǎn)芯片市場競爭力的現(xiàn)實路徑。
換句話說,不是只能靠別人,國產(chǎn)替代真的有了“可落地的可能”。
微妙的“點火”時刻
值得注意的是,DeepSeek在官方更新說明正文里,只字未提UE8M0 FP8的宏大意義,僅用一句話帶過:“DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度?!?/p>
真正的“火種”藏在評論區(qū)的一句話。
或許是有意,或許是無心。但不可否認(rèn),市場的劇烈反應(yīng)已說明一切。畢竟,回顧過去幾年,國產(chǎn)芯片更多扮演的是“補位”角色:在高端算力受限時填補空缺。外界對其期待常常停留在“能否替代英偉達”的層面。
而這一次,隨著UE8M0 FP8的引入,局面正在發(fā)生變化。它不僅是一種壓縮格式的升級,更是一次大模型與芯片之間的精度共識,標(biāo)志著國產(chǎn)算力開始擁有屬于自己的 生態(tài)話語權(quán)。當(dāng)DeepSeek這樣的大模型主動“貼近”國產(chǎn)芯片性能點時,軟硬協(xié)同的格局已悄然成型,它意味著國產(chǎn)AI正在重新定義算力生態(tài)規(guī)則。
無論英偉達H20是否停產(chǎn),國產(chǎn)AI的進程都將不再依賴單一供應(yīng)商的“天平傾斜”。真正決定產(chǎn)業(yè)走向的,是能否形成大模型與國產(chǎn)硬件深度綁定的合力。
一段浮點精度的技術(shù)細(xì)節(jié),背后是國產(chǎn)AI從補位走向重構(gòu)的戰(zhàn)略拐點。
- QQ:61149512