Token爆發(fā) AI算力全鏈漲價 開啟“能效競爭”時代
算力,正成為AI時代最稀缺的“硬通貨”,目前全鏈價格不斷攀升。 海外英偉達H100一年期租賃價格漲幅近40%;國內(nèi)云廠商集體調(diào)價——騰訊云Tencent HY 2.0 Instruct模型輸入價上漲463%后再次整體提價5%,阿里云平頭哥真武810E等算力卡產(chǎn)品上調(diào)5%~34%,百度智能云相關(guān)服務上調(diào)5%~30%,科大訊飛智算平臺AI推理服務漲價8%,商湯科技SenseCore大模型訓練費用平均上浮12%,智譜2月以來3次提價……近期算力產(chǎn)品全鏈漲價,持續(xù)兩年多的AI“價格戰(zhàn)”驟然逆轉(zhuǎn)。 這是短期供需錯配的周期性波動,還是AI驅(qū)動下的趨勢性上漲?產(chǎn)業(yè)未來的競爭焦點將落在哪里?近日,記者采訪了工信部信息通信經(jīng)濟專家委員會委員盤和林與中國信通院云計算與數(shù)字化研究所總工程師郭亮,深度探尋算力漲價潮背后的產(chǎn)業(yè)變革趨勢。 Token激增是算力漲價潮的“核心引擎” “漲價的根源是人工智能的需求驅(qū)動。”盤和林認為,其中既包括AI訓練所帶來的算力消耗,也包括AI應用爆發(fā)所激發(fā)的推理算力需求。 郭亮分析,漲價包含四方面因素:一是硬件成本“逆向”暴漲。高帶寬內(nèi)存(HBM)存儲與高端芯片處于絕對賣方市場,2026年第一季度存儲價格翻倍,硬件采購及運維成本高企。二是需求結(jié)構(gòu)從訓練轉(zhuǎn)向推理。隨著AI智能體爆發(fā),推理端的Token調(diào)用量激增。推理屬于持續(xù)性運營支出,海量并發(fā)帶來的電力和帶寬成本已超出云廠商的補貼上限。三是商業(yè)模式從“圈地”轉(zhuǎn)向“盈利”。早期算力價格戰(zhàn)已完成初步生態(tài)綁定,在財務壓力下,廠商必須通過提價來覆蓋昂貴的算力折舊。四是算力資源的戰(zhàn)略性稀缺。全球高端算力租賃容量告急,電力配額緊張,供需極度失衡,導致價格失去下行空間。 此前兩年多時間里,云廠商以“燒錢換市場”的邏輯持續(xù)降價,Token成本被壓縮至每百萬Token不到一元。但當前,復雜推理讓單日調(diào)用費用高達數(shù)百元,價格不斷上漲,此前大模型的免費公測也同步結(jié)束。 “行業(yè)集體提價是從‘燒錢擴規(guī)模’轉(zhuǎn)向‘商業(yè)可持續(xù)’的必然結(jié)果。”郭亮表示,這宣告廉價算力時代終結(jié),將進入以利潤為導向的“價值重估”階段。 談及價格競爭,盤和林認為,此前云計算廠商尚未發(fā)掘出具有大規(guī)模用戶黏性的AI應用場景,多數(shù)廠商采購的算力服務器主要應用于AI模型訓練環(huán)節(jié),而非直接面向企業(yè)或個人用戶提供算力服務支持。今年以來,以“龍蝦熱”“歡樂馬”為代表的AI開源作品涌現(xiàn),憑借其創(chuàng)新性與易用性極大激發(fā)了普通用戶對云計算產(chǎn)品的使用熱情,不僅顯著推動了Token銷售量的爆發(fā)式增長,更進一步帶動了算力資源及存儲服務的整體需求提升。 存儲與芯片是算力價格上漲的“成本推手” 當前,算力產(chǎn)業(yè)鏈的漲價態(tài)勢從上游硬件蔓延至下游服務,包括國內(nèi)外主流云廠商在內(nèi)的數(shù)十家企業(yè),相繼上調(diào)了AI算力及相關(guān)服務的價格。那么,在算力產(chǎn)業(yè)鏈中,哪些環(huán)節(jié)是漲價的根源? 郭亮認為:“從算力產(chǎn)業(yè)鏈的結(jié)構(gòu)來看,存儲供應、先進封裝、芯片制造和晶圓生產(chǎn)都對算力漲價產(chǎn)生了影響。” 具體而言,在存儲供應方面,尤其是HBM和高容量閃存方面,隨著模型參數(shù)規(guī)模持續(xù)擴大、多模態(tài)交互日益普及,推理任務對內(nèi)存帶寬的要求已超越了對算力本身的追求,比如三星、SK海力士等廠商的HBM產(chǎn)能在2026年之前便已被長期訂單鎖定。在CoWoS等先進封裝技術(shù)方面,盡管晶圓制造產(chǎn)能正在擴張,但將計算芯片與HBM堆疊集成的先進封裝工藝擴產(chǎn)周期較長、技術(shù)門檻較高。即便晶圓供應充足,若無法完成封裝出貨,市場上的算力資源仍將處于缺貨狀態(tài)。在晶圓生產(chǎn)環(huán)節(jié),相比存儲與封裝,先進制程的晶圓產(chǎn)能雖同樣緊俏,但在全球主要代工廠大規(guī)模擴建的背景下,其產(chǎn)能釋放節(jié)奏相對可預期,已不再是當前價格波動的主要推手。 “漲價主要集中在兩個環(huán)節(jié)。”盤和林分析說,“一是算力服務器本身的價格上漲,例如英偉達等廠商的AI算力服務器;二是云計算廠商提供的算力及存儲租賃服務價格上調(diào)。” 其中,算力服務器漲價主要源于兩個因素:一方面,芯片制造能力受限,核心瓶頸在于光刻機產(chǎn)能無法滿足AI產(chǎn)業(yè)快速發(fā)展的需求。另一方面,存儲芯片不足,內(nèi)存芯片自身存在固有產(chǎn)能周期,而AI需求的爆發(fā)式增長進一步加劇了供不應求的局面。存儲芯片產(chǎn)能的擴張通常需要3年左右,即便考慮到廠商已提前布局,至少也需要1~2年才能有效緩解供給壓力。 算力漲價是一場加速產(chǎn)業(yè)出清的壓力測試 “此輪漲價是一場‘壓力測試’。”郭亮形象地概括,它將加速產(chǎn)業(yè)出清,告別粗放的發(fā)展時代,邁向高門檻、高效率的Token生產(chǎn)和使用“深水區(qū)”。 此輪算力漲價正在深刻重塑整個AI產(chǎn)業(yè)鏈的競爭格局,對頭部廠商、中小企業(yè)產(chǎn)生不同影響。 對于頭部廠商,郭亮認為,漲價將有助于利潤與生態(tài)修復。一方面,提價緩解了云廠商巨額的算力折舊壓力,使其從“虧損獲客”轉(zhuǎn)向“質(zhì)量增長”;另一方面,頭部廠商憑借自研芯片帶來的成本優(yōu)勢,可能進一步壓縮二線云服務商的生存空間,強化自身在算力生態(tài)中的控制地位。 對于中小企業(yè),盤和林分析說:“算力漲價將顯著增加中小企業(yè)和個人用戶使用AI的成本。”當前,多數(shù)中小企業(yè)主要依賴在云端購買算力與存儲資源完成模型訓練,為AI應用提供算力支持。如果AI能夠產(chǎn)出更多價值、創(chuàng)造更多利潤,中小企業(yè)很可能選擇忽視短期成本上升,選擇“AI+”戰(zhàn)略來提升經(jīng)營效率與市場競爭力。 郭亮總結(jié)道:“算力產(chǎn)業(yè)高質(zhì)量發(fā)展將加速‘脫虛向?qū)崱!彼懔Τ杀靖咂髮⑹沟谩癙PT創(chuàng)業(yè)”逐漸失去土壤。行業(yè)的投資重心將從純模型研發(fā)轉(zhuǎn)向能夠產(chǎn)生實際流水、算力投入產(chǎn)出比更高的商業(yè)化場景。 “算力銀行”與“算力超市”將為中小企業(yè)量身減負 面對算力供需緊張態(tài)勢,政策端已加速破局。今年4月,工業(yè)和信息化部發(fā)布《關(guān)于開展普惠算力賦能中小企業(yè)發(fā)展專項行動的通知》,推出“算力銀行”與“算力超市”兩大創(chuàng)新模式,直擊中小企業(yè)算力成本痛點。 郭亮表示:“專項行動是針對2026年AI算力成本激增的問題,為中小企業(yè)量身定制的‘減負’方案,關(guān)鍵在于有效落實兩項創(chuàng)新業(yè)務。” “算力銀行”類似金融銀行模式,將散落的閑置算力資源化、標準化、金融化,通過“零存整取”和跨域調(diào)度實現(xiàn)普惠供給。 具體分四步:首先,資源歸集(存款),將不同品牌、規(guī)格的算力標準化為“標準算力單元”,像吸收存款一樣,將科研機構(gòu)、云廠商、企業(yè)的富余算力接入中國算力平臺。其次,資源池化(金庫),利用平臺將分散的服務器整合為虛擬資源池,跨地域調(diào)度,平衡波峰波谷,解決“有的地方卡死,有的地方閑死”的問題。再次,按需配給(貸款),企業(yè)像申請貸款一樣按需下單。中小企業(yè)通過“算力券”或按量付費等靈活套餐,低成本獲取高性能算力。最后,價值清算(結(jié)算),建立計量與返利機制,提供方獲得收益或未來優(yōu)先使用權(quán),使用方按實支付,政府通過平臺數(shù)據(jù)實現(xiàn)精準補貼。 “一家自動駕駛初創(chuàng)公司需要大量算力處理路測數(shù)據(jù),而某大學實驗室的算力夜間閑置。通過算力銀行,實驗室存入算力獲得未來積分;初創(chuàng)公司用政府發(fā)放的‘算力券’低價提取算力,避開公有云高峰高價。”郭亮舉例說明。 “算力超市”的核心是算力資源的“商品化”與“便捷化”,讓企業(yè)像網(wǎng)購一樣獲取AI算力。 其中包括四個關(guān)鍵環(huán)節(jié):一是資源標準化上架,將底層硬件性能轉(zhuǎn)化為標準化商品,按Token數(shù)、單精度浮點運算能力、核時計費的算力規(guī)格計算,消除技術(shù)門檻。二是智能搜索與比價,基于中國算力平臺中小企業(yè)專區(qū),實現(xiàn)動態(tài)比價和算力選型,自動推薦成本低、延遲低的算力包,解決信息不對稱等問題。三是開箱即用服務,預裝模型環(huán)境和開發(fā)工具,用戶可一鍵部署主流大模型鏡像和數(shù)據(jù)集,實現(xiàn)“下單即運行”,縮短開發(fā)周期。四是普惠政策與支付結(jié)算,對接政府補貼,支持“算力券”直接結(jié)算,提供預付、后付、包年包月等模式,平臺承擔QoS監(jiān)控確保真實性能。 “如果說算力銀行負責的是底層的‘資源流動’,解決的是‘資源流動’問題;那么算力超市負責的就是前端的‘用戶體驗’,解決的是‘交易門檻’問題,讓算力變得看得見、買得起、好上手。”郭亮認為,這兩個創(chuàng)新業(yè)務,將算力從高門檻的“資本密集型資產(chǎn)”轉(zhuǎn)變?yōu)橄袼㈦娨粯拥摹凹从眉锤缎托畔⒒A設施”,是中小企業(yè)在2026年算力競爭中突圍的關(guān)鍵。 針對中小企業(yè)的困境,盤和林建議要做好兩手準備:一是企業(yè)主動與云計算廠商合作,推動傳統(tǒng)算力服務向“算力超市”“算力銀行”創(chuàng)新模式升級,依托其市場經(jīng)驗與資源優(yōu)勢,降低算力基礎設施建設成本;二是政府引導國企跨領(lǐng)域融合金融、通信、算力資源,構(gòu)建業(yè)務生態(tài)體系。他特別強調(diào),企業(yè)是產(chǎn)業(yè)發(fā)展的核心主體,必須通過市場化機制充分激發(fā)其積極性;政府則需配套“算力券”補貼、利率貼息等精準政策工具,加速創(chuàng)新模式落地生效,最終實現(xiàn)中小企業(yè)從“被動承壓”到“主動受益”的實質(zhì)性轉(zhuǎn)變。 未來算力產(chǎn)品價格或?qū)⒈3州^高水平 面向未來,此輪漲價是周期性波動還是趨勢性上漲? 盤和林認為,答案取決于AI應用能否真正創(chuàng)造價值。算力漲價的長期性本質(zhì)取決于AI應用的價值轉(zhuǎn)化能力。若AI僅停留在“玩具”層面,缺乏實際生產(chǎn)力支撐,此輪漲價將如曇花一現(xiàn)般短暫;若AI成為驅(qū)動產(chǎn)業(yè)變革的生產(chǎn)力工具,其漲價則將演變?yōu)榫哂谐掷m(xù)性的趨勢性特征。 基于當前產(chǎn)業(yè)態(tài)勢,盤和林判斷:“趨勢性價格上漲的概率更大。”AI仍處于技術(shù)爆發(fā)周期,算力產(chǎn)業(yè)將長期維持“需求激增—供給滯后”的緊平衡狀態(tài),短期內(nèi)算力供給難以匹配需求增速。然而,未來尚存不確定性——AI究竟是泡沫還是生產(chǎn)力工具,仍需市場持續(xù)驗證。 郭亮提出:“此輪漲價是‘短期供需錯配’與‘長期成本剛性’共同作用的結(jié)果。”他預計,算力價格的高位震蕩將持續(xù)至2027年初。隨著全球先進制程產(chǎn)能逐步釋放、CoWoS封裝瓶頸得到突破以及HBM4內(nèi)存的大規(guī)模交付,當前由極度缺貨所導致的溢價將逐步回落。盡管短期內(nèi)的極端漲幅會趨于平抑,但由于能源成本、地緣政治溢價以及芯片制造工藝正逼近物理極限,算力的價格中樞仍將保持在較高水平,其中高性能算力將獲得更多溢價。 郭亮進一步表示,未來產(chǎn)業(yè)發(fā)展將有三大趨勢。首先,算力將從通用走向異構(gòu),昂貴的處理器(GPU)不再是唯一解。針對特定算法優(yōu)化的ASIC專用芯片將大規(guī)模普及,企業(yè)也將不再盲目追求萬億參數(shù)級別的模型,而是通過模型蒸餾等技術(shù),在更廉價的算力上實現(xiàn)高效運行。其次,需求重心將從訓練轉(zhuǎn)向推理,推理所消耗的Token量將逐步超越訓練階段。大規(guī)模推理任務對實時性和并發(fā)性的要求,使得算力供給必須更加靈活。為降低單次調(diào)用的成本,產(chǎn)業(yè)將加速向低功耗推理芯片及端云協(xié)同模式轉(zhuǎn)型。最后,算力將真正成為“新電力”,實現(xiàn)基礎設施化。 “未來競爭的勝負手,將聚焦‘能源調(diào)度+算力能效+算法優(yōu)化’的綜合成本控制能力。”郭亮判斷,從這個意義上說,漲價正是算力行業(yè)的“成年禮”——它將倒逼整個產(chǎn)業(yè)從粗放的擴張模式轉(zhuǎn)向極致的能效競爭。(記者 李瑞璐)
【責任編輯:朱家齊】