日本免费在线一区二区-国产欧美日韩一区在线-国产男女猛烈无遮挡性视频网站-人妻内射视频免费看-女自慰喷水自慰不卡无广告-女生被男生操喷水的视频在线看-黑夜在线拖拽不卡第一页-av一区二区三区亚洲-亚洲国产精品成人婷婷色

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

深度解讀:Google TPU如何沖擊“英偉達帝國”?

2025-12-01 來源:鉅亨網(wǎng)
867

關(guān)鍵詞: AI芯片 英偉達 谷歌 TPU GPU

2025 年的AI 芯片市場正處于一個微妙的轉(zhuǎn)捩點。盡管英偉達憑借其Blackwell 架構(gòu)仍維持著技術(shù)和市場占有率的絕對領(lǐng)先地位,但Google( GOOGL-US ) TPU 的全面商業(yè)化,正使英偉達看似牢不可破的定價權(quán)開始松動。

據(jù)半導體行業(yè)研究機構(gòu)SemiAnalysis 的測算,英偉達過去的最大客戶Google,如今已成為其最大的對手。

?SemiAnalysis 指出,OpenAI 僅憑「揚言采購TPU」這一籌碼,就能迫使英偉達生態(tài)鏈做出實質(zhì)讓步,使其計算集群的總擁有成本(TCO)下降了約30%。

隨著Anthropic 高達1GW 的TPU 采購細節(jié)曝光,Google 已正式脫離「云服務(wù)商」的標簽,轉(zhuǎn)型為一家直接向外部出售高性能芯片與系統(tǒng)的「商用芯片供應商」。

當頂級AI 實驗室能夠利用TPU 訓練出超越GPT-4 的模型,且Google 愿意開放軟體生態(tài)并提供金融杠桿時,英偉達高達75% 的毛利率神話便不再牢不可破。

Google「主動出擊」:Anthropic 成關(guān)鍵引爆點

長期以來,Google 的TPU 猶如其搜尋演算法,是深藏不露的內(nèi)部核武器。然而,SemiAnalysis 獲取的供應鏈情報顯示,這一策略已發(fā)生根本性逆轉(zhuǎn)。

最直接的案例來自頂級大模型公司Anthropic。 Anthropic 已確認將部署超過100 萬顆TPU,這筆交易的結(jié)構(gòu)極具破壞力,揭示了Google 「混合銷售」的新模式:

直接銷售: 首批約40 萬顆最新的TPUv7 ,將不再透過云端租賃,而是由長期合作伙伴博通( AVGO-US ) 直接出售給Anthropic,價值約100 億美元。博通在本次交易中從幕后走向臺前,成為算力轉(zhuǎn)移的隱形贏家。

云端租賃: 剩余的60 萬顆TPUv7 將透過Google 云進行租賃,涉及高達420 億美元的剩余履約義務(wù)(RPO),直接支撐了Google 云近期積壓訂單的暴漲。

這代表,Google 不再吝嗇于將最先進的算力外售。除了Anthropic,Meta( META-US ) 、SSI、xAI 等頂級AI 實驗室也出現(xiàn)在了潛在客戶名單中。

面對這一突如其來的攻勢,英偉達罕見地展現(xiàn)出防御姿態(tài),不得不針對「循環(huán)經(jīng)濟」(即投資初創(chuàng)公司購買自家芯片)的市場質(zhì)疑發(fā)布長文辯解,凸顯英偉達確實受到威脅。

成本為王:TPU 的碾壓性TCO 優(yōu)勢

客戶轉(zhuǎn)向Google 的理由很純粹:在AI 軍備競賽中,性能是入場券,但總擁有成本(TCO)決定生死。

SemiAnalysis 的模型數(shù)據(jù)顯示,Google TPUv7 在成本效率上對英偉達構(gòu)成碾壓優(yōu)勢。

從Google 內(nèi)部視角看,TPUv7 伺服器的TCO 比英偉達GB200 伺服器低約44%。即便加上Google 和博通的利潤,Anthropic 透過GCP 使用TPU 的TCO,仍比購買GB200 低約30%。

這種成本優(yōu)勢并非僅靠壓低芯片價格實現(xiàn),更源于Google 獨特的金融工程創(chuàng)新:透過云端平臺提供財務(wù)保障。

在AI 基礎(chǔ)設(shè)施建設(shè)中,存在一個明顯的期限錯配:GPU 集群的經(jīng)濟使用壽命通常只有4 到5 年,而數(shù)據(jù)中心場地的租賃合約則長達15 年以上。

這種時間上的不匹配,使得Fluidstack、TeraWulf 等新興算力服務(wù)商很難獲得融資。

針對這個問題,Google 利用一種「表外信貸支持」(IOU)機制來解決這一問題:如果中間商無法支付租金,Google 會介入提供財務(wù)擔保,確保算力資源得以穩(wěn)定運作。

這項金融工具直接打通了加密貨幣礦工(擁有電力與場地)與AI 算力需求之間的堵點,建立了一個低成本、獨立于英偉達生態(tài)之外的基礎(chǔ)設(shè)施體系。

Google 殺手锏:系統(tǒng)工程與光互連技術(shù)

如果說價格戰(zhàn)是戰(zhàn)術(shù)層面的對壘,那么系統(tǒng)工程則是Google 戰(zhàn)略層面的護城河。

雖然單顆TPUv7 在理論峰值算力(FLOPs)上略遜于英偉達Blackwell,但Google 透過極致的系統(tǒng)設(shè)計抹平了差距。

TPUv7 在記憶體頻寬和容量上已大幅縮小與英偉達旗艦芯片的差距,采用了更務(wù)實的設(shè)計哲學:不追求不可持續(xù)的峰值頻率,而是透過更高的模型算力利用率(MFU)來提升實際產(chǎn)出。

更值得注意的是,Google 真正的殺手锏是其獨步天下的光互連(ICI)技術(shù)。不同于英偉達依賴昂貴的NVLink 和InfiniBand/Ethernet 交換機,Google 利用自研的光路交換機(OCS)和3D Torus 拓撲結(jié)構(gòu),建構(gòu)了名為ICI 的片間互連網(wǎng)路。

這一架構(gòu)允許單個TPUv7 集群(Pod)擴展至驚人的9,216 顆芯片,遠超英偉達常見的64 或72 卡集群。 OCS 允許透過軟體定義網(wǎng)路,動態(tài)重構(gòu)拓撲結(jié)構(gòu)。

這代表如果某部分芯片故障,網(wǎng)路可以在毫秒級繞過故障點,重新「切片」成完整的3D 環(huán)面,極大地提升了集群的可用性,且光訊號在OCS 中無需進行光電轉(zhuǎn)換,直接物理反射,大幅降低了功耗和延遲。

Gemini 3 和Claude 4.5 Opus 這兩大全球最強模型均完全在TPU 上完成預訓練,這本身就是對TPU 系統(tǒng)處理「尖端模型預訓練」這一最高難度任務(wù)能力的終極背書。

Google拆除最后的圍墻:軟體生態(tài)的改變

長期以來,TPU 在外部市場的普及一直受到軟體生態(tài)的限制。 Google 堅持使用自家JAX 語言,而大多數(shù)全球AI 開發(fā)者則習慣于PyTorch 與CUDA。

然而,隨著商業(yè)利益的擴大,Google 開始調(diào)整策略。

SemiAnalysis 指出,Google 軟體團隊的績效指標(KPI)已經(jīng)從「服務(wù)內(nèi)部需求」轉(zhuǎn)向「開放與兼容外部生態(tài)」。官方明確表示,將全面支持PyTorch Native 在TPU 上的運行。

原本依賴低效率的Lazy Tensor 轉(zhuǎn)換的方式,也被XLA 編譯器直接對接PyTorch Eager Execution 模式所取代。

這代表,像Meta 這類以PyTorch 為主的公司,可以幾乎無縫地將現(xiàn)有程式碼部署到TPU 上。

同時,Google 也積極向vLLM、SGLang 等開源推理框架貢獻程式碼,進一步打通TPU 在開源AI 生態(tài)中的兼容性。

這一策略轉(zhuǎn)變,正在逐步削弱英偉達原本牢不可破的「CUDA 護城河」。隨著軟體與硬體的雙重進攻,矽谷AI 算力霸主之爭才剛揭開序幕。