
近期,互聯(lián)網(wǎng)大廠紛紛轉(zhuǎn)移“戰(zhàn)場(chǎng)”,瞄準(zhǔn)算力和Token。 (豆包AI生成)
深圳商報(bào)首席記者 陳小慧
如果說(shuō)一年前互聯(lián)網(wǎng)大廠正忙著主攻“外賣戰(zhàn)”,如今大廠們又轉(zhuǎn)移了“戰(zhàn)場(chǎng)”,瞄準(zhǔn)算力和Token。
3月18日,阿里云官網(wǎng)發(fā)布公告:因全球AI需求爆發(fā)、供應(yīng)鏈漲價(jià),阿里云AI算力、存儲(chǔ)等產(chǎn)品最高漲價(jià)34%。同一天,百度智能云也在官網(wǎng)發(fā)布AI算力、存儲(chǔ)等產(chǎn)品調(diào)價(jià)公告,稱為保障平臺(tái)長(zhǎng)期穩(wěn)定運(yùn)行與服務(wù)質(zhì)量,對(duì)部分產(chǎn)品價(jià)格進(jìn)行結(jié)構(gòu)性優(yōu)化。此前的3月11日,騰訊云宣布Tencent HY2.0 Instruct模型輸入價(jià)格漲幅高達(dá)463.13%。
不過(guò),京東云有點(diǎn)“例外”,并沒(méi)有選擇跟進(jìn)這波漲價(jià),而是喊話全系核心產(chǎn)品不漲價(jià),甚至部分有所降價(jià)。
縱觀全球,亞馬遜AWS、谷歌云也宣布漲價(jià)。為何云巨頭們集體漲價(jià)?背后和哪些因素有關(guān)?這場(chǎng)Token“算力戰(zhàn)”將對(duì)行業(yè)帶來(lái)哪些影響?
AI時(shí)代狂“燒”Token
隨著智能時(shí)代到來(lái),AI正全面重構(gòu)行業(yè)生態(tài),重塑人們的工作與生活。AI智能體從概念走向規(guī)模化落地,加速應(yīng)用創(chuàng)新,推動(dòng)Token消耗呈指數(shù)級(jí)增長(zhǎng)。
什么是Token?根據(jù)公開資料,Token翻譯過(guò)來(lái)叫做“詞元”,是大模型處理和生成文本的基本單位,也是大模型廠商銷售套餐的計(jì)費(fèi)單位。當(dāng)一段文本或圖片、音頻交給AI時(shí),它會(huì)被切割成一個(gè)個(gè)Token,要向AI提問(wèn),就會(huì)消耗Token。可以說(shuō),算力越強(qiáng),每秒生成的Token越多。
近日召開的中國(guó)發(fā)展高層論壇2026年年會(huì)透露,今年3月,中國(guó)日均Token調(diào)用量突破140萬(wàn)億,相比2024年初的1000億,兩年增長(zhǎng)超千倍。同月,中國(guó)AI大模型周Token調(diào)用量連續(xù)三周超越美國(guó),成為全球AI應(yīng)用活躍度最高的國(guó)家之一。全球最大AI模型API聚合平臺(tái)OpenRouter最新數(shù)據(jù)顯示,3月16日至22日,全球AI大模型總Token調(diào)用量為20.4萬(wàn)億,僅中國(guó)就達(dá)7.359萬(wàn)億,占全球的36%。
在近日舉行的GTC 2026年度開發(fā)者大會(huì)上,英偉達(dá)CEO黃仁勛多次提到了Token,并提出了“Token工廠”的概念,認(rèn)為未來(lái)的數(shù)據(jù)中心不再存數(shù)據(jù)、跑軟件,而是生產(chǎn)Token。
大廠們對(duì)Token也及時(shí)出手。3月16日,阿里巴巴正式成立Alibaba Token Hub(ATH)事業(yè)群,建立以“創(chuàng)造Token、輸送Token、應(yīng)用Token”為核心目標(biāo)的新組織,由阿里巴巴CEO吳泳銘直接負(fù)責(zé)。
這是阿里巴巴面向AI Agent時(shí)代的一次重要組織調(diào)整,以Token Hub為核心主線,強(qiáng)化AI業(yè)務(wù)戰(zhàn)略協(xié)同,全面推進(jìn)阿里AI戰(zhàn)略落地。
“當(dāng)下正處于AGI爆發(fā)前夜。大量數(shù)字化工作將由數(shù)以百億計(jì)的AI Agent來(lái)支撐,而這些AI Agent將由模型產(chǎn)生的Token支撐運(yùn)行,成為人類與數(shù)字世界交互的主要載體?!眳怯俱懕硎尽?/p>
為何Token的重要性在今天被推到了頂峰?蘇商銀行特約研究員付一夫在接受記者采訪時(shí)表示,Token成為AI核心計(jì)量單位,標(biāo)志著行業(yè)從模型競(jìng)賽轉(zhuǎn)向商業(yè)化落地。它是模型處理信息的最小單元,直接對(duì)應(yīng)算力消耗與服務(wù)成本,可清晰定價(jià)、計(jì)費(fèi)與核算。
“隨著智能體普及,長(zhǎng)文本、多輪推理、多模態(tài)任務(wù)爆發(fā),Token用量呈指數(shù)級(jí)增長(zhǎng),成為衡量AI工作量與價(jià)值的標(biāo)尺。它把模糊的算力服務(wù),變成可量化、可交易、可管控的商品,支撐商業(yè)化閉環(huán)。企業(yè)與開發(fā)者按使用付費(fèi),平臺(tái)按消耗配比資源,Token成為連接供給與需求的樞紐。它決定成本、定價(jià)與生態(tài)分配,因此成為行業(yè)競(jìng)爭(zhēng)與商業(yè)運(yùn)營(yíng)的核心錨點(diǎn)?!备兑环蛘f(shuō)。
Token已成基礎(chǔ)貨幣
“未來(lái)工程師的年薪將包含一筆與現(xiàn)金同等重要的Token預(yù)算,甚至可能達(dá)到年薪的一半,用于換取10倍效率提升?!秉S仁勛在日前舉行的GTC大會(huì)上提到,Token是新的基礎(chǔ)貨幣。
把Token當(dāng)工資,這說(shuō)明了Token的經(jīng)濟(jì)價(jià)值?!邦愃朴谒娒旱摹取颉畤崱琓oken有特定的市場(chǎng)價(jià)格,用多少,就付多少?!币幻L(zhǎng)期深耕互聯(lián)網(wǎng)行業(yè)的從業(yè)者告訴記者。
據(jù)了解,Token的價(jià)格分別有輸入價(jià)格和輸出價(jià)格。以Chat-GPT為例,在輸入價(jià)格上,GPT-5.4旗艦版是2.5 美元/百萬(wàn)Token;而輸出價(jià)格上,GPT-5.4是15美元/百萬(wàn)Token。據(jù)騰訊科技統(tǒng)計(jì),Claude 4.6 Sonnet的輸出價(jià)格為15美元/百萬(wàn)Token,而MiniMaxM2.5的典型輸出價(jià)格約為1.2美元/百萬(wàn)Token。
不難看出,當(dāng)Token成為AI時(shí)代的“新石油”,為AI生產(chǎn)和運(yùn)輸提供動(dòng)力的底層基礎(chǔ)設(shè)施成為最大的受益者。比如英偉達(dá),黃仁勛在GTC大會(huì)上表示,AI正在從“訓(xùn)練”轉(zhuǎn)向“推理”,算力需求正被放大。黃仁勛認(rèn)為,Token正在成為AI時(shí)代的硬通貨,英偉達(dá)的收入來(lái)源就是Token工廠。
大模型廠商也迎來(lái)了明確的商業(yè)化變現(xiàn)路徑。3月4日,火山引擎官網(wǎng)公布Seedance2.0視頻生成價(jià)格:含視頻輸入28元/百萬(wàn)Tokens,不含視頻輸入46元/百萬(wàn)Tokens。生成15秒視頻需消耗30.888萬(wàn)Tokens,按46元單價(jià)計(jì)算,單條成本15元,折合每秒1元。
隨后,騰訊云、阿里云、百度云都宣布模型輸入價(jià)格或相關(guān)AI算力、存儲(chǔ)產(chǎn)品漲價(jià)。3月23日,MiniMax宣布將原有的Coding Plan全面升級(jí)為支持MiniMax全模態(tài)模型的Token Plan,這也是全球首個(gè)支持全模態(tài)模型的訂閱計(jì)劃。
“全球云廠商同步漲價(jià),是供需失衡、成本剛性與商業(yè)模式轉(zhuǎn)向共同作用的結(jié)果。需求側(cè),AI智能體與多模態(tài)普及,讓算力消耗從輕量對(duì)話變?yōu)橹囟韧评?,平臺(tái)負(fù)荷急劇攀升。供給側(cè),高端芯片受限、供應(yīng)鏈緊張、硬件與能耗成本持續(xù)走高,擴(kuò)張速度跟不上需求。行業(yè)告別低價(jià)搶份額階段,轉(zhuǎn)向盈利與可持續(xù)運(yùn)營(yíng),漲價(jià)是成本傳導(dǎo)與價(jià)值回歸。國(guó)內(nèi)外大廠同步調(diào)價(jià),形成行業(yè)共識(shí)。同時(shí),算力從通用資源變?yōu)锳I核心生產(chǎn)資料,稀缺性抬升價(jià)格,廠商通過(guò)調(diào)價(jià)平衡負(fù)荷、篩選高質(zhì)量客戶,保障服務(wù)穩(wěn)定性,這是產(chǎn)業(yè)走向成熟的必然選擇?!备兑环蛘f(shuō)。
算力轉(zhuǎn)向能效性價(jià)比
如今,AI正在全面進(jìn)入行業(yè)應(yīng)用的深水區(qū)。數(shù)據(jù)顯示,全球行業(yè)中已有約3000萬(wàn)AI智能體(AI Agent)協(xié)同工作,從技術(shù)演進(jìn)到應(yīng)用開發(fā),從場(chǎng)景滲透到業(yè)務(wù)落地,行業(yè)的生產(chǎn)力正在被重新定義。
華為發(fā)布的《計(jì)算2030報(bào)告》提出,到2030年,相較于2020年通用算力將增長(zhǎng)10倍,而AI算力的增長(zhǎng)是4000倍。
隨著算力激增,行業(yè)未來(lái)怎么走?大廠們?nèi)绾未蚝眠@場(chǎng)Token“算力戰(zhàn)”?
中國(guó)城市發(fā)展研究院投資部副主任袁帥表示,Token不僅是度量模型理解與生成能力的刻度,更是連接算法效能與商業(yè)利潤(rùn)的唯一錨點(diǎn)。誰(shuí)掌握了Token的定價(jià)權(quán),誰(shuí)就定義了AI應(yīng)用的準(zhǔn)入門檻。
“在競(jìng)爭(zhēng)策略上,阿里與百度憑借深厚的云基礎(chǔ)設(shè)施底座,試圖在高溢價(jià)中篩選出高凈值客戶,鞏固其作為‘AI工廠’的護(hù)城河;騰訊則通過(guò)調(diào)高Instruct模型價(jià)格,側(cè)重于對(duì)其優(yōu)質(zhì)垂直場(chǎng)景能力的保護(hù),強(qiáng)調(diào)精準(zhǔn)交付而非規(guī)模覆蓋;京東云的逆勢(shì)不漲,本質(zhì)上是錯(cuò)位競(jìng)爭(zhēng)的低價(jià)策略,試圖通過(guò)下沉市場(chǎng)獲取大廠溢出流量,利用零售基因下的供應(yīng)鏈整合能力來(lái)?yè)Q取規(guī)模效應(yīng)。”袁帥說(shuō)。
從盈利前景看,袁帥認(rèn)為,大廠通過(guò)云服務(wù)獲利已不僅是趨勢(shì),更是生存要求。盡管短期面臨供應(yīng)鏈漲價(jià)壓力,但隨著企業(yè)級(jí)AI應(yīng)用從實(shí)驗(yàn)性走向生產(chǎn)線,高毛利的算力訂閱與專業(yè)化模型調(diào)優(yōu)將取代傳統(tǒng)的資源租賃,成為利潤(rùn)的增長(zhǎng)引擎。這場(chǎng)算力戰(zhàn)將加速行業(yè)洗牌,弱化缺乏自研芯片或長(zhǎng)效算法優(yōu)化能力的平臺(tái)。
袁帥預(yù)測(cè),2026年的人工智能行業(yè)正步入“重資產(chǎn)、重回報(bào)”的成熟期。算力不再是廉價(jià)的“自來(lái)水”,而是受地理、政策、能源多重約束的稀缺資源。這種趨勢(shì)倒逼應(yīng)用端轉(zhuǎn)向“能效性價(jià)比”,行業(yè)將進(jìn)入存量?jī)?yōu)化階段,只有能平衡算力紅利與成本紅線的廠商,才能在Token經(jīng)濟(jì)中掌握最終的分配權(quán)。