<li id="rnldf"></li>
<label id="rnldf"><fieldset id="rnldf"></fieldset></label>
    <small id="rnldf"><strong id="rnldf"></strong></small>

    1. <strike id="rnldf"></strike>
    1. <samp id="rnldf"></samp>
      亚洲国产精品久久无人区,亚洲中文字幕一区二区,亚洲一区二区av免费,JIZZJIZZ亚洲无乱码,欧洲免费一区二区三区视频,国内熟妇与亚洲洲熟妇妇,国产超碰人人爽人人做人人添,视频一区二区三区刚刚碰
      黃仁勛塑造“Token經濟學” 英偉達擁抱智能體時代
      來源:21世紀經濟報道作者:倪雨晴2026-03-18 07:20
      字號
      超大
      標準
      3月17日凌晨,被譽為AI“超級碗”與AI“春晚”的英偉達GTC開幕,“AI教主”、英偉達創始人兼CEO黃仁勛再次站在舞臺中央,用一場技術風暴刷新著物理極限。

      3月17日凌晨,被譽為AI“超級碗”與AI“春晚”的英偉達GTC開幕,“AI教主”、英偉達創始人兼CEO黃仁勛再次站在舞臺中央,用一場技術風暴刷新著物理極限。

      英偉達宣布,Vera Rubin(最新芯片架構)目前已有七款新芯片全面投入生產,Vera Rubin平臺正在開啟 Agentic AI新時代,構建全球最大的AI工廠。

      具體而言,這些芯片產品包括:NVIDIA Vera CPU(英偉達已進軍服務器CPU),NVIDIA Rubin GPU(GPU王牌產品),NVIDIA NVLink 6(第六代NVLink交換機芯片,芯片內部互聯),NVIDIA ConnectX-9 SuperNIC(超級網卡),NVIDIA BlueField-4 DPU (存儲芯片),NVIDIA Spectrum-6 (以太網交換機芯片,支持CPO技術),以及新集成的 NVIDIA Groq 3 LPU(收編Groq后的首款芯片)。

      可以看到,芯片家族中不僅有大家平常熟知的CPU、GPU產品,還包括來自Groq的LPU,以及存儲芯片、交換機芯片等全系產品。這些芯片又能夠組成5款機架,在數據中心運行。

      “Vera Rubin是一次代際躍遷——七個突破性芯片、五種機架、一臺巨型超級計算機——為AI的每一個階段提供動力,”黃仁勛表示,“隨著Vera Rubin的推出,Agentic AI的拐點已經到來,并將開啟歷史上最大規模的基礎設施建設。”

      在演講中,黃仁勛還預測,Blackwell與Rubin的AI芯片,到2027年底的收入將達到1萬億美元,相比去年10月的5000億美元銷售預測,已經翻倍。

      這場發布會可謂“前所未有”,這不單單是GPU、也不單是某一項技術升級,黃仁勛再次強調“Token”經濟學,并貫徹AI“五層蛋糕”理論。

      一個趨勢是,巨頭們正在不斷聚集能力,補齊短板,延伸上下游,形成更加強大的壁壘。單一比拼芯片、性能等單打獨斗的階段已經過去,一場全方位的系統級激烈競賽正在上演。

      Vera Rubin的徹底革新:從單芯片到系統級時代

      作為Blackwell的跨代接力者,英偉達定于2026年下半年量產的Rubin (R100) 架構。在核心底層,該架構全面轉場臺積電3nm (N3P) 工藝,其標志性的Vera CPU(基于88核自研Olympus 架構)與Rubin GPU通過1.8 TB/s的NVLink-C2C技術實現了物理意義上的同封裝集成。

      這種“去PCIe化”的緊耦合設計,讓算力不再受限于傳統鏈路,單GPU在NVFP4精度下的推理算力增至50 PFlops,訓練算力達35 PFlops,其規模化推理能效較Blackwell提升了5倍之多。

      在應用場景層面,Rubin是專門為 “代理型AI(Agentic AI)” 與長上下文推理打造的數字工廠心臟。它引入了Transformer Engine 3.0與Inference Context Memory存儲平臺,通過BlueField-4 DPU卸載存儲管理壓力,使得AI智能體能夠處理數萬個Token的上下文關聯,并進行多步邏輯推理與實時決策,平臺配備了支持硅光子技術(CPO)的Spectrum-X Ethernet Photonics網絡,單機柜NVL72的內部互聯總帶寬達到260 TB/s,相當于全球互聯網跨境帶寬總和的數倍。

      英偉達還推出了Vera CPU機架,它是基于英偉達MGX構建的高密度液冷基礎設施,集成256個Vera CPU,以提供可擴展、節能的容量,并具備世界級單線程性能。與GPU計算機架一起,它們為大規模Agentic AI和強化學習提供CPU基礎——Vera 的效率是傳統CPU的兩倍,速度提升50%。

      目前,與英偉達合作部署Vera CPU的客戶包括阿里巴巴、字節跳動、Meta和Oracle Cloud Infrastructure,以及CoreWeave、Lambda、Nebius和Nscale。Vera已經全面投產,并將在今年下半年供貨。

      傳統的數據中心、AI基建正在面臨新的變革。黃仁勛表示:“在AI時代,智能Token是新的貨幣,而 AI工廠是生成這些Token的基礎設施。通過 Vera Rubin DSX AI Factory 參考設計和 Omniverse DSX Blueprint(數字孿生藍圖),我們正在提供構建世界上最高生產力AI工廠的基礎,加速首次收入時間,并最大化規模和能源效率。”

      Groq LPU推理芯片:與GPU構建混合算力帝國

      再看非常受關注的Groq芯片。

      2025年底,英偉達通過200億美元戰略授權并深度集成的Groq LPU (Language Processing Unit) 架構,是精準獵殺延遲、開啟實時交互時代的“超音速截擊機”。

      英偉達表示,此次推出的Groq 3 LPX(機架)標志著加速計算的一個里程碑。LPX機架包含256個LPU處理器,具有128GB片上SRAM和640 TB/s的擴展帶寬。當與Vera Rubin NVL72一起部署時,Rubin GPU和LPU通過共同計算AI模型每一層來提升解碼速度,從而為每個輸出Token提供計算。

      同時,LPX采用全液冷設計,并基于MGX基礎設施構建,將無縫集成到下一代Vera Rubin AI工廠中,并將在今年下半年提供。

      進入推理時代,英偉達在GPU之外,融合了新的架構,大幅提升效率。

      在技術架構上,Groq LPU拋棄了傳統GPU中復雜的緩存管理、分支預測和指令重排等“猜測性”硬件設計,轉而采用一種確定性流水線架構。這種設計將硬件復雜度徹底剝離至編譯器層,使得數據在芯片內的流動如同精密的傳送帶,沒有任何不可控的抖動(Jitter)。

      在實戰應用場景中,由英偉達技術加持的LPX機架,正成為“代理型AI(Agentic AI)”與“實時語音交互”的唯一救星。在自動駕駛輔助系統或高頻交易機器人中,任何毫秒級的計算波動都可能導致決策失效,而LPU的確定性算力保證了任務執行時間永遠恒定。

      對于需要多步推理甚至涉及數百次模型調用的復雜Agent鏈條,LPU能將原本需要數分鐘的串聯思考縮短至數秒,使得AI能夠像人類一樣進行自然、流利的實時對話與協同。為了承載這一全新的計算范式,英偉達將LPU單元通過NVFusion技術無縫嵌入其龐大的CUDA生態,通過 disaggregated(解耦式)架構將訓練好的權重從GPU快速調度至LPU推理陣列。

      在這一能力加持下,英偉達將訓練和推理分離,構建了一個混合算力帝國:GPU負責在后方深耕萬億參數模型的訓練與長文本預處理,而LPU陣列則在前方防線以10倍于對手的能效比與極速響應,統治著萬億級的實時推理市場,正式宣告了“推理即時化”時代的到來。

      英偉達版“龍蝦”面世:擁抱智能體時代

      與此同時,英偉達圍繞AI代理(Agent)、開放模型以及跨行業應用發布了一系列重要進展。最受開發者關注的一項發布,是面向OpenClaw社區推出的NemoClaw軟件棧。近期,開源項目OpenClaw在開發者社區迅速走紅,被不少業內人士視為“個人AI操作系統”的雛形。

      黃仁勛也高度評價了OpenClaw。“OpenClaw向所有人打開了AI的下一個前沿,并成為歷史上增長最快的開源項目,”黃仁勛表示,“與傳統AI應用不同,OpenClaw的目標是讓AI代理像應用程序一樣持續運行,能夠自主規劃任務、調用工具,并完成復雜工作流程。”

      在這一框架下,NemoClaw提供了一整套基礎軟件能力,使開發者可以通過一條命令安裝NVIDIA Nemotron模型以及新發布的OpenShell運行時環境,并為AI代理增加安全與隱私控制能力。借助OpenShell提供的隔離沙箱環境,AI代理在訪問工具和數據時可以遵循既定的安全策略與隱私規則,從而在提升效率的同時保證數據安全。

      NemoClaw還支持本地模型與云端模型的混合調用。開發者可以在用戶專用設備上運行Nemotron模型,同時通過隱私路由訪問云端的前沿模型,從而在保證數據隱私的同時獲得更強的計算能力。英偉達表示,NemoClaw可以運行在多種專用計算平臺上,包括搭載GeForce RTX顯卡的PC和筆記本電腦、RTX PRO工作站,以及DGX Station和DGX Spark系統,為全天候運行的AI代理提供穩定算力。

      在推動AI代理平臺發展的同時,英偉達也在加速構建開放模型生態。此次大會上,英偉達宣布成立Nemotron Coalition(Nemotron聯盟),聯合全球多家領先AI實驗室與模型開發機構,共同推進開放前沿模型的發展。

      除了生態層面的合作,英偉達也同步擴展了多條開放模型產品線,以支持AI代理、物理智能以及醫療科研等不同領域的發展。其中,NVIDIA Nemotron 3系列模型進一步強化多模態理解能力,推出Ultra、Omni和VoiceChat等多個版本。相關模型能夠同時處理語言、視覺與語音信息,使AI代理不僅可以進行自然對話,還能夠完成復雜推理任務,并從視頻和文檔等多種數據來源中提取關鍵信息。

      除了數字世界中的AI代理,英偉達還在推動人工智能進入現實世界。此次發布的新模型包括用于機器人和自動駕駛系統的多種基礎模型。例如,NVIDIA Isaac GR00T N1.7是一款面向類人機器人的視覺語言行動模型,能夠支持機器人在現實環境中進行感知、推理和行動決策。

      NVIDIA Alpamayo 1.5則面向自動駕駛場景,通過導航提示、多攝像頭支持以及可配置攝像頭參數等能力提升車輛推理能力;而即將推出的NVIDIA Cosmos 3則被稱為首個統一“世界生成、物理推理和行動仿真”的世界基礎模型,有望幫助機器人和自動駕駛系統在復雜環境中完成訓練與決策。

      從AI代理平臺到開放模型生態,再到機器人、自動駕駛與生命科學等應用領域,英偉達正在逐步搭建一個覆蓋數字世界與物理世界的AI技術體系。隨著更多開發者和企業加入開放模型與AI代理生態,這一體系也有望進一步推動人工智能在全球范圍內的創新與落地。

      責任編輯: 胡青
      聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
      下載"證券時報"官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
      用戶評論
      登錄后可以發言
      網友評論僅供其表達個人看法,并不表明證券時報立場
      發表評論
      暫無評論
      時報熱榜
      換一換
        熱點視頻
        換一換