电话: 邮箱:

开云体育 xAI坐拥55万张GPU加快卡, 但算力诓骗率仅11%

发布日期:2026-05-09 12:31 作者:admin 来源:未知 点击:146

大家AI竞赛的早已从“谁能抢到更多GPU”悄然转向“谁能把GPU信得过用起来”。可是,坐拥约55万块英伟达GPU,实质诓骗率仅有11%,这一“打脸”般的数字,正将埃隆·马斯克(Elon Musk)旗下的东说念主工智能公司xAI推优势口浪尖。

据外媒《The Information》赢得的xAI里面备忘录败露,xAI公司总裁迈克尔·尼科尔斯(Michael Nicolls)向团队坦承,公司现在的模子浮点运算诓骗率(MFU)约为11%。这个数字意味着,表面上能输出100份本质算力的硬件,实质仅产出了11份。

xAI现在领有约55万颗NVIDIA GPU,其中包括H100和H200系列。尽管这些GPU比最新的Blackwell产物落伍了一个世代,但xAI部署的GPU界限之大令阛阓印象潜入。

关于这一近况,Michael Nicolls在里面备忘录中给出了直白的评价:“低得疾苦”。他已为团队设定了在改日几个月内将诓骗率拉升至50% 的方向。

“11%”这个数字,并非指89%的GPU在统统闲置,而是臆想有用本质概括占硬件表面峰值算力比例的严苛筹办。

从行业基准来看,分娩级大模子本质的MFU时时落在35%至45%之间。Meta和谷歌凭借深厚的软件堆栈累积,其GPU诓骗率分歧可达约43%和46%。即便以“低效”著称的GPT-3本质时期,MFU也在21%-26%之间。比较之下,xAI的11%不仅远低于面前主活水平,致使低于AI算力发展史上的“古早”疾苦时期。

坐拥算力“金山”却难有用武之地,枢纽出在那边?谜底指向软件堆栈与并行计策的滞后。

xAI在业内以“统统按照英伟达推选神色部署GPU”的法度生作念法著称。法度生却跑出低分,讲明问题不在法度的硬件或网罗拓扑层面。根源在于,本质栈、并行计策和模子工程等软件优化速率,远跟不上其激进的硬件延迟格式。

业界平庸斟酌的“存储墙”步地成为主要瓶颈——HBM显存读取速率远慢于沟通芯片,开云体育导致芯片多量时间空转恭候数据;网罗拓扑中的任何一处瓶颈,在数万张卡的同步条款下,皆会被急剧放大。此外,Lambda等机构的分析指出,显存压力、过度的激活重沟通和张量并行带来的跨GPU通讯支出等,皆是负担MFU的系统性身分。

xAI的算力基础身手配置速率自己即是一个“传说”:其孟菲斯Colossus超算集群从动工到插足运营仅用了122天,从10万张GPU扩展到20万张仅用了92天。黄仁勋曾评价此类工程“时时需要四年”。

△xAI孟菲斯Colossus超算集群

可是,惊东说念主的速率似乎也让xAI“欠下”了技艺债。延迟越快,撑执大界限并行本质的软件系统复杂度就越大。当企业试图将GPU界限从数千张推向数十万张时,通讯、逶迤、容错和并行计策的挑战会呈指数级增长。xAI的11%的算力诓骗率,恰是这一矛盾的团结体现。

把问题统统归罪于xAI一家也并不公正。《The Information》的报说念征引一位匿名筹商员的话称:“跑过40%对xAI的大多数竞争敌手来说也很难”。这标明,超大界限集群下的低效问题,是粉饰总共AI行业的暗影。

报说念还揭示了一个行业里面的诬告步地:由于惦念GPU被调走或承受压力,一些筹商员致使通过反复重跑本质来东说念主为“好意思化”自家MFU数据。囤而毋庸的算力滥用,成为行业心照不宣的奥密。

面临成果困局,xAI正多措并举。一方面,公司预备通过基础身手和软件栈优化来科罚诓骗率问题。另一方面,据媒体报说念,xAI已运转将部分闲置算力对出门租,AI编程创业公司Cursor已预备使用其“数万张GPU”来本质新模子。

AI算力之争已过“装备竞赛”阶段开云体育,崇敬进入“成果竞赛”的深水区。11%的低诓骗率如归拢面镜子,照出AI行业下半场的中枢命题:怎样将“买得到”的硬件,荡漾为信得过“用得好”的竞争壁垒。

赛车pk10官网平台首页
相关标签: 开云体育 坐拥 GPU xAI 55万张