开云体育 xAI坐拥55万张GPU加快卡, 但算力诓骗率仅11%

发布日期：2026-05-09 12:31 作者：admin 来源：未知点击：146

大家AI竞赛的早已从“谁能抢到更多GPU”悄然转向“谁能把GPU信得过用起来”。可是，坐拥约55万块英伟达GPU，实质诓骗率仅有11%，这一“打脸”般的数字，正将埃隆·马斯克（Elon Musk）旗下的东说念主工智能公司xAI推优势口浪尖。

据外媒《The Information》赢得的xAI里面备忘录败露，xAI公司总裁迈克尔·尼科尔斯（Michael Nicolls）向团队坦承，公司现在的模子浮点运算诓骗率（MFU）约为11%。这个数字意味着，表面上能输出100份本质算力的硬件，实质仅产出了11份。

xAI现在领有约55万颗NVIDIA GPU，其中包括H100和H200系列。尽管这些GPU比最新的Blackwell产物落伍了一个世代，但xAI部署的GPU界限之大令阛阓印象潜入。

关于这一近况，Michael Nicolls在里面备忘录中给出了直白的评价：“低得疾苦”。他已为团队设定了在改日几个月内将诓骗率拉升至50% 的方向。

“11%”这个数字，并非指89%的GPU在统统闲置，而是臆想有用本质概括占硬件表面峰值算力比例的严苛筹办。

从行业基准来看，分娩级大模子本质的MFU时时落在35%至45%之间。Meta和谷歌凭借深厚的软件堆栈累积，其GPU诓骗率分歧可达约43%和46%。即便以“低效”著称的GPT-3本质时期，MFU也在21%-26%之间。比较之下，xAI的11%不仅远低于面前主活水平，致使低于AI算力发展史上的“古早”疾苦时期。

坐拥算力“金山”却难有用武之地，枢纽出在那边？谜底指向软件堆栈与并行计策的滞后。

xAI在业内以“统统按照英伟达推选神色部署GPU”的法度生作念法著称。法度生却跑出低分，讲明问题不在法度的硬件或网罗拓扑层面。根源在于，本质栈、并行计策和模子工程等软件优化速率，远跟不上其激进的硬件延迟格式。

业界平庸斟酌的“存储墙”步地成为主要瓶颈——HBM显存读取速率远慢于沟通芯片，开云体育导致芯片多量时间空转恭候数据；网罗拓扑中的任何一处瓶颈，在数万张卡的同步条款下，皆会被急剧放大。此外，Lambda等机构的分析指出，显存压力、过度的激活重沟通和张量并行带来的跨GPU通讯支出等，皆是负担MFU的系统性身分。

xAI的算力基础身手配置速率自己即是一个“传说”：其孟菲斯Colossus超算集群从动工到插足运营仅用了122天，从10万张GPU扩展到20万张仅用了92天。黄仁勋曾评价此类工程“时时需要四年”。

△xAI孟菲斯Colossus超算集群

可是，惊东说念主的速率似乎也让xAI“欠下”了技艺债。延迟越快，撑执大界限并行本质的软件系统复杂度就越大。当企业试图将GPU界限从数千张推向数十万张时，通讯、逶迤、容错和并行计策的挑战会呈指数级增长。xAI的11%的算力诓骗率，恰是这一矛盾的团结体现。

把问题统统归罪于xAI一家也并不公正。《The Information》的报说念征引一位匿名筹商员的话称：“跑过40%对xAI的大多数竞争敌手来说也很难”。这标明，超大界限集群下的低效问题，是粉饰总共AI行业的暗影。

报说念还揭示了一个行业里面的诬告步地：由于惦念GPU被调走或承受压力，一些筹商员致使通过反复重跑本质来东说念主为“好意思化”自家MFU数据。囤而毋庸的算力滥用，成为行业心照不宣的奥密。

面临成果困局，xAI正多措并举。一方面，公司预备通过基础身手和软件栈优化来科罚诓骗率问题。另一方面，据媒体报说念，xAI已运转将部分闲置算力对出门租，AI编程创业公司Cursor已预备使用其“数万张GPU”来本质新模子。

AI算力之争已过“装备竞赛”阶段开云体育，崇敬进入“成果竞赛”的深水区。11%的低诓骗率如归拢面镜子，照出AI行业下半场的中枢命题：怎样将“买得到”的硬件，荡漾为信得过“用得好”的竞争壁垒。

赛车pk10官网平台首页

相关标签： 开云体育坐拥 GPU xAI 55万张

上一篇：上一篇：开云(中国) 鲁群众4月安卓新机榜出炉 OPPO系机型占据通顺与AI双榜前三

下一篇：下一篇：开云体育某厂骁龙2nm新机建树全曝光: 2nm+2亿像素, 或为荣耀Magic 9系列