一个短语说透了一个时代
WSJ 用了两个字:Jensen jail。
Jensen,是 Nvidia CEO 黄仁勋的名字;jail,是监狱。翻译过来就是:黄仁勋的牢笼。
这不是玩笑,也不是批评。它是一种结构性现实的精准描述——部分新兴 AI 算力云厂商(neo-clouds,如 CoreWeave、Lambda、Nebius 等)正私下承认:他们不敢停止购买 Nvidia 的全栈产品,因为一旦偏离,可能失去未来 GPU 的配额,被"关进"Nvidia 的生态牢笼。
Bessemer Venture Partners 合伙人 Adam Fisher 说得很直白:"有些 neo-clouds 很渴望替代方案,但无法从其他供应商那里得到,于是只能继续往里走。"
这是 2026 年 AI 基础设施战争里最核心的权力博弈,也是 Google 砸数百亿美元联合黑石发起 TPU 反击的根本动因。
三把锁:Nvidia 怎么把供应链变成了权力
Nvidia 的护城河远不止一张 GPU 产品表。它是三把锁叠在一起的结构。
第一把锁:GPU 稀缺与分配权
Blackwell 一代的 GPU 供不应求是公开的事实。在稀缺环境下,谁能决定谁先拿到货,谁就掌握了筹码。Nvidia 倾向于优先供给"全栈采购"的客户——不只买 GPU,还要买 NVLink 网络、DGX 系统、NeMo 软件栈。
Jensen Huang 在公开场合说得既坦诚又精明:"买 Nvidia 全家桶让我最开心,但只买一部分也让我非常开心。"听起来是好说话,但背后的意思是:全栈客户排在前面。
第二把锁:CUDA 护城河
这是最难打破的一把锁。全球超过 400 万开发者的代码、几乎所有主流 AI 框架(PyTorch、TensorFlow 的底层优化)、数以千计的预训练模型和推理库——全都在 CUDA 之上构建。
不是说切换不了,而是切换代价极高。你需要重新优化内核、测试算子精度、跑通整套 MLOps 流程。即使 PyTorch 等上层框架提供了抽象,底层的精细调优仍然需要与 CUDA 深度绑定。
第三把锁:全栈融资关系
这是最隐蔽也最有力的一把锁。Nvidia 参与了多家 neo-clouds 的融资——既是硬件供应商,又是投资方。这种"循环融资"结构(circular financing)让双方的利益深度绑定:云厂商用融资买 Nvidia 的 GPU,再把 GPU 租给 AI 公司,收入再还贷款。一旦断开,融资关系也可能跟着断。
三把锁叠在一起,形成的不是普通的市场垄断,而是一套生态系统级的锁定。用经济学的语言说,切换成本已经高到让理性客户不愿意轻易尝试。
Google 的反击:用同样的武器,复制同样的 playbook
Google 没有试图从软件层面攻克 CUDA。它选择了一条更直接的路:复制 Nvidia 的 playbook,但用 TPU 替换 GPU,用 Google Cloud 替换 CUDA 生态。
具体分三步。
第一步:用巨额担保替代 Nvidia 的配额杠杆
Nvidia 控制 GPU 分配,Google 用资金担保来替代这种控制。
逻辑与 Nvidia 的循环融资完全对称:Google 用担保帮数据中心融资建厂,数据中心买 TPU,Google 再把 TPU 算力卖给 Anthropic 等 AI 公司。钱的流向锁定了硬件的流向。
第二步:联合黑石,打造独立 TPU 云
2026 年 5 月,Google 与 Blackstone 宣布联合 venture,黑石初始投入 50 亿美元股权,加杠杆后总规模可达 250 亿美元级别,打造一家独立的美国 TPU 算力公司,直接与 CoreWeave(Nvidia 系)、Nebius 竞争。
这一步的战略意义在于:它把 TPU 从"必须通过 Google Cloud 才能用",变成了一个独立可采购的算力选项。换句话说,Google 在用黑石的体量和品牌,给 TPU 生态系统建立了一个独立的渠道——就像 CoreWeave 是 Nvidia GPU 的独立分销商一样。目标是 2027 年上线 500MW 容量。
第三步:让 Anthropic 做双栖示范
Anthropic 是这场博弈里最典型的"双栖物种"。它同时使用 Nvidia GPU(在 AWS 和 Google Cloud 上)、Google TPU(计划获取最多 100 万块 TPU,吉瓦级容量)和 AWS Trainium,根据不同模型和训练/推理阶段选择最优硬件。
Anthropic 的策略不是"反 Nvidia",而是工作负载驱动的硬件选择——训练大模型可能还是 Nvidia GPU 更成熟,但特定推理任务用 TPU 可以在成本和速度上做出显著优化。它的存在,是对其他 AI 公司最有力的背书:多元化是可行的,不是只能嘴上说说。
最硬的证据:Citadel 用绩效数字说话
光有战略和担保还不够,最终说服市场的是真实绩效。
Citadel Securities(全球最大做市商之一,日均交易额数十亿美元)告诉 WSJ:他们已经在 Google Cloud 的 TPU(Ironwood 等新一代产品)上运行关键工作负载,结果是:
这个案例的含金量在哪里?在于 Citadel 是量化金融领域对延迟和精度要求最苛刻的机构之一。如果连他们都能在 TPU 上跑出这样的结果,说明 TPU 并不是只适合特定 Google 内部场景的"玩具"。它在真实的高强度生产环境中,已经证明了性价比。
当然,值得注意的是:推理和量化模拟类工作负载,是 TPU 最擅长的场景——它们的计算模式规整、矩阵乘法密集,正好匹配 TPU 的硬件设计。大模型训练仍然高度依赖 Nvidia 的 GPU 生态成熟度。Citadel 的案例是真实的,但不能无限外推。
这场战争会怎么打:三个时间维度的推断
短期(现在—2027):Nvidia 仍然主导,但裂缝在加深
Blackwell/Rubin 系列需求旺盛,Nvidia 全栈销售占比仍在上升。"Jensen jail"不会在一两年内瓦解——CUDA 生态的迁移成本不是钱能解决的,是开发者习惯和代码库积累的问题。
但裂缝正在加深的标志是:越来越多的大型终端客户(Anthropic、Citadel)在公开场合讨论并践行多元化。这会让更多中小 AI 公司获得"跟随大客户走"的心理许可。
中期(2027—2030):推理市场可能是第一个真正分流的战场
训练大模型,Nvidia GPU 的成熟度优势短期难以被超越。但推理阶段的情况不同:推理任务计算模式更规整、对 CUDA 的依赖更低、切换成本更小。
随着 AI 应用从"训练竞赛"转向"推理规模化",TPU 和 Amazon Trainium 等定制 ASIC 的市场份额会首先在推理侧侵蚀 Nvidia。"训练用 Nvidia GPU,推理用专用 ASIC" 可能成为主流架构。
长期(2030+):生态碎片化,工作负载优化成为标配
长期来看,AI 算力市场不会走向"Nvidia 一家通吃",也不会走向"完全碎片化"。更可能的是:头部 AI 公司按工作负载类型,在多套硬件生态之间动态分配计算任务——就像今天企业按业务类型选择不同数据库引擎一样。
在这个未来里,Nvidia 的 CUDA 护城河最难被攻克,但也最需要持续维护;Google TPU 会在特定场景建立真实优势;Blackstone TPU 云和各类定制 ASIC 会在价格竞争维度持续施压。真正输掉的,是那些既没有软件护城河、又没有成本优势的"中间地带"玩家。
傻狗的视角:这场博弈的本质是什么
有一个容易被忽视的细节:Google 对抗 Nvidia 用的武器,是和 Nvidia 完全相同的武器——垂直整合、融资杠杆、生态绑定。Google 没有去颠覆 Nvidia 的商业模式,而是复制它,然后用更雄厚的资产负债表去"卷"它。
这意味着什么?AI 算力市场的本质竞争,已经不只是芯片性能比拼,而是谁能用融资、供给控制和生态建设,在客户侧构建最深的路径依赖。这是一场资本密度极高的战争,普通芯片公司很难参与,门票是"数百亿美元"级别的承诺。
"Jensen jail"是一个结果,不是一个阴谋。Nvidia 没有设计一个"关押"客户的陷阱,而是在为全球 AI 产业提供算力基础设施的过程中,自然形成了这种结构性权力。Google 正在做的,是用同样的路径,给客户提供一个"备用牢笼"——虽然名义上叫"选择"。
最终受益的,是那些足够大、足够聪明、能在两个生态之间打算盘的 AI 公司。最终受损的,是那些太小、没有谈判筹码、只能被动接受条款的中小算力消费方。
Citadel 的 30% 成本优势和 4 倍速度,是一个信号弹。它告诉市场:门已经开了,进不进去是你的选择。