执行摘要
Cerebras Systems($CBRS,IPO价$185)是当前AI推理赛道最具争议性的标的之一。它的争议不来自技术——技术是真实的——而来自围绕它形成的利益结构:OpenAI CEO奥特曼个人持有89,373股Cerebras,市值超3000万美元;OpenAI与Cerebras签有200亿美元的多年算力采购合同;GPT-5.6 Sol刚刚宣布在Cerebras上以750 tokens/秒部署上线。
这三件事同时为真,且互相强化。
理解$CBRS,必须同时理解技术、市场、利益结构三个维度。任何一个单独拿出来,都是片面的。
一、技术层:为什么Cerebras在推理上能打赢NVIDIA
架构根本差异
NVIDIA的GPU为训练设计。训练的计算特征是:大批量数据、高度并行、连续运算。A100/H100的架构哲学是"堆计算核心、配高带宽内存(HBM)",每个计算核心需要时,从HBM里把权重数据搬进来。
这个"搬运"动作,在训练时可以被大批量掩盖。但在推理时,它是致命的瓶颈。
推理是"单次激活":每次请求触发,都要把模型权重从HBM搬进计算核心,处理完,再搬出去。这个HBM到计算核心之间的带宽上限,决定了推理速度的天花板。NVIDIA H100的推理速度上限大约是50-100 tokens/秒,不是因为算力不够,是因为搬运太慢。
Cerebras的WSE-3(Wafer Scale Engine第三代)做了一件在半导体史上从未有人做到的事:把整块12英寸晶圆做成一颗芯片,不切割,不拼接。
WSE-3核心规格:
这不是优化,是架构层面的消除瓶颈。
|---|---|---|
Cerebras比NVIDIA快约7-15倍。但这里有一个必须交代的事实:Groq也在同一速度区间。Groq的LPU架构同样通过片上SRAM消除HBM瓶颈,在Llama 70B模型上达到500-700 tokens/秒。
Cerebras在推理速度这个维度上,不是唯一选择,是双寡头之一。Groq目前仍是私有公司,一旦IPO,两家将被市场直接对比定价——这是$CBRS估值最大的中期风险之一。
二、市场层:为什么推理速度在2026年突然成为命门
AI产品形态的根本转变
2023-2024年的AI,本质上是"问答机":用户提问,模型回答,单次往返。这个场景下,50 tokens/秒够了——人类阅读速度只有4 tokens/秒,模型比人快十倍已经没有意义。
2025-2026年,主流AI产品形态转向Agent:一个AI系统同时执行多个子任务,每个子任务需要独立推理,结果互相依赖,形成推理链。
一个企业法律Agent处理一份合同:识别关键条款→比对监管要求→标注风险点→生成修改建议→校验法律依据。这5个步骤,每步都是一次独立推理调用。在50 tokens/秒的环境下,这5步需要等待。在750 tokens/秒的环境下,几乎是实时的。
这不是"体验升级",是"能做的事情完全不同"的分野。
AI经济体量的数据印证了这个转变的速度:
头部用户是推理速度的直接受益者,也是Cerebras和Groq的核心客户群。
三、OpenAI关系层:200亿美元的合同背后
GPT-5.6 Sol的技术选择
OpenAI选择在Cerebras上部署GPT-5.6 Sol,而非在自己庞大的NVIDIA集群上,原因只有一个:NVIDIA集群跑不出750 tokens/秒。OpenAI的Agent产品线——Operator、Deep Research、各类自动化工作流——需要实时推理能力。这不是NVIDIA基础设施能在短期内用软件优化解决的问题,这是架构约束。
一个细节不能忽视: "Access will initially be limited to select customers as we expand capacity."
Cerebras的产能是硬约束。晶圆级芯片的制造良率远低于普通芯片——整块晶圆上出现任何一个缺陷,整颗"芯片"就报废。这个制造特性决定了Cerebras无法像NVIDIA那样快速扩产。OpenAI这次合作,初期规模是数百家企业客户试用,不是替代OpenAI核心NVIDIA基础设施。
200亿美元合同的真实含义
2026年初签署的200亿美元多年算力采购协议,是Cerebras的护城河,也是股价的地基。但需要理解这个数字的结构:
四、利益结构层:奥特曼的89,373股
这是分析$CBRS不能绕过的核心信息,也是最容易被误读的信息。
事实还原
马斯克诉OpenAI案的法庭文件披露:奥特曼在近十年前以早期投资者身份买入Cerebras,持有89,373股。
|---|---|---|
这不只是Cerebras一例。奥特曼个人投资超过400家公司,至少十家与OpenAI存在业务关联——这是一个系统,不是巧合:
投机者的正确读法
传统治理框架把利益冲突视为风险。但在这个具体语境里,逻辑需要倒转:
奥特曼的个人财富和Cerebras股价是捆绑的。他同时控制OpenAI的战略方向和采购决策。在没有强制切割这两个身份的外部力量之前,他的个人持仓,就是OpenAI采购偏好的前瞻性指标。
这不是道德判断,这是对激励结构的冷静读取。
五、核心风险:三个必须盯住的变量
风险一:G42营收集中度(最重要)
Cerebras IPO招股书披露,阿联酋G42集团(背后为穆巴达拉主权财富基金)占Cerebras总营收的83-87%。这个集中度在IPO时几乎让上市流产——SEC和监管机构对向中东政府关联实体大规模出口AI芯片有明确的审查框架。
OpenAI合作的最大战略价值之一,正是帮助Cerebras稀释G42集中度,从而解锁政府合同资质。但稀释不是消除——G42风险仍然存在,只是被$200亿的OpenAI合同在叙事上压住了。
风险二:Groq的竞争
Groq的LPU在Llama 70B模型上已达500-700 tokens/秒,和Cerebras WSE-3在同一量级。两者路线不同,但用户体感速度相似。Groq目前是私有公司,估值尚未被公开市场检验。一旦Groq IPO:推理速度溢价被分流,Cerebras的"纯推理速度赛道唯一上市标的"叙事消失,这是$CBRS估值最脆弱的部分。
风险三:OpenAI自身IPO(最关键的时间变量)
OpenAI上市前,承销商和监管机构会要求CEO的个人持仓冲突被充分处置。奥特曼届时面临两个选项:获得董事会独立批准并全面披露(可能维持持仓),或被要求减持。
如果减持发生: 89,373股抛售 + "OpenAI CEO减持Cerebras"的头条 = 双重利空。这不是低概率情景,这是OpenAI IPO推进过程中必然触发的审查节点。
|---|---|
六、估值框架:和谁比才有意义
Serenity把Cerebras和$JBL(Jabil)做估值比较——"同样市值,Jabil是盈利公司"。这个方向对,但参照系选错了。Jabil是电子制造代工,商业模式完全不同。
有意义的比较对象:
|---|---|---|---|
Cerebras的估值当前包含三层溢价:
一旦Groq上市,第三层溢价将被重新定价。
七、投机结论
$170以下买入的逻辑——按重要性排序
第一,奥特曼的激励结构。 他持有价值3000万美元的个人持仓,且与OpenAI的采购决策高度相关。在没有外力强制切割之前,这是比任何analyst推荐都更可靠的看涨信号——因为它不依赖于分析师的判断,它依赖于人性最基本的运作方式。
第二,$200亿合同提供收入能见度。 不是刚性保证,但是真实的基本面锚点,比纯粹叙事驱动的标的更稳。
第三,IPO价$185是心理支撑位。 机构投资者在IPO价附近通常有维稳意愿。$170进场有安全垫。
必须设置的止损逻辑——任何一条触发即重新评估:
一句话总结
$CBRS本质上不是一个"押注推理芯片技术"的交易,而是一个"押注奥特曼的个人财务利益会在OpenAI自身IPO之前,持续推动OpenAI-Cerebras关系深化"的交易。这个逻辑在人性上极其成立,在监管上有明确的时间限制,在技术上有真实的基础面支撑,在竞争上有Groq这个正在逼近的变量。在止损条件没有触发之前,$170是合理的投机进场点。
*数据来源:Cerebras IPO招股书、马斯克诉OpenAI案法庭文件、众议院监督委员会函件、State of AI Economy 2026、Ramp AI Index。本文不构成投资建议。*