傻狗频道
马斯克帝国每日资讯
留言板归档订阅频道
专题文章2026-07-04👁 21,400

AI 越强,瓶颈越是你自己:Anthropic 工程师亲述用顶级模型的正确姿势

Anthropic Claude Code 团队工程师 Thariq 发文一天破 150 万阅读:Fable 5 是第一个让他感到「瓶颈不再是模型,而是我自己」的模型。他把提示词与现实的差距叫「未知数」,给出盲区扫描、反向面试、偏差日志、考试不及格不合并等七个实操招式——Fable 官方发布视频就是用这套方法、由 Claude Code 全程剪辑的。

AI 越强,瓶颈越是你自己:Anthropic 工程师亲述用顶级模型的正确姿势

写在前面:本文改写自 Anthropic Claude Code 团队工程师 Thariq(@trq212)于 2026 年 7 月 3 日发布的长文《A Field Guide to Fable: Finding Your Unknowns》,原文发布一天突破 150 万阅读、1.2 万人收藏。傻狗频道在原文基础上补充了背景、典故与解读。

这篇文章为什么值得读

写这篇文章的人叫 Thariq,是 Anthropic 内部开发 Claude Code 的工程师——全世界最早、最深度使用 Claude Fable 5 的那批人之一。

Fable 5 是 Anthropic 刚发布的 Claude 5 家族的第一个模型,定位在比 Opus 更高一级的「Mythos 级」,是目前公开可用的最强 Claude。

按常理,模型越强,人应该越省心。但这位每天泡在最强模型里的工程师,开篇就抛出一个反直觉的结论:

Fable 是第一个让他感觉到「产出质量的瓶颈不再是模型,而是我自己」的模型。

模型已经强到:它做得好不好,取决于你能不能把自己没说清楚的东西说清楚。换句话说——AI 越强,你越是瓶颈。这个判断适用范围远不止程序员。

地图不是疆域:95 年前的老概念,成了 AI 时代的第一性原理

Thariq 全文的地基,是一句老话:「地图不是疆域」(The map is not the territory)

这句话不是他发明的。1931 年,波兰裔美国学者阿尔弗雷德·柯日布斯基提出了这个概念:人对世界的描述永远不等于世界本身,就像地图画得再好,也不是那片真实的土地。查理·芒格后来把它列入自己的思维模型清单。

Thariq 把它翻译到了 AI 协作场景:

  • **地图** = 你交给 Claude 的东西:提示词、技能文件、上下文,是你对「要做的事」的描述
  • **疆域** = 工作真正发生的地方:代码库、真实世界、各种实际约束
  • 地图与疆域之间的差值,就是你的未知数
    地图与疆域之间的差值,就是你的未知数

    地图和疆域之间的差值,他起了个名字,叫未知数(unknowns)

    AI 干活时一旦撞上未知数——你没说清楚的地方——它就只能猜你想要什么。活儿越大,撞上的未知数越多,猜错的次数也越多。最后你看着结果说「这不是我想要的」,其实很多时候不是 AI 不行,是你给的地图上有大片空白。

    所以核心方法论就一句话:和 AI 协作,本质是一个在实现之前、之中、之后不断发现自己未知数的迭代过程。

    四种未知数:从拉姆斯菲尔德到你的提示词

    Thariq 用一个四象限,把你面对任何问题时的认知状态拆成四种:

    四种未知数
    四种未知数
  • **已知的已知**:你写进提示词里的东西,你明确告诉 AI 你要什么
  • **已知的未知**:你还没想清楚、但你知道自己没想清楚的部分,比如「数据库用哪个我还没定」
  • **未知的已知**:对你太理所当然、根本不会想到要写下来,但一看到不对就立刻能认出来的东西,比如你心里默认「按钮当然要圆角」,但你从没说过
  • **未知的未知**:你压根没考虑过的盲区,你甚至不知道「好」能好到什么程度
  • 一个冷知识:这套说法之所以出名,是因为 2002 年美国国防部长拉姆斯菲尔德在记者会上用它回应伊拉克问题,当时被媒体嘲笑是绕口令,后来反而成了决策科学的经典框架。更早的源头是 1955 年心理学的「乔哈里视窗」。Thariq 等于把一个 70 年前的心理学工具,改装成了 AI 时代的提示词工程指南。

    四象限里最坑人的是「未知的已知」。「已知的未知」你至少会去问,「未知的未知」AI 有时会主动帮你撞出来,唯独你觉得不言自明的东西,会安安静静潜伏到项目做完,在验收那一刻爆炸:「这怎么跟我想的完全不一样?」

    Thariq 还有个观察:Anthropic 内部用 AI 用得最好的人——比如 Claude Code 之父 Boris Cherny、Bun 的作者 Jarred Sumner——共同点不是提示词写得花哨,而是未知数少。他们对代码库和模型行为的理解深到想要什么一清二楚,但即便是他们,也会主动假设自己有盲区。

    用 AI 的核心技能,不是写提示词,而是管理自己的未知数。而这是可以练的。

    指令的两难:说太细会僵化,说太粗会跑偏

  • **说得太具体**:AI 会死死照着你的指令执行,哪怕中途出现明显该转向的信号也不敢转——你把路焊死了
  • **说得太模糊**:AI 会按「行业最佳实践」自作主张,但最佳实践是平均答案,你的任务往往不是平均任务
  • 不管理未知数,你两头都输:路上有坑你不知道;路明明通畅、你希望 AI 绕道时它也不知道。

    发现未知数前后的冰山对比
    发现未知数前后的冰山对比

    好消息是,Claude 本身就是挖掘未知数最快的工具。关键动作只有一个:把你的起点交代清楚——你想到哪一步了、你对问题和项目熟不熟、你希望它当思考伙伴而不是执行机器。

    下面是 Thariq 的完整工具箱,按三个阶段展开,每招附可直接抄的中文提示词。

    三阶段工作流总览
    三阶段工作流总览

    第一阶段:动手前

    招式一:盲区扫描(Blind Spot Pass)

    适用场景:在陌生领域干活,满身「未知的未知」。做法是直接让 Claude 帮你找盲区,Thariq 强调要用「盲区扫描」「未知的未知」这样的原词,并交代自己的背景。

  • 「我要给系统加一个新的登录方式,但我对这个代码库里的认证模块一无所知。帮我做一次盲区扫描,找出我该知道但不知道的东西,并教我怎么更好地向你提需求。」
  • 「我不懂调色,但我需要给这条视频调色。先教会我理解调色领域里我的未知的未知,让我有能力提出像样的要求。」
  • 注意第二条——不是让 AI 直接干活,而是让 AI 先教你,让你变成更好的甲方。这个思路贯穿全文。

    招式二:头脑风暴 + 原型

    适用场景:「我看到才知道要不要」的事,典型如视觉设计——这是在对付「未知的已知」。这类未知数在原型阶段发现很便宜,在实现阶段发现很贵:规格上一个小改动,反映到代码里可能是天翻地覆的重写。

  • 「我想给这批数据做个看板,但我没有视觉品味,也不知道能做到多好。给我做一个 HTML 页面,里面放 4 个风格截然不同的设计方向,我看了挑。」
  • 「先别动真实代码。做一个单独的 HTML 文件,用假数据模拟新工具栏的样子,我先对布局提意见。」
  • 「我的问题很模糊:用户在新手引导之后流失严重。搜一遍代码库,从最省事到最激进,给我列 10 个可以下手的地方,我来挑。」
  • Thariq 几乎每个项目都从头脑风暴开场:Claude 经常提出他想不到的高价值方案,头脑风暴同时防两件事——范围定太窄和定太宽。

    招式三:反向面试

    头脑风暴完还剩一堆没想清楚的地方,这时换个方向——让 AI 面试你

  • 「就所有还模糊的地方,一次一个问题地面试我。优先问那些我的回答会改变整体架构的问题。」
  • 后半句是精髓:按「答案影响多大」排序,架构级歧义先问,细枝末节放后面。

    招式四:给参考物,源码是最好的参考

    有些东西你描述不出来,别硬描述,给参考。图、文档、截图都行,但 Thariq 给了明确排序:最好的参考是源代码。有个库实现了你想要的行为?直接把文件夹指给 Fable,哪怕是另一种编程语言写的都没关系。

  • 「vendor/rate-limiter 这个 Rust 库实现的退避重试逻辑正是我想要的。读懂它,然后在我们的 TypeScript 客户端里实现一样的语义。」
  • 他还顺带透露了 Claude 设计功能的原理:你把一个喜欢的网站模块指给它,它读的不是截图,而是页面底层的代码——这比「照着截图仿一个」的信息量大一个数量级。

    招式五:实现计划,把你最可能改的放最前面

  • 「写一份实现计划,但把我最可能想改的决策放在最前面:数据模型的变化、新的类型接口、一切用户能看到的东西。机械性的重构放到最底下,那部分我信你。」
  • 审计划的时间有限,应该全花在「你的意见会改变结局」的地方。

    第二阶段:动手中

    招式六:偏差日志(implementation-notes.md)

    计划做得再足,未知的未知永远潜伏着。解法不是阻止 AI 偏离计划,而是把偏离记录下来

  • 「维护一个 implementation-notes.md 文件。如果撞上迫使你偏离计划的边缘情况:选保守的那条路,把偏离记在 Deviations 标题下,然后继续干,不用停下来问我。」
  • 这招同时解决两个矛盾的诉求:不打断 AI 的工作流,又不丢失任何决策记录。这些偏差记录,就是你下一轮的「地图更新包」。

    第三阶段:交付后

    招式七:打包成一份能拉到赞成票的文档

    审核你工作的人,起点就是你当初的那些未知数,他们会问的问题恰好是你已经趟过的坑。所以让 Claude 把过程资产打包:

  • 「把原型、规格文档、实现笔记打包成一份文档,我要发到群里争取支持。演示动图放在最上面。」
  • 打包成一份文档,演示放最上面
    打包成一份文档,演示放最上面

    「演示动图放最上面」是社会经验,不是技术:人先被结果说服,才有耐心看过程。

    招式八:考试不及格,代码不合并

    全文最狠的一招。一场长时间的 AI 工作下来,Claude 干的活可能远超你的感知,光看代码差异只能获得表面理解。Thariq 的规矩是:让 Claude 出一份考卷考我,考不到满分,我不合并这次改动。

  • 「我要确保自己完全理解这次改动。给我生成一份 HTML 报告:背景、思路、做了什么,最后附一份关于这次改动的测验,我必须通过才算数。」
  • 这招直击 AI 时代最大的暗坑——「不理解就签收」。代码可以让 AI 写,但理解没法外包。这一条不止适用于代码:AI 帮你写的合同、报告、方案,同理。

    实战:Fable 的发布视频,是 Claude Code 自己剪的

    Claude Fable 5 的官方发布视频,从头到尾是用 Claude Code 剪辑的。操刀的就是 Thariq 本人,而他不是视频专业出身。他是这么一步步管理自己未知数的:

  • **从已知出发**:他知道 Claude 能用代码处理视频和转录,但不确定精度。于是先让 Claude 讲解 Whisper 这类语音转录的原理,评估能不能靠 ffmpeg 精准剪掉「呃」「嗯」和长停顿——这是盲区扫描
  • **用原型验证**:他想做一个和说话逐词同步的动效界面,但不确定可行。于是让 Claude 用 Remotion 加转录文本先做了个原型视频试水——这是头脑风暴加原型
  • **最精彩的一步**:成片发灰、不透亮,他知道这和「调色」有关但完全不懂。第一反应是让 Claude 出几个版本挑一挑——然后他意识到:**他根本不知道调色调到「好」是什么样,挑也是瞎挑**。于是改变策略,先让 Claude 教他调色原理,把「未知的未知」变成「已知的未知」,再回头提需求
  • 第三步就是整篇文章的浓缩:发现自己不知道「好」长什么样的那一刻,先补认知,再提需求。

    最后说两句

    Thariq 的收尾观点:模型越强,正确的方法能兑现的价值就越大。当一个长任务的结果不对时,先别骂 AI——大概率是你该花更多时间定义你的未知数了。

    盲区扫描、头脑风暴、反向面试、参考物、原型、偏差日志、考卷——七招本质上是同一件事:

    趁便宜的时候,把「你不知道自己不知道」的东西挖出来。等到实现完再发现,就贵了。

    这套东西表面是写给程序员的,但把「代码库」换成「你的业务」,把「合并代码」换成「签字确认」,它就是一份通用的 AI 协作手册。AI 时代真正拉开差距的能力,不是谁的提示词华丽,而是谁更诚实地面对自己的无知,并有一套流程把无知系统性地变成已知。

    下次开新项目,第一句话可以这么说:「先别干活,帮我找找我的未知数。」


    原文:A Field Guide to Fable: Finding Your Unknowns(Thariq @trq212,Anthropic Claude Code 团队,2026-07-03)

    本文同步发布于 YouTube,观看完整视频请前往 YouTube @pizypizy
    #AI#Claude#Anthropic#Claude Code#Fable#提示词工程#AI方法论

    📬 邮件订阅

    留下邮箱,马斯克帝国每日资讯更新时通知你

    评论 (0)

    加载中...