

裁剪:桃子 好困
【新智元导读】Anthropic夜深发布Claude「参谋人战略」,让Opus 4.6退居幕后当智囊,Sonnet/Haiku当苦力。实测性能翻倍,资本暴降85%,全网直呼:这等于咱们要的「龙虾」完全体!
夜深,Anthropic官宣重磅更新:Claude「参谋人战略」(Advisor Strategy)上线。
这一架构的中枢逻辑是——
让本领最高的Opus 4.6退居幕后当「参谋人」;
让性价比极高的Sonnet 4.6或Haiku 4.5冲在前边当「实行者」。

好像来说,Opus作念「大脑」,Sonnet/Haiku作念「作为」。
在全新的使命流中,中枢是由Sonnet/Haiku,全权进展跑通所有这个词过程。

当遭遇真实难办的坚苦、无法作念出合理决策时,才领会过API调用Opus「参谋人」来指破迷团。
随后,Opus会赶紧审阅高下文,给出一个锦囊妙计、修正决议,然后由实行者不绝完成剩下的「苦差使」。
这一战略的提议,真实回转了传统的「大模子排除名务、小模子搬砖」景色。

扫尾,实测数据极其颠簸。
在SWE-bench编程测试中,「Sonnet 4.6+Opus 4.6」得分普及2.7个百分点,而资本暴降11.9%!
更离谱的是,「Haiku4.5+Opus 4.6」性能奏凯翻倍,资本($1.07)惟一Sonnet($7)的一小部分。
用网友的话来说,「享受Opus的性能,却无需支付Opus的钱」。



还有东谈主全网驱驰相告,Claude「龙虾」超进化了,一个更好的OpenClaw版块出身。


不错说,这不仅仅一次API更新,更是一场透顶的后果改变。
Claude有了「参谋人」
最强Opus 4.6幕后指路
一直以来,开导者在构建AI Agent的过程中,频频靠近一个两难取舍:
用顶级模子虽聪惠,但价钱腾贵;
用轻量模子虽低廉,但处理复杂任务时容易「掉链子」。
传统景色的作念法是,让性能最强的LLM镇守中央当「编排者」,把大任务拆解成几许子任务,再分发给更小、更快的模子去实行。

这就好比一个形势司理(大模子)在开会,给下面的组员(小模子)分发不同的工单。
它的局限在于,不管任务好像如故复杂,顶级模子齐必须率先介入拆解。每一条恳求的开首,齐要烧掉最贵的Token。
Anthropic此次玩了个「反直观」的战术,透顶回转了「大管小」的逻辑。

「参谋人战略」选拔了一种愈加活泼的朝上牵记机制:
实行者: 由Sonnet 4.6或Haiku 4.5担任,进展端到端的任求实行、调用器具、读取扫尾并抓续迭代;
参谋人: 由顶级模子Opus 4.6担任,躲避在幕后,并不奏凯与东谈主对话,也不调用器具。
惟一当「实行者」遭遇无法寂寞决策的坚苦时,它才会主动向「参谋人」求教。
Opus会读取分享的高下文,给出算计、改造决议或住手信号,随后「实行者」再带着这些「救急巧计」不绝使命。

这种战略,将前沿级的推理才气精确地用在了「刀刃」上。
在SWE-bench测试中,「Sonnet+Opus参谋人」普及了2.7个百分点,还将单次Agent任务的资本压缩了11.9%。

在智能体基准测试中:
智能体搜索任务(BrowseComp),性能涨2.3%,资本6.13好意思元。
末端编码任务(Terminal-Bench 2.0),性能涨3.8%,资本0.88好意思元。

关于预算更敏锐的场景,「Haiku 4.5+Opus 4.6参谋人」的组合证实更是令东谈主惊艳。
在BrowseComp测试中,其得分从19.7%飙升至41.2%,性能翻倍。
天然这比Sonnet单独运转的得分低29%,但其资本却缩短了85%,是处理高并发任务的极佳决议。
在Terminal-Bench 2.0中,性能暴涨13.3%,资本也缩短了0.2好意思元。

关于那些既需要一定智能水平、又需要适度资本的大边界批量任务来说,Haiku绝对是个绝佳的取舍。
官博中,Anthropic说的特别直白——
这能让AI Agent领有接Opus级别的智能,同期让token支出保抓在接近Sonnet的水平。
不得不说,几乎太香了!

一瞥代码,即可调用
那么,究竟何如上手?

当今,Claude平台上已上线了「测试版」。
只需在API调用中改写「一瞥代码」,便能用上「参谋人战略」,具体来说:
在Messages API恳求中声明advisor_20260301,模子的派遣就会在单次/v1/messages恳求的里面静默完成——不需要荒芜去回传数据或治理高下文。
「实行者」模子会我方决定什么时刻摇东谈主。
当它发起调用时,会把整理好的高下文路由给「参谋人」模子,拿到算计后复返,「实行者」接着干活,所有操作齐在并吞个恳求里一气呵成。
response = client.messages.create(model="claude-sonnet-4-6", # 实行者tools=[{"type": "advisor_20260301","name": "advisor","model": "claude-opus-4-6","max_uses": 3,},# ... 你的其他器具],messages=[...])# 参谋人挥霍的Token会在用量(usage)中单独列出。
那么,token挥霍的这笔账何如算?
「参谋人」挥霍的Token按Opus订价,实行者挥霍的Token按Sonnet或Haiku订价。
要津在于,参谋人每次出手只生成一份轻便的算计,频繁在400到700个Token傍边。
而真实的大头输出,全部由实行者以更低的费率包揽。
举座算下来,资本远低于重新到尾只用Opus。

牵记参谋人被「薅」太屡次?Anthropic也念念到了。
开导者不错通过成立max_uses,达成单次恳求中参谋人的最大调用次数。
同期,参谋人的Token挥霍会在用量信息中单独列出,通俗跟踪每一层模子的支出。
何况,advisor器具跟你现存的器具栈完全兼容。
它等于Messages API恳求里的一个世俗条件,莫得任何特殊架构要求。

你的Agent不错在并吞个轮回里,一边搜索网页、实行代码,一边向Opus求教。
该搬砖搬砖,该问策问策,互不侵略。
一些用上「参谋人战略」的大客户绝对被转眼惊艳了,EVE机器学习工程师直言——
用上Haiku 4.5+Opus 4.6,资本缩短了1/5,还用上了接近Opus级别的智能。

Agent无须一直转了
后台剧本守着就行
同在今天,Anthropic为Claude带来了名为——Monitor的分量级器具更新。
这一功能,奏凯让Claude创建并运转「后台剧本」。

夙昔,让Agent监控某个任务(比如等CI跑完、等PR审批),它必须胁制轮回究诘,每问一次就烧一轮Token。
Monitor让Claude我方写一段后台监控代码。法式报错了,叫醒。代码合规检查通过了,叫醒。
从「主动轮询」酿成「事件驱动」。

有了Monitor,Claude不错作念到两件事。
抓续盯着系统日记中的造作,有问题了才叫Agent过来处理。
自动跟踪GitHub上的PR景色,剧本在后台轮询,Agent自己不挥霍Token。
具体用的时刻,需在教导词中明确要求,如Anthropic络续员给出的例子所示。

和Advisor Strategy的逻辑一脉相传,齐是在Agent运转中找到「不需要烧钱的本领」,然后把它剥离出去。
一个省模子调用的钱,一个省空转轮回的钱。
但参谋人战略和Monitor不是孤独的两招。
再加上此前刚发布的Managed Agents,Agent的运维和基建全由Anthropic包办,0.08好意思元一小时。
这几步棋放在沿路看,所在就明昭彰。
Anthropic不再仅仅一家卖模子API的公司。它在搭一整套Agent运转时平台,从模子治愈到任求实行到云霄托管,全栈通吃。
你不需要我方养Agent了
Advisor Strategy和Monitor优化的是Agent的「跑法」,Managed Agents搞定的是更根底的问题,谁来管基建。
0.08好意思元一个session小时,沙箱隔绝、断线自动复原、会话可自主跑数小时,Anthropic全包了。
Managed Agents管运转,MCP Connectors管器具接入。
Anthropic的Connectors Directory遮掩Asana、Notion、Sentry等器具,法式OAuth一键接入。
另一边,4月4日封杀了OpenClaw通过Claude订阅额度调API的通谈,用户要么换后端,要么按量付费,资本翻倍。
推自家生态,切竞品供给,一套组合拳。
HN上有东谈主回来,「中枢不是封杀谁,是闪开导者风尚在Anthropic的平台上跑Agent。」

从卖模子到卖运转时
Advisor Strategy管治愈,Monitor管后果,Managed Agents管基建,MCP Connectors管生态。四层叠起来,一个完好的Agent平台。
Anthropic不是在卖聊天机器东谈主,是在卖「你只管说要作念什么,剩下的我来」。
何况贪念可能不啻于软件。据Reuters本周报谈,Anthropic正在探索自研AI芯片,当今仍处于早期阶段。
提拔这个贪念的数字,年化营收壅塞300亿好意思元,旧年底如故90亿。企业级AI收入对OpenAI的份额一经追悼50:50。
这盘棋能不成赢,取决于开导者愿不肯意把Agent逻辑交给Anthropic的平台。
Sentry、Notion、Rakuten一经投了票。
彩蛋
Claude到底有多大?这是AI圈最念念拆解的黑盒。
马斯克在对比自家Grok 4.2与Claude时,彷徨未定地显露了一个数字——
Claude Sonnet参数目约为1T,Opus高达5T。
对此,有大佬算计,Claude Mythos体量至少是10T,致使更大级别。


