j9九游会真人真实回转了传统的「大模子排除名务、小模子搬砖」景色-九游娱乐(中国)有限公司-官方网站

发布日期：2026-04-16 07:09 点击次数：92

裁剪：桃子好困

【新智元导读】Anthropic夜深发布Claude「参谋人战略」，让Opus 4.6退居幕后当智囊，Sonnet/Haiku当苦力。实测性能翻倍，资本暴降85%，全网直呼：这等于咱们要的「龙虾」完全体！

夜深，Anthropic官宣重磅更新：Claude「参谋人战略」（Advisor Strategy）上线。

这一架构的中枢逻辑是——

让本领最高的Opus 4.6退居幕后当「参谋人」；

让性价比极高的Sonnet 4.6或Haiku 4.5冲在前边当「实行者」。

好像来说，Opus作念「大脑」，Sonnet/Haiku作念「作为」。

在全新的使命流中，中枢是由Sonnet/Haiku，全权进展跑通所有这个词过程。

当遭遇真实难办的坚苦、无法作念出合理决策时，才领会过API调用Opus「参谋人」来指破迷团。

随后，Opus会赶紧审阅高下文，给出一个锦囊妙计、修正决议，然后由实行者不绝完成剩下的「苦差使」。

这一战略的提议，真实回转了传统的「大模子排除名务、小模子搬砖」景色。

扫尾，实测数据极其颠簸。

在SWE-bench编程测试中，「Sonnet 4.6+Opus 4.6」得分普及2.7个百分点，而资本暴降11.9%！

更离谱的是，「Haiku4.5+Opus 4.6」性能奏凯翻倍，资本（$1.07）惟一Sonnet（$7）的一小部分。

用网友的话来说，「享受Opus的性能，却无需支付Opus的钱」。

还有东谈主全网驱驰相告，Claude「龙虾」超进化了，一个更好的OpenClaw版块出身。

不错说，这不仅仅一次API更新，更是一场透顶的后果改变。

Claude有了「参谋人」

最强Opus 4.6幕后指路

一直以来，开导者在构建AI Agent的过程中，频频靠近一个两难取舍：

用顶级模子虽聪惠，但价钱腾贵；

用轻量模子虽低廉，但处理复杂任务时容易「掉链子」。

传统景色的作念法是，让性能最强的LLM镇守中央当「编排者」，把大任务拆解成几许子任务，再分发给更小、更快的模子去实行。

这就好比一个形势司理（大模子）在开会，给下面的组员（小模子）分发不同的工单。

它的局限在于，不管任务好像如故复杂，顶级模子齐必须率先介入拆解。每一条恳求的开首，齐要烧掉最贵的Token。

Anthropic此次玩了个「反直观」的战术，透顶回转了「大管小」的逻辑。

「参谋人战略」选拔了一种愈加活泼的朝上牵记机制：

实行者：由Sonnet 4.6或Haiku 4.5担任，进展端到端的任求实行、调用器具、读取扫尾并抓续迭代；

参谋人：由顶级模子Opus 4.6担任，躲避在幕后，并不奏凯与东谈主对话，也不调用器具。

惟一当「实行者」遭遇无法寂寞决策的坚苦时，它才会主动向「参谋人」求教。

Opus会读取分享的高下文，给出算计、改造决议或住手信号，随后「实行者」再带着这些「救急巧计」不绝使命。

这种战略，将前沿级的推理才气精确地用在了「刀刃」上。

在SWE-bench测试中，「Sonnet+Opus参谋人」普及了2.7个百分点，还将单次Agent任务的资本压缩了11.9%。

在智能体基准测试中：

智能体搜索任务（BrowseComp），性能涨2.3%，资本6.13好意思元。

末端编码任务（Terminal-Bench 2.0），性能涨3.8%，资本0.88好意思元。

关于预算更敏锐的场景，「Haiku 4.5+Opus 4.6参谋人」的组合证实更是令东谈主惊艳。

在BrowseComp测试中，其得分从19.7%飙升至41.2%，性能翻倍。

天然这比Sonnet单独运转的得分低29%，但其资本却缩短了85%，是处理高并发任务的极佳决议。

在Terminal-Bench 2.0中，性能暴涨13.3%，资本也缩短了0.2好意思元。

关于那些既需要一定智能水平、又需要适度资本的大边界批量任务来说，Haiku绝对是个绝佳的取舍。

官博中，Anthropic说的特别直白——

这能让AI Agent领有接Opus级别的智能，同期让token支出保抓在接近Sonnet的水平。

不得不说，几乎太香了！

一瞥代码，即可调用

那么，究竟何如上手？

当今，Claude平台上已上线了「测试版」。

只需在API调用中改写「一瞥代码」，便能用上「参谋人战略」，具体来说：

在Messages API恳求中声明advisor_20260301，模子的派遣就会在单次/v1/messages恳求的里面静默完成——不需要荒芜去回传数据或治理高下文。

「实行者」模子会我方决定什么时刻摇东谈主。

当它发起调用时，会把整理好的高下文路由给「参谋人」模子，拿到算计后复返，「实行者」接着干活，所有操作齐在并吞个恳求里一气呵成。

response = client.messages.create(model="claude-sonnet-4-6", # 实行者tools=[{"type": "advisor_20260301","name": "advisor","model": "claude-opus-4-6","max_uses": 3,},# ... 你的其他器具],messages=[...])# 参谋人挥霍的Token会在用量（usage）中单独列出。

那么，token挥霍的这笔账何如算？

「参谋人」挥霍的Token按Opus订价，实行者挥霍的Token按Sonnet或Haiku订价。

要津在于，参谋人每次出手只生成一份轻便的算计，频繁在400到700个Token傍边。

而真实的大头输出，全部由实行者以更低的费率包揽。

举座算下来，资本远低于重新到尾只用Opus。