Claude 这 5 个开关,比改 100 句提示词都管用
众人对Claude进行折腾, 所投入的精力差不多都集中在了提示词上面。然而, 对于同样的一句提示词, 即便参数进行了配对, 却依旧采用默认值, 最后的输出质量、所耗用的时间以及消耗的金额, 它们之间的差距能够达到好几倍之多。
最左边和靠着它的那一排控制连通、断开、转换等功能的装置——用于塑造、呈现特定样式的工具、付出的精力、方式、环境窗口——大部分人在安装完成后就再也没有对其进行变动、调整过。这样做简直就是在白白地耗费钱财、毫无意义地白白等待。
它实际上是三件事的操控关键, 这三件事分别是, 用何种程度的脑力, 此为成本, 让其思考多深入, 这是速度, 给予它多大施展空间, 这关乎安全, 拨对方向就能又快又省且不引发问题, 拨错方向则要么造成资源浪费, 要么力不从心, 还会产出一堆未完善的成果。
分成三组来讲并按照”什么时候该动它“来分, 每个参数分别给出: 是用来干嘛的, 会影响什么, 在什么场景下应调哪一档。

先建立这张地图,后面好对号入座:
一、Models:先决定用多强的脑子
这属于影响程度最为显著的, 同时也是最应当主动去进行选择的那一个, 截图当中存在五个选项开云手机入口app下载,真正在正常情形下会被使用的仅仅是前面的三个, 后面的两个Legacy是专门为特殊状况而预留的。
模型
定位
速度
适合的活
Opus 4.8
最强,旗舰
慢、贵
难任务:架构设计、复杂重构、棘手 bug、长链路推理
Sonnet 4.6
均衡主力
日常 80% 的活:写功能、改代码、读文档、常规问答
Haiku 4.5
最快最省
快、便宜
简单批量:格式整理、翻译、改字、跑大量小任务
Opus 4.7 / 4.6 Legacy
旧版旗舰
只在你需要"和上次一模一样的行为"时用
从使用者角度该如何进行选择呢, 不要在初始状态就开启 Opus。我的习惯是这样的, 对于那些难以确定难度高低的情况, 首先使用 Sonnet 去尝试;一旦它出现卡顿现象, 或者一眼看上去就像是难以攻克的难题, 此时再切换到 Opus。而对于纯粹属于体力劳动范畴的任务(比如批量修改文件名、进行翻译、整理 JSON 等), 则直接采用 Haiku, 这样做速度快而且不用担心额度方面的问题。
从业务结果的角度来看, 这三者的成本以及耗时存在多个倍数的差异。能够运用Haiku解决的情况却去使用Opus, 这就如同是用跑车去送外卖;反之, 如果用Haiku去处理复杂的重构, 就会给你一版看起来相似, 但运行起来却到处都是问题的代码, 所需要返工的工作量比节省下来的还要多。
在何种情形下使用 Legacy 呢: 当你的工作流是依据旧版本调出的, 而更换为新版本后结果不稳定时,那就切回到 Opus 4.7 去再次展现旧有的行为。除此之外也就不必再有其他操作改动了。
把Sonnet设为默认, 难的情况选用Opus, 杂的情况采用Haiku, 旧的那些留存给“要复现”。
二、费劲儿: 使它思考到何种深度, 这属于Opus 4.8的全新旋钮。
控制模型回答前方能使用的“思考预算”数量的是Effort(推理强度), 对于同一个模型而言, Effort越高, 那么它在给出答案之前进行推演的时间就会越长、越细致, 质量也就会更加稳定, 然而速度也会变得更慢, 并且会消耗更多的token。其具有五档, 分别是Low / Medium / High / Extra / Max, 默认设置为High。
档位
思考深度
代价
什么时候用
Low
几乎不额外思考
最快最省
简单明确、不用推理的活:改字、查事实、套格式
Medium
适度推理
较省
有几个变量但不烧脑的常规知识工作
High(默认)
深度推理
复杂逻辑、细致分析、难一点的编码——大多数正经任务
Extra
更长的探索
偏贵
高级编码、需要反复试错和检索的 agent 任务
Max
拉满,不设限
最贵最慢
你要的是"能力天花板":最难的推理、最深的分析
这里极易踩到的坑在于世界杯直播平台世界杯直播,好多人会将Effort与Model弄混淆。Model指的是“找哪一级别的人去做”, Effort指的是“留给这个人多长时间去思考”。这两个旋钮相互独立, 需要搭配起来使用。
从业务结果的角度来看, 判断的标准仅仅为一句话, 那就是此工作答错之后进行返工的成本高, 还是再多等待几十秒钟的成本高呢? 要是答错所带来的代价巨大, 像是涉及线上配置以及关键重构等情况, 那么就需要往高的方向调整;而要是仅仅只要草稿, 或者只是需要一个方向, 那么Low/Medium这个级别就足够了。
与之相对照的场景是, 进行写邮件以及整理纪要的工作程度为低, 而对一段逻辑是否应该如此设计展开分析的工作程度为高, 要使其独立自主地排查跨越文件的怪异漏洞, 并且自己反复去试验方案, 后者的工作程度则达到了额外甚至最高级别。
三、Fast mode:要快,但不想降智
Effort菜单的最下方位置, 存在着一个Fast mode开关, 它极易被错误地理解为转向小模型从而变换速度, 然而实际情况并非如此哟。
快模式下依靠Opus输出速度会更快, 且模型不会降级, 这意味着即便是吐字更快, 你所获得的依旧是Opus级别的质量, 它能够通过/fast进行切换, 目前支持Opus 4.8 / 4.7 / 4.6。
在 Opus 上开展交互式活动, 当需要快速来回, 也就是边看边改且连续追问, 同时又不想降到 Sonnet/Haiku 去损害判断力的时候, 就选择开启它, 具体是什么时候开呢。
在什么时候不要开启呢, 就是当把那种会让它面临长时间运行的任务丢给它之时, 或者是在那种需要它付出最大努力, 去攻克难题的情境下, 让它慢慢地思考会更加稳妥一些。
Model去挑选等级, Effort去挑选深度, Fast去选择要不要“同等级里面加速”, 三个旋钮各自管理一段, 不要混淆开来。
四、Mode:它能不打招呼地干多少事(安全边界)
克劳德代码干活时会移动你的文件、运行命令, 模式决定它每一步是否要先询问你。截图中有五个档位, 从“什么都询问”到“什么都不询问”:
操作实施的路线是, 一开始不熟悉的时候, 那就通过Plan mode来得出方案, 当方案是靠谱的, 并且改动是可控的情况下, 那就接受编辑然后放手去改, 要是信任且工作简单的话, 就采用Auto, 而Bypass基本上是不会用到的。
从业务结果的角度来看, 这档配错所带来的代价并非是慢, 而是事故。有一条rm跑错了目录, Ask/Plan在执行之前能够将其拦下, Bypass却直接给你跑完了。在这里节省的并非是时间, 而是出事后进行救火的那几小时。
五、Context window:满了会怎样,怎么处理
会不会出现爆掉的情况? 不会出现报错的状况。在快要抵达顶部的时候, Claude Code会进行自动压缩操作, 也就是把前面的内容拢合成摘要来腾出空间地方, 然后继续接着聊下去。你所感觉到的并非是卡死这种情况, 而是它突然记不清楚前面所讲的内容了。
花费的成本是质量以及速度, 并非能否加以运用: 记性从逐字记忆逐渐退化为摘要形式(忘记开头所提要求), 响应的速度变得迟缓, 并且容易抓错关键要点。
怎么处理:
将其当作工作台面, 堆满之后竟然难以找到工具。与其等着它被动丢失细节, 倒不如在任务切换的节点主动进行/clear。
收尾:一张随手能用的默认配置
把这块面板调成你的默认,大多数时候就顺手了:
这一排的开关, 不存在所谓“最好的一档”, 有的只是“是否配得上此次的工作任务”。要先仔细思考此次任务困难与否、紧急与否、危险与否, 之后再去拨动相应开关——这可比一直采用预设的默认值要好得多。
还木有评论哦,快来抢沙发吧~