Titikey
首页实用技巧ClaudeClaude 工作台更新:提示词生成器、评估模式与发布说明一篇讲清

Claude 工作台更新:提示词生成器、评估模式与发布说明一篇讲清

2026/2/22
Claude

如果你平时用 Claude 做开发或调参,最近这波更新最值得看的是:工作台把“写提示词”和“比提示词”做成了内置工具,同时 API 侧也开放了更长的输出上限。本文按实际使用顺序,把 Claude 的提示词生成器、评估模式、扩展输出,以及新上线的发布说明该怎么用讲清楚。

Claude Sonnet 3.5 扩展输出:从 4096 到 8192 token

在 Claude API 中,Claude Sonnet 3.5 的最大输出 token 限制已经从 4096 翻倍到 8192。对长文总结、代码生成、或需要“完整给出步骤”的任务来说,Claude 更不容易写到一半被截断。

启用方式也很直接:在请求里加上请求头 anthropic-beta,值为 max-tokens-3-5-sonnet-2024-07-15。然后再按你原本的方式设置 max_tokens 即可,Claude 就会按新的上限策略工作。

工作台提示词生成器:先描述任务,再让 Claude 写提示词

Claude 控制台工作台新增的提示词生成器,思路是“你说需求,Claude 帮你写可复用提示词”。例如你只要描述“分类处理入站客户支持请求”,Claude 会生成结构更完整的指令模板,通常还会补上输出格式和边界条件。

这个功能适合两类人:一是经常要把需求交给同事复用的团队,二是自己做自动化流程但总觉得提示词不稳定的开发者。把 Claude 生成的版本当底稿,再按业务字段微调,会比从零写更省时间。

评估模式:并排对比多个提示词,给 Claude 输出打分

工作台的评估模式支持把两个或多个提示词的输出并排展示,并用 5 分制对 Claude 的结果进行评分。它解决的痛点很现实:同一个任务,改一句话到底有没有变好,以前只能靠“感觉”。

建议你用评估模式时固定输入样本(同一批用户提问、同一段文本),只改一处提示词变量,比如语气、约束条件或输出结构。这样你能更快定位:到底是 Claude 模型能力差异,还是提示词写法导致的波动。

用量和费用仪表盘:按美元、token、API Key 看清账单

在开发者控制台新增的“用量”和“费用”选项卡里,你可以按美元金额、token 数量和 API 密钥跟踪 Claude API 的使用情况。对多环境(测试/生产)或多项目共用账号的团队,这相当于把“谁在烧钱”直接可视化了。

如果你在做 A/B 提示词实验,建议同时看 token 与费用的变化:有些提示词会让 Claude 输出变长,效果提升不明显却显著增加成本,用仪表盘很容易一眼发现。

发布说明与新文档资源:更新频繁时更不容易踩坑

Claude 文档里新增了更全面的发布说明,覆盖 API、Claude 控制台与 Claude 应用的更新点。对接入生产系统的人来说,这比“到处翻公告”更稳:你能明确知道变更发生在哪、会不会影响现有调用。

同时,Anthropic 还更新了文档与教育课程(如 Claude API 基础、Claude 工具使用),并扩展了 Claude Cookbook 的核心技能指南(引用、检索增强生成、分类)。如果你要把 Claude 接进工具链或要求结构化 JSON 输出,这些资料能显著减少试错。