Claude 工作台更新：提示词生成器、评估模式与发布说明一篇讲清

如果你平时用 Claude 做开发或调参，最近这波更新最值得看的是：工作台把“写提示词”和“比提示词”做成了内置工具，同时 API 侧也开放了更长的输出上限。本文按实际使用顺序，把 Claude 的提示词生成器、评估模式、扩展输出，以及新上线的发布说明该怎么用讲清楚。

Claude Sonnet 3.5 扩展输出：从 4096 到 8192 token

在 Claude API 中，Claude Sonnet 3.5 的最大输出 token 限制已经从 4096 翻倍到 8192。对长文总结、代码生成、或需要“完整给出步骤”的任务来说，Claude 更不容易写到一半被截断。

启用方式也很直接：在请求里加上请求头 anthropic-beta，值为 max-tokens-3-5-sonnet-2024-07-15。然后再按你原本的方式设置 max_tokens 即可，Claude 就会按新的上限策略工作。

Claude 控制台工作台新增的提示词生成器，思路是“你说需求，Claude 帮你写可复用提示词”。例如你只要描述“分类处理入站客户支持请求”，Claude 会生成结构更完整的指令模板，通常还会补上输出格式和边界条件。

这个功能适合两类人：一是经常要把需求交给同事复用的团队，二是自己做自动化流程但总觉得提示词不稳定的开发者。把 Claude 生成的版本当底稿，再按业务字段微调，会比从零写更省时间。

工作台的评估模式支持把两个或多个提示词的输出并排展示，并用 5 分制对 Claude 的结果进行评分。它解决的痛点很现实：同一个任务，改一句话到底有没有变好，以前只能靠“感觉”。

建议你用评估模式时固定输入样本（同一批用户提问、同一段文本），只改一处提示词变量，比如语气、约束条件或输出结构。这样你能更快定位：到底是 Claude 模型能力差异，还是提示词写法导致的波动。

在开发者控制台新增的“用量”和“费用”选项卡里，你可以按美元金额、token 数量和 API 密钥跟踪 Claude API 的使用情况。对多环境（测试/生产）或多项目共用账号的团队，这相当于把“谁在烧钱”直接可视化了。

如果你在做 A/B 提示词实验，建议同时看 token 与费用的变化：有些提示词会让 Claude 输出变长，效果提升不明显却显著增加成本，用仪表盘很容易一眼发现。

Claude 文档里新增了更全面的发布说明，覆盖 API、Claude 控制台与 Claude 应用的更新点。对接入生产系统的人来说，这比“到处翻公告”更稳：你能明确知道变更发生在哪、会不会影响现有调用。

同时，Anthropic 还更新了文档与教育课程（如 Claude API 基础、Claude 工具使用），并扩展了 Claude Cookbook 的核心技能指南（引用、检索增强生成、分类）。如果你要把 Claude 接进工具链或要求结构化 JSON 输出，这些资料能显著减少试错。