如果你最近在用 Claude API 做摘要、写代码或生成长文,最直观的变化就是“能输出更长了”,同时开发者控制台也更好用。本文把 Claude API 的几项新功能拆开讲清:如何开启长输出、怎么用工作台做提示词评测,以及如何在仪表板里把费用看明白。
Claude API 长输出:Sonnet 3.5 从 4096 提升到 8192
Claude API 已将 Claude Sonnet 3.5 的最大输出 token 上限提升到 8192,但需要显式开启。调用 Claude API 时在请求头加入 anthropic-beta,即可启用更长的输出窗口,适合一次性生成更完整的报告、长代码文件或多段式总结。
具体写法很明确:请求头加 anthropic-beta: max-tokens-3-5-sonnet-2024-07-15。如果你在 Claude API 里遇到“输出被截断”,优先检查是否忘了这个开关,以及你的 max_tokens 是否设置得足够。
工作台更顺手:提示词生成器与评估模式
在 Claude 控制台工作台里,Claude API 的调试体验补了两个关键工具。第一个是“提示词生成器”:你只要描述任务目标(例如“分类入站客服请求”),它会给出一份结构完整、可直接复制到 Claude API 的提示词草案。
第二个是“评估模式”:把两套或多套提示词并排跑同一批输入,输出结果会放在一起对比,还能用 5 分制给表现打分。对需要稳定产出的 Claude API 场景(客服分流、信息抽取、合规改写)来说,这一步能显著减少拍脑袋调参。
