Titikey
首页实用技巧ClaudeClaude API工作台新功能介绍:扩展输出、评估模式与用量仪表板

Claude API工作台新功能介绍:扩展输出、评估模式与用量仪表板

2026/2/16
Claude

最近 Claude 面向开发者的更新更偏“实用型”:不只模型能力提升,还把日常调试、对比提示词、看账单这些刚需补齐了。本文把 Claude API 与 Claude 控制台工作台里值得立刻用起来的新功能,按使用场景拆开讲清楚。

Claude Sonnet 3.5 扩展输出:长文更好写也更好控

Claude API 里,Claude Sonnet 3.5 的最大输出 token 已从 4096 提升到 8192,适合长报告、代码生成、会议纪要等“一次性写完”的任务。要启用扩展输出,需要在请求中加入指定的 beta 请求头。

官方给出的写法是添加:"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"。建议同时把 max_tokens 设得更贴近你需要的长度,避免 Claude 因为可输出更长而带来不必要的成本。

工作台提示词生成器:把“需求描述”变成可复用提示词

Claude 控制台工作台新增提示词生成器,你只要用自然语言描述任务(比如“分类处理入站客户支持请求”),Claude 会给出更完整的提示词草案。对于要做规范化输出、批量处理的团队,这一步能明显减少反复试错。

实际用法上,建议你把输入补齐三件事:目标、输出格式、边界条件。这样 Claude 生成的提示词更容易直接落地,而不是“看起来很专业但不好执行”。

评估模式:并排对比提示词,少靠直觉多靠结果

工作台的评估模式支持把两个或多个提示词的输出并排展示,并用 5 分制对 Claude 的输出做评分。它特别适合做提示词 A/B 测试:同一批样本输入下,看哪套提示词更稳定、更符合格式要求。

如果你在做分类、抽取、总结等可量化任务,建议先用评估模式固定一套“样本题库”。之后每次微调提示词,都能快速判断是否真的变好,而不是只凭某一次对话的观感。

用量与费用仪表板:按美元、token、API Key 追踪更直观

Claude 开发者控制台新增“用量”和“费用”选项卡,可按美元金额、token 数量与 API 密钥维度查看消耗。对多环境(测试/生产)或多项目共用 Claude API 的场景,这个视图能更快定位“到底是谁把 token 用爆了”。

更实用的做法是把 API Key 按项目拆分,并用仪表板定期回看峰值时间段。这样你在优化提示词或缩短输出长度时,能用数据直接验证节省效果。

发布说明与学习资源:把 Claude 的变化“可追踪、可学习”

Claude 文档新增更全面的发布说明,覆盖 API、Claude 控制台和 Claude 应用的更新记录,方便你排查“同样的请求为什么结果变了”。同时,官方还上线了教育课程(如 Claude API 基础、Claude 工具使用)并扩展 Claude Cookbook,补齐引用、检索增强生成与分类等常用能力的实践材料。

如果你希望把 Claude 做成稳定的生产工具链,这些资源的价值在于:减少口口相传的“经验参数”,让团队对 Claude 的能力边界和最佳实践有统一标准。