Titikey
首頁实用技巧ClaudeClaude 计算机使用功能上线:看屏幕点鼠标还能自动打字

Claude 计算机使用功能上线:看屏幕点鼠标还能自动打字

2026/3/10
Claude

Claude 最近把“会对话”进一步推进到“会动手”:新增计算机使用(Computer Use)能力,可在屏幕上识别界面、移动光标、点击按钮并输入文字。本文用更直观的方式解释 Claude 这项新功能能做什么、适合哪些场景,以及使用前需要注意的边界。

Claude 计算机使用是什么:让模型像人一样操作界面

计算机使用是 Claude 面向开发者开放的公开测试能力,你可以用指令让 Claude 按步骤操作网页或软件界面。它的核心不是“插件”,而是让 Claude 通过“看屏幕”理解当前状态,再决定下一步“点哪里、输入什么”。官方也明确强调:该功能仍处实验阶段,偶尔会卡顿、点错或走偏,需要人为兜底。

Claude 3.5 Sonnet 升级点:更强编码与更稳的工具执行

在模型侧,Claude 3.5 Sonnet 的更新版(在部分云平台会以 Claude 3.5 Sonnet V2 命名)重点强化了软件工程与编码表现。对需要写代码、改 bug、读项目结构的用户来说,Claude 更容易按要求输出可用的实现步骤。配合计算机使用能力,Claude 能把“写方案”延伸到“照着界面把流程跑完”,但仍建议先从小任务验证稳定性。

新模型 Claude 3.5 Haiku:更快更省的选择

同一轮更新里,Claude 还带来了 Claude 3.5 Haiku,定位是低延迟与更高性价比。官方说法是:在接近上一代 Haiku 的成本和速度下,Claude 3.5 Haiku 的综合能力显著提升,并且在编码任务上表现突出。对于客服回复、表单处理、子任务代理等对速度敏感的场景,Claude 3.5 Haiku 会更合适。

怎么用与注意事项:API 先行,安全评估同步推进

目前计算机使用能力主要在 API 侧提供,开发者可在 Anthropic API,以及 Amazon Bedrock、Google Cloud Vertex AI 上进行接入与构建。Anthropic 表示这些模型经过安全评估,并与美国、英国的人工智能安全研究机构合作做了部署前测试,同时认为其 ASL-2 安全标准仍适用。实际落地时建议为 Claude 增加权限边界、关键步骤确认与失败重试机制,把风险控制在可预期范围内。