Titikey
首頁实用技巧ClaudeClaude 3.5 电脑使用功能详解:开发者如何让它看屏幕点鼠标

Claude 3.5 电脑使用功能详解:开发者如何让它看屏幕点鼠标

2026/3/11
Claude

Claude 3.5 这次更新最“出圈”的,不是更会聊天,而是开始学会“用电脑”。升级版 Claude 3.5 Sonnet 强化了编码能力,同时还带来公开测试版的电脑使用功能:能看屏幕、移动光标、点击按钮并输入文字。对做自动化和智能助手的人来说,这是一条很实用的新路。

Claude 3.5 模型升级:Sonnet 更强,Haiku 更快

Anthropic 同步发布了升级版 Claude 3.5 Sonnet,以及新的 Claude 3.5 Haiku。官方强调,Claude 3.5 Sonnet 的改进是“全面的”,尤其在软件工程与编码任务上更突出。

如果你更在意速度和成本,Claude 3.5 Haiku 主打低延迟与更强的指令遵循能力,定位是面向用户产品与子代理任务。简单理解:Claude 3.5 Sonnet 偏重“能力上限”,Claude 3.5 Haiku 偏重“响应速度与性价比”。

电脑使用功能是什么:让 Claude 3.5 像人一样操作界面

电脑使用(computer use)是 Claude 3.5 的公开测试版能力,目前主要面向 API 场景。它的核心不是调用某个固定工具接口,而是让模型通过“看屏幕”的方式理解当前界面,再执行移动光标、点击与键盘输入等操作。

需要注意的是,Claude 3.5 的电脑使用仍处于实验阶段,官方也直说会“有点麻烦、容易出错”。因此更适合做可回滚、可校验的流程,而不是一次性不可逆的关键操作。

Claude 3.5 能把哪些流程自动跑起来

当任务需要几十步甚至上百步的 UI 操作时,Claude 3.5 的电脑使用就有价值:例如在网页后台逐项配置、在企业工具里跨页面填表、或在多步骤工单系统里完成查询与录入。它的优势在于“能跟着界面走”,不用你为每个页面单独写脚本。

不少团队已经在探索类似能力,把 Claude 3.5 用在更长链路的工作流里。实际落地时,建议把关键节点做成“确认点”,让 Claude 3.5 每完成一段就输出截图/状态摘要,便于人工或程序校验。

上线渠道与安全信息:别忽略部署前评估

Claude 3.5 Sonnet 的升级版已面向用户可用,而电脑使用功能已在 API 提供公开测试,并可在 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 上构建。你在 AWS 侧可能会看到它以 Claude 3.5 Sonnet V2 的名字出现。

安全层面,官方披露与美国、英国的 AI 安全研究机构合作做了部署前测试,并认为其 ASL-2 标准仍适用。对开发者来说,更现实的建议是:给 Claude 3.5 的电脑使用加权限边界、操作日志与失败兜底,先把“能控、可查、可停”做扎实。