Claude这轮更新最实用的变化,是把“看图”“写代码”和“多步骤执行”做得更顺了。对日常使用者来说,Claude不只是回答问题,而是更像能跟着你把任务走完的助手。下面按功能拆开讲清楚,你可以直接照着用。
Claude图像理解升级:看得懂还会“讲重点”
Claude的图像理解更偏向“读图做事”,不是只描述画面。你把截图、表格照片或产品页面丢给Claude,它能先抓出结构(标题、字段、按钮、关键数字),再按你的目标输出整理结果。
实际用法是:先让Claude复述它识别到的关键信息,再让Claude按模板生成内容,比如“把这张收据整理成报销表”“从截图里提取表格并补齐缺失列”。这类任务里,Claude的优势是能把图像信息变成可编辑的文本结构,后续更好接流程。
Claude电脑操作能力:从建议变成“可执行步骤”(API预览)
Anthropic为Claude 3.5 Sonnet提供了“操作电脑”的API方向:Claude能感知电脑界面,并把指令拆成具体动作,例如打开浏览器、导航页面、在表格里输入内容等。它的意义在于把很多“你来点鼠标”的工作,变成Claude可代劳的步骤。
需要强调的是,这项能力目前更偏开发者集成与测试场景,不等于所有人打开Claude就能直接远程操控电脑。并且官方也提到,滚动、拖拽、缩放这类人类很自然的动作,对Claude仍是挑战,所以更适合流程清晰、步骤可验证的自动化任务。
