Недавно Claude продвинулся от «умеет разговаривать» к «умеет действовать»: добавлена возможность использования компьютера (Computer Use) — он может распознавать интерфейс на экране, перемещать курсор, нажимать кнопки и вводить текст. В этой статье более наглядно объясняется, что умеет эта новая функция Claude, для каких сценариев она подходит и какие ограничения важно учитывать перед использованием.
Что такое использование компьютера в Claude: заставить модель управлять интерфейсом как человек
Использование компьютера — это доступная разработчикам функция публичного тестирования: вы можете с помощью инструкций заставлять Claude пошагово работать с веб‑страницей или интерфейсом программы. Её суть не в «плагинах», а в том, что Claude «смотрит на экран», понимает текущее состояние и затем решает, куда нажать и что ввести. Официально также подчёркивают: функция всё ещё экспериментальная, иногда может подвисать, кликать не туда или уходить в сторону, поэтому нужен человеческий контроль.
Обновления Claude 3.5 Sonnet: более сильное программирование и более стабильное выполнение инструментов
На стороне модели обновлённая версия Claude 3.5 Sonnet (на некоторых облачных платформах может называться Claude 3.5 Sonnet V2) в первую очередь усилила результаты в software engineering и программировании. Для пользователей, которым нужно писать код, исправлять баги и разбираться в структуре проекта, Claude с большей вероятностью будет выдавать пригодные к применению шаги реализации. В сочетании с возможностью использования компьютера Claude может расширить «написать план» до «пройти процесс в интерфейсе по шагам», однако всё же рекомендуется сначала проверять стабильность на небольших задачах.

