Claude недавно сделал большой шаг вперёд от простого «умения разговаривать»: добавил публичную бета-версию возможности «использования компьютера». Проще говоря, вы можете поручить Claude смотреть на экран, двигать курсор, нажимать кнопки и вводить текст — выполнять задачи так же, как это делает человек за компьютером. В этой статье с редакционной точки зрения понятно объясняется, что это за новая функция Claude: что она умеет, как ею пользоваться и кому она подойдёт.
Что именно обновилось в «использовании компьютера» у Claude
Главная изюминка этого обновления — то, что на стороне API Claude предоставляет возможность «использование компьютера (computer use)»: разработчики могут направлять Claude для навигации по пользовательскому интерфейсу. Claude принимает решения на основе содержимого экрана, затем выполняет действия — клики, ввод, переходы и т. п. — связывая в цепочку шаги, которые раньше приходилось делать вручную. Стоит напомнить, что Anthropic также прямо указывает: функция всё ещё находится на экспериментальной стадии, иногда возможны подвисания, ошибочные клики или нестабильность шагов.
В каких каналах доступна эта возможность
Сейчас «использование компьютера» в бета-формате доступно в Anthropic API — это удобно для интеграции Claude в процессы автоматизации или внутренние инструменты. Claude также поддерживает построение аналогичных возможностей на Amazon Bedrock и Google Cloud Vertex AI, что упрощает внедрение в компаниях. Одновременно обновлённый Claude 3.5 Sonnet уже доступен всем пользователям; особенно усилены его возможности в программировании.

