Claude запускает функцию «использование компьютера»: может смотреть на экран, кликать мышью и даже печатать

Claude недавно сделал большой шаг вперёд от простого «умения разговаривать»: добавил публичную бета-версию возможности «использования компьютера». Проще говоря, вы можете поручить Claude смотреть на экран, двигать курсор, нажимать кнопки и вводить текст — выполнять задачи так же, как это делает человек за компьютером. В этой статье с редакционной точки зрения понятно объясняется, что это за новая функция Claude: что она умеет, как ею пользоваться и кому она подойдёт.

Что именно обновилось в «использовании компьютера» у Claude

Главная изюминка этого обновления — то, что на стороне API Claude предоставляет возможность «использование компьютера (computer use)»: разработчики могут направлять Claude для навигации по пользовательскому интерфейсу. Claude принимает решения на основе содержимого экрана, затем выполняет действия — клики, ввод, переходы и т. п. — связывая в цепочку шаги, которые раньше приходилось делать вручную. Стоит напомнить, что Anthropic также прямо указывает: функция всё ещё находится на экспериментальной стадии, иногда возможны подвисания, ошибочные клики или нестабильность шагов.

В каких каналах доступна эта возможность

Сейчас «использование компьютера» в бета-формате доступно в Anthropic API — это удобно для интеграции Claude в процессы автоматизации или внутренние инструменты. Claude также поддерживает построение аналогичных возможностей на Amazon Bedrock и Google Cloud Vertex AI, что упрощает внедрение в компаниях. Одновременно обновлённый Claude 3.5 Sonnet уже доступен всем пользователям; особенно усилены его возможности в программировании.

Какие реальные сценарии подходят Claude: от «десятков шагов» к «одной фразе»

Когда задача требует множества повторяющихся действий, ценность Claude наиболее очевидна: например, поштучный ввод данных в веб‑админке, массовое заполнение форм, сбор информации на разных страницах с последующим внесением обратно. Можно также заставить Claude проходить по шагам «чек‑лист», превращая легко пропускаемые клики и ввод в фиксированный процесс. Уже есть команды, которые исследуют использование Claude для цепочек из десятков и даже сотен шагов — для внутренней оценки продукта, автоматизированной валидации или внутренних операционных инструментов.

На какие подводные камни и границы обратить внимание перед использованием «использования компьютера» в Claude

Поскольку Claude «смотрит на экран и затем действует», изменения состояния экрана, всплывающие окна, перекрытия, отличия в стиле кнопок — всё это может привести к ошибкам в его интерпретации; поэтому лучше давать ему чёткие шаги и инструкции по обработке ошибок. В ситуациях с входом в аккаунт, оплатой и приватными данными рекомендуется перевести ключевые шаги на ручное подтверждение и обеспечить принцип минимально необходимых прав. С точки зрения безопасности, обновления Claude прошли предразвёрточные тесты в сотрудничестве с Институтами исследований безопасности ИИ США и Великобритании; Anthropic также считает, что их стандарт ASL‑2 по‑прежнему применим, однако на стороне продукта всё равно нужно жёстко выстроить управление рисками.

Что именно обновилось в «использовании компьютера» у Claude

В каких каналах доступна эта возможность

Какие реальные сценарии подходят Claude: от «десятков шагов» к «одной фразе»

На какие подводные камни и границы обратить внимание перед использованием «использования компьютера» в Claude

Поиск статей

ChatGPT Plus | Скидка 30% | Пополнение за 1 минуту | Поддерживается продление

Популярные Статьи

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности