Titikey
ГлавнаяПолезные советыClaudeПодробный разбор функции использования компьютера в Claude 3.5: в API видит экран, кликает мышью и автоматически печатает

Подробный разбор функции использования компьютера в Claude 3.5: в API видит экран, кликает мышью и автоматически печатает

09.03.2026
Claude

Самое заметное обновление Claude 3.5 — это переход от «диалога» к «действию»: он может видеть экран, перемещать курсор, нажимать кнопки и вводить текст. Для разработчиков Claude 3.5 больше не просто даёт советы — он способен пошагово выполнить задачу прямо в интерфейсе.

Что такое «использование компьютера» в Claude 3.5

В публичной бете Claude 3.5 предоставляет возможность «использования компьютера (computer use)»; суть в том, чтобы модель могла пользоваться компьютерным интерфейсом как человек. Он принимает решения на основе содержимого экрана, а затем выполняет действия вроде перемещения мыши, кликов и ввода с клавиатуры.

Важно подчеркнуть: официально Claude 3.5 позиционируется как экспериментальная функция — она работает, но может подтормаживать, ошибаться в шагах или нажимать не туда. Лучше сначала опробовать её в контролируемых сценариях, а затем постепенно переносить в реальные бизнес‑процессы.

Какие «многошаговые задачи» можно делать с Claude 3.5

Традиционная автоматизация больше похожа на скрипт: при изменениях интерфейса она легко ломается; ценность Claude 3.5 в том, что он «понимает текущий экран», поэтому лучше подходит для процессов с переходами между страницами и формами и большим числом шагов. Например: по требованиям поэтапно настраивать параметры в админке сайта, выполнять цепочку настроек в инструменте или заносить информацию в систему в заданном формате.

Некоторые команды также изучают использование Claude 3.5 для UI‑навигации, которая требует десятков или даже сотен шагов — чтобы помогать в проверке процессов, прохождении операционных маршрутов или выполнении повторяющегося ввода данных.

На каких платформах доступен Claude 3.5 и как подключить

Возможность использования компьютера в Claude 3.5 сейчас в основном открыта для сценариев через API: разработчики могут вызывать её в Anthropic API, а также строить решения на Amazon Bedrock и Google Cloud Vertex AI. Если вы ищете название модели на стороне AWS, в документации могут встречаться обозначения вроде Claude 3.5 Sonnet V2.

При внедрении на практике рекомендуется воспринимать Claude 3.5 как «агента, который умеет действовать», и добавить сверху слой управления процессом: ограничить диапазон доступных страниц, добавить точки подтверждения для критических шагов и записывать скриншоты и ввод на каждом шаге, чтобы было проще воспроизводить и отлаживать.

Ограничения и информация по безопасности, которые нужно знать перед использованием Claude 3.5

Claude 3.5 всё ещё может ошибочно кликнуть, пропустить поля или неверно понять кнопку, поэтому не стоит считать его «полной автоматизацией без надзора». Надёжнее сначала прогнать сценарии в тестовой среде, затем постепенно расширять права и сделать высокорисковые операции (оплата, удаление, отправка необратимых форм) такими, которые требуют обязательного ручного подтверждения.

По части безопасности: обновлённая версия Claude 3.5 прошла предразвёрточные тесты и была оценена в сотрудничестве с исследовательскими организациями по безопасности ИИ в США и Великобритании; Anthropic также заявляет, что стандарт ASL‑2 по‑прежнему применим к этой модели. Для компаний и команд эти сведения скорее задают «минимальную планку», а реальная безопасность зависит от того, какие права вы выдаёте Claude 3.5 и обеспечили ли вы аудит и возможность отката.

ГлавнаяМагазинЗаказы