Самое заметное обновление Claude 3.5 Sonnet в последнее время — это шаг от «умеет отвечать» к «умеет действовать». Благодаря набору возможностей, позволяющих модели воспринимать интерфейс компьютера и выполнять шаги, он связывает понимание скриншотов, навигацию и заполнение форм в единый целостный процесс. Ниже, исходя из реальной логики использования, по частям разберём, что умеет Claude 3.5 Sonnet, кому это подходит и какие есть границы, на которые стоит обращать внимание。
Что именно изменило «управление компьютером» в Claude 3.5 Sonnet
Раньше, когда вы просили Claude 3.5 Sonnet написать план или решение, вам часто всё равно приходилось самим открывать веб‑страницы, копировать содержимое, переключаться между инструментами и вставлять данные. Теперь направление такое: Claude 3.5 Sonnet не только понимает скриншоты экрана, но и может разложить ваши инструкции на естественном языке на конкретные шаги работы на компьютере. Для разработчиков это означает возможность встроить в продукт цепочку «понять интерфейс — выполнить действие — вернуть результат».
Это не просто ещё одна кнопка: задачи могут продвигаться последовательно в одном и том же контексте, с меньшим количеством прерываний туда‑сюда. Особенно в рабочих процессах, где нужно много шагов и повторная проверка, ценность Claude 3.5 Sonnet будет заметнее.
Что он умеет: таблицы, веб‑страницы, упорядочивание данных — быстрее и проще
Судя по открытой информации, типичные сценарии для Claude 3.5 Sonnet включают: чтение материалов на вашем компьютере для заполнения таблиц, навигацию в браузере к нужным страницам, приведение информации к структурированному виду. Его можно воспринимать как «помощника с глазами»: сначала он понимает содержимое скриншота, затем по инструкции продолжает действия. Команды с большим объёмом повторяющихся операций — например, операционный ввод данных, свод отчётов, сверка материалов — быстрее увидят рост эффективности.
Если вы хотите, чтобы Claude 3.5 Sonnet помогал с исследовательскими задачами, такой режим тоже подходит лучше: сначала найти источники, затем извлечь ключевые пункты, а в конце сформировать таблицу или пояснение, готовые к сдаче.

