Запоздавший пост. Сегодня хочу поговорить про личный опыт работы с AI агентами, конкретно, с Codex, Cursor, Gemini CLI и конечно же Claude Code, в приложении к разным задачам: анализ данных, генерация интерфейсов, удобство и скорость при разработке своих пет-проектов.

Начну с того, что каждый агент чувствуется по-разному. Для меня несколько удивительно, что крупные провайдеры не сходятся в одну точку сингулярности и дизайнят свои решения абсолютно по-разному, от системных промптов до количества встроенных инструментов (tools). Например, у Claude Code есть очень много инструментов и он постоянно пытается себя перепроверять. Gemini CLI строится всего на 7 базовых операциях, ключевая из которых EditFile. А Codex вообще не имеет аналог read_file_tool – если он хочет что-то прочитать, то он делает `cat` или `grep`! Уже из-за этого их эргономика воспринимается по-разному.

Но перейдем к практике. Раньше для меня абсолютным победителем на повседневное пользование был Claude Code. Довольно шустрый, запускается все +- с оne-shot-а. Умеет не только в код, но и общие задачи анализа данных. Вот кстати момент с рисованием графиков Антропики точно прокачали. Думаю, во всех своих статьях они рисуют графики именно через Claude Code. Получается, на мой взгляд очень круто (картинка 1 для вдохновения). Детали приходится порой править, как например масштаб или расположение, но заводские настройки сильные.

Есть у Клода и ряд минусов. Это и код плохой (но рабочий), и безумная проактивность. Даже если CLAUDE.md говорит консультироваться с пользователем, если не уверен, через пару-тройку реплик он это успешно забывает и начинает фигачить как не в себя. Вот тут для меня и выходит на первый план Codex. Заметил, что он часто советуется и просит уточнять детали. Это сильно экономит токены и гораздо более user-friendly решение, чем выплюнуть портянку, которую вы удалите.

К слову, в UI задачах Codex тоже на голову выше Claude Code. Я не говорю, что Sonnet / Opus модели не могут сгенерировать красивые дизайны (Lovable буквально существует на моделях Антропика за счет своих крутых промптов и шаблонов – общался с их фаундером). Нет, но из коробки он настроен как-то слишком базово и выдает слабые UI. А вот с Codex-ом другие ощущения. Пытался как-то сгенерировать grid-like интерфейс с красивыми блоками по связке промпт+шаблон, у последнего выходило сильно лучше. Картинка 2 (свежий Соннет) и 3 (свежий Кодекс) в приложении. Еще добавлю Картинку 4 – это то, как Claude Code генерировал с Sonnet 3.7. Прогресс виден все равно абсолютно точно!

Поэтому для пет-проектов я использую связку: Claude Code для бэкенда, Codex для UI. В целом уживаются хорошо. Первый быстрее всех; второй дорогой, но хорошо рисует интерфейсы.

В то же самое время, с точки зрения тулзов для профессиональных разработчиков, выделяется Gemini CLI. У них и сэндбоксы есть для изолированных контейнеров, и телеметрию трекать можно, и UI агента они полностью пересобрали, что он теперь как приложение, и можно сжимать-разжимать окно, ставить курсор в любую позицию по клику (в отличие от стандартных терминальных решений других агентов), да еще и модель прокачали (писал тут). И тем не менее...это все еще самый неудобный агент. Фичи отваливаются одна за другой. А Gemini 3 хоть и Ооочень хорошо в написании кода по заданной спецификации, страдает от в instruct following режиме: общаешься с агентом и просишь использовать подход A, но он упорно делает по-своему и лажает.

Америки не открою, но все агенты страдают от уверенности в своей правоте. Codex делает по моим впечатлениям заметный шаг в сторону того, чтобы уйти от этого и вести со мной диалог независимо от состояния сессии. И мне это очень помогает, чтобы максимально эффективно придти финальной точки.

Про Cursor скажу только что их собственная модель, composer-1, действительно самая шустрая. И в задачах на генерацию кода или просто автокомплит работает шикарно.Если у вас есть четкая прописанная спека – смело используйте. Увы, когда дело касается терминала или многошаговых задач, все ломается.

А у кого какие впечатления от всех этих агентов?