Когда переходить с одного агента на мультиагентов?

Когда нужны чёткое разделение труда, параллельный поиск или независимая ревью-цепочка — и в одном prompt уже больше трёх разнородных ролей.

Мультиагенты всегда дороже?

Суммарные токены могут расти, но малые модели на исполнение, крупные на планирование, кэш и детерминированные скрипты часто держат стоимость и задержку под контролем.

От одного агента к мультиагентному конвейеру: AI-разработка 2026

В прошлом году мы собрали для B2B SaaS «универсального агента поддержки»: один system prompt с персонами пресейла, постпродажи, котировок и troubleshooting плюс FAQ на двадцать страниц. Первая неделя — восторг. На третьей он гонял upsell внутри тикетов на возврат и слал клиентам внутренние кодовые имена.

Никто не обвинил модель в глупости. Проблема была простой: четыре должности — один сотрудник. В 2026 консенсус крепнет: single agent не умер, но подходит для задач с чёткими границами и короткой цепочкой инструментов. Как только нужны исследование → спека → код → тесты → ревью → релиз — многоэтапная, параллельная, взаимно корректирующая работа — пора проектировать мультиагентный конвейер.

Без энциклопедии «что такое агент» — только путь миграции из OpenClaw, IDE-агентов и внутренних PoC. Если память и стоимость уже болят, смотрите Agent Memory vs лог чата и счёт команды агентов.

1→N

Роли из prompt-масок в узлы

ReAct

Цикл рассуждения single agent

3 слоя

Harness / Framework / Runtime

Эра single agent: силён в роли, слаб в сотрудничестве

Ранние продукты соревновались в «экспертности» system prompt и плавности смены персон. Параграфы «старший архитектор», «язвительный ревьюер», «терпеливый PM» — модель меняет тон в одном треде. Это single-agent role-playing.

Плюсы очевидны: один деплой, короткий trace, простой дебаг. Cursor, Claude Code и кастомные GPT довели эту линию в 2024–2025.

Потолок тоже:

Загрязнение контекста—заметки, diff и логи тестов в одном окне; поздние шаги наследуют шум.
Размытая ответственность—неясно, планирование или исполнение сломалось; один этап не перезапустить.
Нулевой параллелизм—модель думает линейно, команды — нет.
Сложно разделить права—агент кода и агент прод-БД не должны делить один набор tools; один prompt это плохо режет.

Когда задача — не «ответить», а «отдать mergeable PR», утолщение prompt даёт мало. Это не деградация модели — форма задачи стала инженерной: нужны handoff, контракты и replay.

Эра мультиагентов: от «один актёр — много масок» к handshake

Мультиагентная коллаборация меняет метафору: не один актёр в масках, а несколько ролей на сцене, связанных режиссурой и сценарием. Planner только декомпозирует, Coder трогает разрешённые пути, Reviewer читает diff без права «поправить пару строк».

Выравнивание через три механизма:

Общее состояние—планы, снимки дерева, результаты тестов, todo в графе или store, не в чате.
Структурированные передачи—JSON, patch, checklist; следующий шаг ест только валидные поля, не «см. выше».
Завершение и арбитраж—готово, эскалация человеку, rollback решает Evaluator или правило, не последний агент.

Разбив «универсальную поддержку» на Intent Router, FAQ Retriever, Ticket Writer и Escalation Guard, мы свели утечки внутреннего жаргона к нулю — не сменой модели, а отсутствием клиентских tools у Escalation Guard.

Когда переходить на мультиагентов?

Если человек за 30 минут проходит линейный чеклист из трёх шагов — часто хватит single agent + хороших tools. Нужны параллельный поиск, адверсариальное ревью или состояние между сессиями — сначала рисуйте конвейер.

Внутри одного агента: ReAct и слои

Перед разбиением на команду разберите анатомию одного агента. LangChain, OpenAI Agents SDK, Cursor — скелет в 2026 похож:

Архитектура AI-агента — Анатомия single agent: цели → инструкции → ReAct → tools; ограничения и память замыкают цикл.

Сверху вниз:

Слой инструкций—system prompt, AGENTS.md, Skills переводят цели в ограничения. Skills — переиспользуемые подпрограммы до апгрейда в узел.
Цикл ReAct—Reason → Tool → Observe. Сердце агента.
Tools и runtime—filesystem, Git, sandbox. MCP — де-факто стандарт 2026.
Детерминированные ограничения—hooks, middleware, evaluators вне цикла.
Состояние и память—планы, логи, store питают следующий ReAct реальностью, не галлюцинацией прогресса.

Мультиагенты не выбрасывают диаграмму — копируют блоки и связывают графом. LangGraph разделяет сообщения внутри треда и cross-thread store (концепции памяти).

Паттерны конвейера: четыре топологии

«Мультиагенты» ≠ «больше голов». Сначала топология:

Топология	Как сотрудничают	Типичный сценарий	Главный риск
Последовательный конвейер	A → B → C, односторонняя передача	Исследование → спека → код → юнит-тесты	Ошибка вверху — полный перезапуск; нужны checkpoint
Supervisor–worker	Supervisor раздаёт, workers отчитываются	Параллельные правки, map-reduce миграции	Раздувание контекста supervisor; merge-конфликты
Дебаты / ревью	Предложение + критик, несколько раундов	Security audit, выбор архитектуры, release notes	Пустые дебаты жгут токены; лимит раундов
Человек в контуре	`interrupt` на критических узлах	Прод-изменения, исходящая почта, биллинг	Состояние должно жить, пока человек думает — не на одном ноутбуке

Тренд 2026: выносить детерминированное из LLM. Формат, lint, тесты, теги — в CI или hooks; агент думает и чертит черновик. На cloud Mac агент шлёт diff, xcodebuild всегда в изолированном runner — как «разработчики не трогают прод».

Концепции multi-agent LangChain моделируют Supervisor, Swarm, Handoff как рёбра графа — ребро важнее модели.

Стек 2026: Harness / Framework / Runtime

Больше трёх узлов в IDE, VPS или cron — «один Python со prompt'ами» не масштабируется. Три слоя:

Три слоя стека агентов — Снизу вверх: LangGraph, LangChain, Harness (напр. DeepAgents).

Runtime (LangGraph) — какой узел следующий, где состояние, как rollback. LangGraph как Pregel supersteps для глобального планирования.

Framework (LangChain) — модели, tools, RAG как детали без навязанной топологии.

Harness (DeepAgents и др.) — тест, деплой, согласование с людьми; гонка 2026 — кто вывозит в прод, а не кто умнее звучит.

Порядок выбора

Сначала runtime и топология (последовательно, параллельно, interrupt человека), затем framework для MCP/моделей, затем harness. Наоборот — крутая демо и прод-граф без «ждать одобрения человека».

Чеклист внедрения

Минимум для внутренних пилотов — без привязки к вендору:

Граф состояний, не оргструктура—узлы = глаголы, рёбра = контракты данных.
Schema на каждую передачу—JSON Schema для частичных retry.
Минимальные tools на узел—reviewer только чтение.
Один trace id на всю цепочку.
Слои памяти—внутри треда, между сессиями, RAG раздельно.
Бюджет по узлам—большая модель планирует, малая форматирует.

Делите и execution: шлюз OpenClaw на VPS, xcodebuild и тяжёлая browser-автоматизация на облачном Mac — чтобы один ноутбук не был и мозгом, и мышцами, уходящими в офлайн при закрытии крышки.

Частые грабли

Пять агентов с одним «универсальным toolbelt» = не разделили; раздутый Supervisor тяжелее single agent; дебаты без Evaluator хвалят друг друга бесконечно. Минимальный фикс: разделить tools, ограничить раунды, добавить детерминированные gate.

Ещё вопросы

Single agent исчезнет?

Нет. Короткие цепочки — поиск, один файл, черновик письма — часто быстрее и дешевле с одним агентом и Skills. Мультиагенты — для сложной поставки, не по умолчанию.

Как связаны MCP и Skills?

MCP стандартизирует tools; Skills — модули внутри одного агента. В конвейере Skill становится узлом, tools шарятся через MCP.

OpenClaw — это мультиагенты?

Шлюз может быть лёгким оркестратором; полный граф обычно требует LangGraph. OpenClaw силён как 24/7 execution surface.