VPSSpark Блог
← К дневнику разработки

Один материал — полная картина: от single agent к мультиагентному конвейеру в 2026

Архитектура AI-агентов · 2026.06.22 · ~14 мин чтения

Один агент в ролях vs мультиагентный конвейер согласования
Слева: один агент меняет маски через prompt. Справа: handshake и разделение труда — фокус 2026 смещается вправо.

В прошлом году мы собрали для B2B SaaS «универсального агента поддержки»: один system prompt с персонами пресейла, постпродажи, котировок и troubleshooting плюс FAQ на двадцать страниц. Первая неделя — восторг. На третьей он гонял upsell внутри тикетов на возврат и слал клиентам внутренние кодовые имена.

Никто не обвинил модель в глупости. Проблема была простой: четыре должности — один сотрудник. В 2026 консенсус крепнет: single agent не умер, но подходит для задач с чёткими границами и короткой цепочкой инструментов. Как только нужны исследование → спека → код → тесты → ревью → релиз — многоэтапная, параллельная, взаимно корректирующая работа — пора проектировать мультиагентный конвейер.

Без энциклопедии «что такое агент» — только путь миграции из OpenClaw, IDE-агентов и внутренних PoC. Если память и стоимость уже болят, смотрите Agent Memory vs лог чата и счёт команды агентов.

1→N
Роли из prompt-масок в узлы
ReAct
Цикл рассуждения single agent
3 слоя
Harness / Framework / Runtime

Эра single agent: силён в роли, слаб в сотрудничестве

Ранние продукты соревновались в «экспертности» system prompt и плавности смены персон. Параграфы «старший архитектор», «язвительный ревьюер», «терпеливый PM» — модель меняет тон в одном треде. Это single-agent role-playing.

Плюсы очевидны: один деплой, короткий trace, простой дебаг. Cursor, Claude Code и кастомные GPT довели эту линию в 2024–2025.

Потолок тоже:

  • Загрязнение контекста—заметки, diff и логи тестов в одном окне; поздние шаги наследуют шум.
  • Размытая ответственность—неясно, планирование или исполнение сломалось; один этап не перезапустить.
  • Нулевой параллелизм—модель думает линейно, команды — нет.
  • Сложно разделить права—агент кода и агент прод-БД не должны делить один набор tools; один prompt это плохо режет.

Когда задача — не «ответить», а «отдать mergeable PR», утолщение prompt даёт мало. Это не деградация модели — форма задачи стала инженерной: нужны handoff, контракты и replay.

Эра мультиагентов: от «один актёр — много масок» к handshake

Мультиагентная коллаборация меняет метафору: не один актёр в масках, а несколько ролей на сцене, связанных режиссурой и сценарием. Planner только декомпозирует, Coder трогает разрешённые пути, Reviewer читает diff без права «поправить пару строк».

Выравнивание через три механизма:

  • Общее состояние—планы, снимки дерева, результаты тестов, todo в графе или store, не в чате.
  • Структурированные передачи—JSON, patch, checklist; следующий шаг ест только валидные поля, не «см. выше».
  • Завершение и арбитраж—готово, эскалация человеку, rollback решает Evaluator или правило, не последний агент.

Разбив «универсальную поддержку» на Intent Router, FAQ Retriever, Ticket Writer и Escalation Guard, мы свели утечки внутреннего жаргона к нулю — не сменой модели, а отсутствием клиентских tools у Escalation Guard.

Когда переходить на мультиагентов?
Если человек за 30 минут проходит линейный чеклист из трёх шагов — часто хватит single agent + хороших tools. Нужны параллельный поиск, адверсариальное ревью или состояние между сессиями — сначала рисуйте конвейер.

Внутри одного агента: ReAct и слои

Перед разбиением на команду разберите анатомию одного агента. LangChain, OpenAI Agents SDK, Cursor — скелет в 2026 похож:

Архитектура AI-агента
Анатомия single agent: цели → инструкции → ReAct → tools; ограничения и память замыкают цикл.

Сверху вниз:

  • Слой инструкций—system prompt, AGENTS.md, Skills переводят цели в ограничения. Skills — переиспользуемые подпрограммы до апгрейда в узел.
  • Цикл ReAct—Reason → Tool → Observe. Сердце агента.
  • Tools и runtime—filesystem, Git, sandbox. MCP — де-факто стандарт 2026.
  • Детерминированные ограничения—hooks, middleware, evaluators вне цикла.
  • Состояние и память—планы, логи, store питают следующий ReAct реальностью, не галлюцинацией прогресса.

Мультиагенты не выбрасывают диаграмму — копируют блоки и связывают графом. LangGraph разделяет сообщения внутри треда и cross-thread store (концепции памяти).

Паттерны конвейера: четыре топологии

«Мультиагенты» ≠ «больше голов». Сначала топология:

Топология Как сотрудничают Типичный сценарий Главный риск
Последовательный конвейер A → B → C, односторонняя передача Исследование → спека → код → юнит-тесты Ошибка вверху — полный перезапуск; нужны checkpoint
Supervisor–worker Supervisor раздаёт, workers отчитываются Параллельные правки, map-reduce миграции Раздувание контекста supervisor; merge-конфликты
Дебаты / ревью Предложение + критик, несколько раундов Security audit, выбор архитектуры, release notes Пустые дебаты жгут токены; лимит раундов
Человек в контуре interrupt на критических узлах Прод-изменения, исходящая почта, биллинг Состояние должно жить, пока человек думает — не на одном ноутбуке

Тренд 2026: выносить детерминированное из LLM. Формат, lint, тесты, теги — в CI или hooks; агент думает и чертит черновик. На cloud Mac агент шлёт diff, xcodebuild всегда в изолированном runner — как «разработчики не трогают прод».

Концепции multi-agent LangChain моделируют Supervisor, Swarm, Handoff как рёбра графа — ребро важнее модели.

Стек 2026: Harness / Framework / Runtime

Больше трёх узлов в IDE, VPS или cron — «один Python со prompt'ами» не масштабируется. Три слоя:

Три слоя стека агентов
Снизу вверх: LangGraph, LangChain, Harness (напр. DeepAgents).

Runtime (LangGraph) — какой узел следующий, где состояние, как rollback. LangGraph как Pregel supersteps для глобального планирования.

Framework (LangChain) — модели, tools, RAG как детали без навязанной топологии.

Harness (DeepAgents и др.) — тест, деплой, согласование с людьми; гонка 2026 — кто вывозит в прод, а не кто умнее звучит.

Порядок выбора
Сначала runtime и топология (последовательно, параллельно, interrupt человека), затем framework для MCP/моделей, затем harness. Наоборот — крутая демо и прод-граф без «ждать одобрения человека».

Чеклист внедрения

Минимум для внутренних пилотов — без привязки к вендору:

  • Граф состояний, не оргструктура—узлы = глаголы, рёбра = контракты данных.
  • Schema на каждую передачу—JSON Schema для частичных retry.
  • Минимальные tools на узел—reviewer только чтение.
  • Один trace id на всю цепочку.
  • Слои памяти—внутри треда, между сессиями, RAG раздельно.
  • Бюджет по узлам—большая модель планирует, малая форматирует.

Делите и execution: шлюз OpenClaw на VPS, xcodebuild и тяжёлая browser-автоматизация на облачном Mac — чтобы один ноутбук не был и мозгом, и мышцами, уходящими в офлайн при закрытии крышки.

Частые грабли
Пять агентов с одним «универсальным toolbelt» = не разделили; раздутый Supervisor тяжелее single agent; дебаты без Evaluator хвалят друг друга бесконечно. Минимальный фикс: разделить tools, ограничить раунды, добавить детерминированные gate.

Ещё вопросы

Single agent исчезнет?

Нет. Короткие цепочки — поиск, один файл, черновик письма — часто быстрее и дешевле с одним агентом и Skills. Мультиагенты — для сложной поставки, не по умолчанию.

Как связаны MCP и Skills?

MCP стандартизирует tools; Skills — модули внутри одного агента. В конвейере Skill становится узлом, tools шарятся через MCP.

OpenClaw — это мультиагенты?

Шлюз может быть лёгким оркестратором; полный граф обычно требует LangGraph. OpenClaw силён как 24/7 execution surface.

Эпоха командной работы требует командных сред исполнения

Переход от single к мультиагентам — это разрезать неподдерживаемые prompt'ы на наблюдаемые конвейеры. Planner, Worker, Reviewer нуждаются в разных правах и runtime — следующий шаг: шлюз на VPS, тяжёлые сборки на cloud Mac, память в vault.

Облачные Mac mini M4 VPSSpark подходят для Worker'ов с долгими компиляциями; Linux VPS — для OpenClaw и лёгкого cron. Умнее модель ≠ стабильнее доставка — сначала «команда» в архитектуре, потом мощность.

Первый мультиагентный конвейер? Смотрите тарифы Mac в облаке или главную. Эра single учила prompt'ам; эра multi учит handoff, контрактам и replay — языку инженерных команд.

Ограниченное предложение

Конвейер разбит — не привязывайте Worker к закрывающемуся ноутбуку

Мультиагенты · облачный Mac · шлюз OpenClaw

На главную
Ограниченное предложение Смотреть тарифы