Разработка агентов Anthropic: простота важнее сложности

Определение интеллектуальных агентов

Понятие интеллектуальных агентов многогранно. Некоторые видят в них "всемогущих дворецких", способных самостоятельно мыслить, принимать решения и использовать инструменты для выполнения сложных задач. Другие считают их "исполнительными работниками", которые четко следуют заданным рабочим процессам. Anthropic объединяет эти два подхода под термином "интеллектуальные системы" и проводит различие между рабочими процессами и агентами:

Рабочий процесс: Система, в которой большие языковые модели (LLM) и инструменты организуются через предопределенные пути кода.
Агент: Система, в которой LLM динамически управляет своими процессами и использованием инструментов, самостоятельно контролируя выполнение задач.

Когда следует использовать агентов

Anthropic рекомендует при разработке ИИ-приложений придерживаться принципа "не усложняй, если можно сделать проще". Не во всех случаях требуется построение сложных интеллектуальных систем. Хотя они и обладают мощными возможностями, но могут приводить к замедлению ответа и увеличению затрат. Разработчикам необходимо находить баланс между функциональностью и эффективностью.

Рабочие процессы: Подходят для четких задач, требующих предсказуемости и согласованности.
Агенты: Лучше подходят для масштабных сценариев, требующих гибкости и принятия решений на основе модели.

Во многих приложениях достаточно использовать хорошие подсказки в сочетании с поиском и примерами контекста, чтобы напрямую задавать вопросы большим моделям.

Использование фреймворков

В настоящее время существует множество фреймворков, помогающих разработчикам создавать ИИ-агентов, например:

LangGraph от LangChain
Фреймворк AI Agent от Amazon Bedrock
Инструмент для построения рабочих процессов с большими моделями Rivet
GUI-инструмент Vellum для создания и тестирования сложных рабочих процессов

Эти фреймворки упрощают процесс разработки, но также могут добавлять уровни абстракции кода, делая внутреннюю логику менее прозрачной, усложняя отладку и приводя к излишне сложным решениям в простых сценариях.

Anthropic рекомендует разработчикам начинать с непосредственного использования API больших моделей. Многие шаблоны можно реализовать всего несколькими строками кода. Если вы все же решите использовать фреймворк, обязательно разберитесь в его основных принципах. Недостаточное понимание механизма работы фреймворка является основной причиной проблем при разработке.

Anthropic предоставляет конкретные примеры в своем сборнике рецептов.

Строительные блоки, рабочие процессы и агенты

Базовый строительный блок: улучшенная LLM

Основным строительным блоком интеллектуальных систем является улучшенная LLM, обладающая такими функциями, как поиск и память. Модели Anthropic могут активно использовать эти возможности, например, генерировать поисковые запросы, выбирать инструменты и определять, какую информацию следует сохранить.

При расширении функциональности следует сосредоточиться на:

Настройке функций в соответствии с конкретным сценарием использования.
Обеспечении простых и хорошо документированных интерфейсов для модели.

Недавно выпущенный протокол контекста модели Anthropic упрощает интеграцию ИИ-моделей с экосистемами сторонних инструментов.

Рабочий процесс: цепочка подсказок

Цепочка подсказок разбивает сложную задачу на несколько этапов, каждый из которых вызывает большую модель один раз, а последующие этапы основаны на результатах предыдущего. Разработчики могут добавлять контрольные точки в промежуточные этапы, чтобы убедиться, что процесс идет по плану.

Цепочка подсказок подходит для сценариев, в которых сложные задачи можно четко разбить на серию фиксированных подзадач. Каждая модель фокусируется на выполнении одной простой задачи, и хотя общее время отклика может быть немного больше, точность значительно повышается.