Desarrollo de Agentes de Anthropic: La Simplicidad Supera la Complejidad

Definición de Agentes Inteligentes

El concepto de agentes inteligentes es diverso. Algunos los ven como "mayordomos todo en uno" capaces de pensar de forma independiente, tomar decisiones autónomas y utilizar herramientas para completar tareas complejas. Otros los consideran "empleados obedientes" que ejecutan flujos de trabajo preestablecidos. Anthropic engloba ambos bajo el término "sistemas inteligentes", diferenciando entre flujos de trabajo y agentes:

Flujos de trabajo: Sistemas que orquestan modelos de lenguaje grandes (LLM) y herramientas a través de rutas de código predefinidas.
Agentes: Sistemas donde un LLM guía dinámicamente su propio proceso y el uso de herramientas, controlando de forma autónoma cómo se completan las tareas.

Cuándo Optar por Agentes Inteligentes

Anthropic aconseja seguir el principio de "mantenerlo simple" al desarrollar aplicaciones de IA. No todos los escenarios requieren la construcción de sistemas inteligentes complejos. Aunque los sistemas inteligentes son poderosos, pueden llevar a respuestas más lentas y costos mayores. Los desarrolladores deben equilibrar funcionalidad y eficiencia.

Flujos de trabajo: Adecuados para tareas claras que requieren predictibilidad y consistencia.
Agentes: Más apropiados para escenarios a gran escala que necesitan flexibilidad y decisiones basadas en modelos.

En muchas aplicaciones, usar buenas instrucciones (prompts) junto con recuperación y ejemplos contextuales, preguntando directamente al modelo grande, suele ser suficiente.

Uso de Frameworks

Existen varios frameworks para ayudar a los desarrolladores a construir agentes de IA, como:

LangGraph de LangChain
El framework AI Agent de Amazon Bedrock
Rivet, una herramienta de construcción de flujos de trabajo de modelos grandes de arrastrar y soltar
Vellum, una herramienta GUI para construir y probar flujos de trabajo complejos

Aunque estos frameworks simplifican el proceso de desarrollo, también añaden capas de abstracción al código, haciendo que la lógica subyacente sea menos transparente, aumentando la dificultad de depuración y posiblemente introduciendo soluciones excesivamente complejas en escenarios simples.

Anthropic recomienda que los desarrolladores comiencen usando directamente las API de los modelos grandes. Muchos patrones se pueden implementar con solo unas pocas líneas de código. Si se decide usar un framework, es crucial entender su funcionamiento interno. La falta de comprensión de los mecanismos subyacentes de un framework es una causa principal de problemas de desarrollo.

El cookbook de Anthropic proporciona ejemplos concretos.

Bloques de Construcción, Flujos de Trabajo y Agentes

Bloque de Construcción Básico: LLM Mejorados

El bloque de construcción fundamental de los sistemas inteligentes son los LLM mejorados, con capacidades como la recuperación y la memoria. Los modelos de Anthropic pueden utilizar estas capacidades de forma proactiva, por ejemplo, generando consultas de búsqueda, seleccionando herramientas y decidiendo qué información conservar.

Al expandir la funcionalidad, es esencial centrarse en:

Adaptar la funcionalidad al caso de uso específico.
Asegurar interfaces simples y bien documentadas para el modelo.

El protocolo de contexto de modelos recientemente publicado por Anthropic facilita la integración de modelos de IA con ecosistemas de herramientas de terceros.

Flujo de Trabajo: Cadenas de Prompts

Las cadenas de prompts dividen las tareas complejas en varios pasos, con cada paso invocando el modelo grande una vez, y los pasos siguientes procesando los resultados del paso anterior. Los desarrolladores pueden añadir puntos de control en el medio para asegurar que el proceso avanza como se espera.

Las cadenas de prompts son adecuadas para dividir tareas complejas en una serie de subtareas fijas. Cada modelo se enfoca en completar una tarea simple, y aunque el tiempo de respuesta general puede ser un poco más largo, la precisión aumenta significativamente.