Mi Experimento con Agentes LLM: Impacto Real de la IA en el Trabajo

🌐🇩🇪 Deutsch 🇫🇷 Français 🇫🇷 Français 🇪🇸 Español 🇺🇸 English

📖 12 min read•2,348 words•Updated Mar 25, 2026

Hola a todos, soy Sarah Chen de agnthq.com, y hoy tengo una historia para ustedes. ¿Recuerdan el año pasado cuando todos hablaban de los LLMs y cómo iban a cambiarlo todo? Bueno, lo hicieron, pero no de la manera que muchos esperaban. El verdadero cambio, el que realmente está marcando la diferencia en cómo trabajo (y probablemente en cómo ustedes también lo harán), no es solo sobre los grandes modelos de lenguaje. Se trata de los agentes que se construyen sobre ellos.

He estado experimentando con estas cosas durante meses, tratando de descubrir cuáles realmente cumplen con la expectativa. Y déjenme decirles, hay mucho ruido por ahí. Pero una plataforma me ha impresionado consistentemente con su utilidad práctica, especialmente para alguien como yo que equilibra la creación de contenido, la investigación y pequeños fragmentos de código: Microsoft AutoGen. Hoy, no solo estoy revisando AutoGen; les voy a mostrar cómo lo estoy usando para facilitarme la vida, centrándome en sus capacidades de múltiples agentes para un problema muy específico: la generación de contenido con ejemplos de código integrados.

Olviden el discurso genérico “AutoGen es un marco para conversaciones multijugador”. Vamos a ensuciarnos las manos. No se trata solo de construir un agente; se trata de construir un equipo de agentes, cada uno con un rol específico, para abordar una tarea compleja. Piensen en ello como reunir un pequeño y altamente efectivo equipo virtual para un proyecto.

El Problema: Mi Búsqueda Infinita de Fragmentos de Código Prácticos

Como blogger tecnológico, mi mayor dolor de cabeza no es solo escribir el artículo; es asegurarme de que los ejemplos sean buenos. Puedo escribir sobre agentes de IA todo el día, pero si no puedo mostrarles un fragmento de código rápido y funcional que ilustre mi punto, ¿de qué sirve? Históricamente, esto significaba horas de pruebas manuales, depuración y, a menudo, darme cuenta de que mi idea inicial era defectuosa. Es una enorme pérdida de tiempo.

Necesitaba un sistema que pudiera:

Entender una solicitud de alto nivel para un ejemplo de código.
Generar el código real.
Probar ese código para asegurarme de que funciona.
Proporcionar retroalimentación si no funciona.
Integrar ese código funcional en una narrativa.

Eso es mucho para que un solo LLM lo maneje, y a menudo, cuando intentaba forzarlo con un solo aviso, obtenía alucinaciones, código que no funcionaba o simplemente lugares comunes genéricos. Aquí es donde brilla el enfoque de múltiples agentes de AutoGen.

Mi Configuración de AutoGen: El “Equipo de Creadores de Contenido”

He configurado un pequeño “equipo” de agentes en AutoGen, cada uno diseñado para manejar una parte específica de mi flujo de trabajo de creación de contenido. Aquí están los miembros del equipo:

1. El Agente “Escritor” (User_Proxy)

Ese soy yo, esencialmente. O más bien, es el agente que representa mi entrada y recibe la salida final. Está configurado para permitir la intervención humana, lo cual es crucial para revisar el contenido final y proporcionar retroalimentación sobre el código. No quiero confiar ciegamente en lo que los agentes producen; necesito guiarlos.


user_proxy = autogen.UserProxyAgent(
 name="Writer",
 human_input_mode="ALWAYS", # Importante para guiar el proceso
 max_consecutive_auto_reply=10,
 is_termination_msg=lambda x: x.get("content", "").rstrip().endswith("TERMINATE"),
 code_execution_config={"work_dir": "agent_workspace"},
)

Una nota rápida sobre human_input_mode="ALWAYS": Esto es clave para mí. Significa que después de cada ronda de conversación entre agentes, AutoGen espera mi entrada. A veces lo cambio a “NEVER” si tengo confianza en un flujo de trabajo, pero para tareas creativas complejas, “ALWAYS” me mantiene en el circuito.

2. El Agente “Programador” (Assistant)

El trabajo de este agente es escribir el código real. Es un agente asistente, lo que significa que no ejecuta código directamente, pero puede proponer bloques de código. Le he dado un mensaje del sistema que enfatiza la claridad y la practicidad.


coder = autogen.AssistantAgent(
 name="Coder",
 llm_config={"config_list": [{"model": "gpt-4-turbo-preview"}]}, # Usando un modelo potente aquí
 system_message="Eres un programador de Python. Escribes código Python claro, conciso y funcional. Cuando se te pida un ejemplo de código, genera solo el código y cualquier declaración de importación necesaria. No agregues explicaciones a menos que se te pida específicamente. Concéntrate en ejemplos prácticos y ejecutables.",
)

Descubrí que ser muy explícito en el system_message para el agente Programador redujo mucha de la “palabrería” que los LLMs suelen agregar, como largas explicaciones antes de que comience el código. ¡Solo quiero el código, gente!

3. El Agente “Probador” (User_Proxy con Ejecución de Código)

Aquí es donde ocurre la magia. El agente Probador es otro UserProxyAgent, pero su propósito principal es recibir código del Programador, ejecutarlo y reportar los resultados. Si hay un error, se lo dice al Programador, quien vuelve a intentarlo. Este ciclo de retroalimentación es invaluable.


tester = autogen.UserProxyAgent(
 name="Tester",
 human_input_mode="NEVER", # No necesitamos entrada humana para probar, solo ejecución
 max_consecutive_auto_reply=10,
 code_execution_config={"work_dir": "agent_workspace"},
 system_message="Eres un entorno de ejecución de código Python. Recibirás código Python, lo ejecutarás y reportarás la salida. Si hay errores, repórtalos claramente.",
)

Configurar human_input_mode="NEVER" para el Probador es importante. Queremos que sea autónomo en su función de prueba. La code_execution_config apunta a un directorio de trabajo, que es donde se guardan y ejecutan todos los scripts generados.

4. El Agente “Explicador” (Assistant)

Una vez que tenemos código funcional, el agente Explicador entra en acción. Su trabajo es tomar el código funcional y explicarlo en un lenguaje sencillo, adecuado para una publicación de blog. También formatea la salida para una fácil integración.


explainer = autogen.AssistantAgent(
 name="Explainer",
 llm_config={"config_list": [{"model": "gpt-4-turbo-preview"}]},
 system_message="Eres un escritor de contenido técnico. Recibes código Python y su salida, y tu tarea es explicarlo de manera clara y concisa para una audiencia de blog. Proporciona una breve introducción al propósito del código, una explicación paso a paso si es necesario, y presenta el código en un bloque de markdown. Mantén tus explicaciones atractivas y fáciles de entender.",
)

He encontrado que darle al Explicador un mandato claro sobre su audiencia y formato de salida realmente ayuda. Previene que solo repita el código o sea demasiado verboso.

El Flujo de Trabajo: Cómo se Comunican entre Ellos

Así es como orquesto su conversación usando el GroupChatManager de AutoGen:


groupchat = autogen.GroupChat(agents=[Writer, Coder, Tester, Explainer], messages=[], max_round=20)
manager = autogen.GroupChatManager(groupchat=groupchat, llm_config={"config_list": [{"model": "gpt-4-turbo-preview"}]})

# Iniciar la conversación
Writer.initiate_chat(
 manager,
 message="Necesito un ejemplo de código en Python que demuestre cómo crear un chat simple de múltiples agentes en AutoGen entre dos agentes asistente. Asegúrate de que el código sea ejecutable e incluya una conversación básica.",
)

Cuando inicio esto, esto es lo que sucede aproximadamente:

Writer (yo) envía la solicitud inicial.
Manager dirige la solicitud al Coder.
Coder genera un script en Python para el chat de múltiples agentes.
Manager pasa este código al Tester.
Tester ejecuta el código.
- Si hay un error, Tester lo reporta al Coder, quien vuelve a intentar arreglarlo y genera un nuevo código. Este ciclo continúa hasta que el código se ejecute con éxito.
- Si el código se ejecuta con éxito, Tester reporta la salida.
Una vez confirmados el código funcional y su salida, el Manager dirige la conversación al Explainer.
Explainer toma el código funcional y su salida, y genera el texto explicativo para mi publicación de blog, formateado con bloques de código markdown.
Finalmente, el Writer (yo) revisa la salida del Explicador y toda la conversación, proporcionando un mensaje de “TERMINATE” si está satisfecho, o más instrucciones si no lo está.

Ejemplo Práctico: Generando un Fragmento de Chat de Agente AutoGen

Supongamos que necesito un ejemplo simple para una publicación de blog sobre la interacción básica de agentes de AutoGen. Mi aviso al “Escritor” (que soy yo iniciando el chat) sería:

"Necesito un ejemplo de código en Python que demuestre cómo crear un chat simple de múltiples agentes en AutoGen entre dos agentes asistente. Asegúrate de que el código sea ejecutable e incluya una conversación básica."

Aquí hay una versión simplificada de lo que los agentes podrían producir después de unas pocas rondas:

El Código (Generado por Coder, Probado por Tester)


import autogen

# Configuración para LLMs
config_list = [
 {
 "model": "gpt-4-turbo-preview",
 }
]

# Crear el primer agente asistente
agent1 = autogen.AssistantAgent(
 name="AgentA",
 llm_config={"config_list": config_list},
 system_message="Eres AgentA. Tu tarea es saludar a AgentB y preguntar sobre el clima.",
)

# Crear el segundo agente asistente
agent2 = autogen.AssistantAgent(
 name="AgentB",
 llm_config={"config_list": config_list},
 system_message="Eres AgentB. Tu tarea es responder al saludo de AgentA y proporcionar una actualización simple sobre el clima.",
)

# Crear un agente proxy de usuario para iniciar el chat
user_proxy = autogen.UserProxyAgent(
 name="User_Proxy",
 human_input_mode="NEVER",
 max_consecutive_auto_reply=0, # Este agente simplemente inicia el chat y no responde
 is_termination_msg=lambda x: x.get("content", "").rstrip().endswith("TERMINATE"),
 code_execution_config={"work_dir": "agent_workspace"}, # No es estrictamente necesario para este ejemplo, pero es una buena práctica
)

# Iniciar la conversación
user_proxy.initiate_chat(agent1, message="Iniciar conversación con AgentB.")

La Explicación (Generado por Explainer)

Este simple script en Python demuestra cómo configurar una conversación básica entre dos agentes asistentes usando Microsoft AutoGen. Definimos dos instancias de AssistantAgent, AgentA y AgentB, cada una con un rol distinto definido en su system_message. AgentA tiene la tarea de saludar y preguntar sobre el clima, mientras que AgentB está preparado para responder con una actualización del clima.

Un UserProxyAgent, llamado User_Proxy, se usa para iniciar el diálogo. En esta configuración, User_Proxy actúa como el orquestador, iniciando el chat con AgentA. Dado que human_input_mode está configurado como "NEVER" y max_consecutive_auto_reply como 0 para User_Proxy, simplemente comienza la conversación y luego se aparta, permitiendo que AgentA y AgentB interactúen según sus mensajes del sistema y el flujo de la conversación.

Este patrón es fantástico para crear flujos de trabajo automatizados donde diferentes entidades de IA colaboran para alcanzar un objetivo, como generar contenido dinámico o simular interacciones.

Mis Conclusiones y lo que He Aprendido

AutoGen, especialmente sus capacidades multiconsultas, ha sido un gran impulso para mi productividad. No se trata de reemplazarme; se trata de ofrecerme un equipo autónomo y altamente capaz para manejar el trabajo pesado y la verificación que antes consumía tanto de mi tiempo. Aquí están mis principales conclusiones:

Define Roles Claros: Cuanto más específico seas con el system_message de cada agente, mejor funcionarán. La ambigüedad conduce a respuestas generalistas, que no es lo que queremos en un equipo especializado. Piensa en ello como una descripción de trabajo para cada miembro del equipo.
La Refinación Iterativa es Clave: No esperes perfección en el primer intento. Mis agentes, especialmente el Coder y el Tester, pasaron por muchas iteraciones de mensajes de sistema y solicitudes hasta que comenzaron a producir de manera confiable lo que necesitaba. Aquí es donde el human_input_mode="ALWAYS" para mi agente “Writer” es invaluable.
El Agente Tester es un Cambio Significativo: En serio, tener un agente que pueda ejecutar código y proporcionar retroalimentación inmediata y objetiva es transformador. Es como tener un ingeniero de control de calidad dedicado para cada fragmento de código que genero. Esto reduce drásticamente la cantidad de ejemplos no funcionales que de otro modo publicaría.
Gestiona el Flujo de Conversación: El GroupChatManager es poderoso, pero entender cómo los agentes pasan mensajes y quién responde a quién es crítico. A veces, dirijo explícitamente a los agentes (por ejemplo, “Coder, por favor responde a los comentarios de Tester”) si el administrador se confunde.
La Elección del LLM Importa: Aunque AutoGen funciona con varios LLMs, he encontrado que modelos más capaces como GPT-4-Turbo-Preview producen resultados significativamente mejores, especialmente para la generación de código y explicaciones complejas. Vale la pena el costo adicional para tareas críticas.

AutoGen no es solo una plataforma; es una nueva forma de pensar sobre cómo la IA puede ayudar en tareas complejas. Se aleja de las solicitudes de un solo turno para orquestar flujos de trabajo sofisticados. Para creadores de contenido, desarrolladores o cualquiera que necesite generar y verificar ejemplos técnicos, este enfoque multiconsultas es, en mi opinión honesta, una de las aplicaciones más prácticas e impactantes de agentes de IA que he visto hasta ahora.

Así que, si te sientes abrumado con los detalles de ejemplos de código para tu contenido o proyectos, prueba el sistema multiconsultas de AutoGen. Podría ser el equipo virtual que no sabías que necesitabas. ¡Déjame saber en los comentarios si has probado configuraciones similares o si tienes alguna pregunta!

Hasta la próxima, ¡sigue construyendo y explorando!

Mi Experimento con Agentes LLM: Impacto Real de la IA en el Trabajo

El Problema: Mi Búsqueda Infinita de Fragmentos de Código Prácticos

Mi Configuración de AutoGen: El “Equipo de Creadores de Contenido”

1. El Agente “Escritor” (User_Proxy)

2. El Agente “Programador” (Assistant)

3. El Agente “Probador” (User_Proxy con Ejecución de Código)

4. El Agente “Explicador” (Assistant)

El Flujo de Trabajo: Cómo se Comunican entre Ellos

Ejemplo Práctico: Generando un Fragmento de Chat de Agente AutoGen

El Código (Generado por Coder, Probado por Tester)

La Explicación (Generado por Explainer)

Mis Conclusiones y lo que He Aprendido

Artículos Relacionados

Related Articles

Leave a Comment Cancel Reply

El Problema: Mi Búsqueda Infinita de Fragmentos de Código Prácticos

Mi Configuración de AutoGen: El “Equipo de Creadores de Contenido”

1. El Agente “Escritor” (User_Proxy)

2. El Agente “Programador” (Assistant)

3. El Agente “Probador” (User_Proxy con Ejecución de Código)

4. El Agente “Explicador” (Assistant)

El Flujo de Trabajo: Cómo se Comunican entre Ellos

Ejemplo Práctico: Generando un Fragmento de Chat de Agente AutoGen

El Código (Generado por Coder, Probado por Tester)

La Explicación (Generado por Explainer)

Mis Conclusiones y lo que He Aprendido

Artículos Relacionados

You May Also Like

📚 You Might Also Like

Related Articles

Leave a Comment Cancel Reply