Ich teste intelligente Agenten für die Entwicklung in der realen Welt.

📖 12 min read•2,372 words•Updated Mar 30, 2026

Hallo zusammen, hier ist Sarah von AgntHQ! Ich hoffe, es geht euch gut und ihr fühlt euch nicht zu überwältigt von der beeindruckenden Zahl neuer IA-Tools, die jeden Tag auftauchen. Im Ernst, es ist ein Vollzeitjob, auf dem Laufenden zu bleiben, was, ebenso zufällig, mein Vollzeitjob ist. Ich bitte darum.

Heute möchte ich etwas erkunden, das mich schon eine Weile beschäftigt: das Versprechen gegen die Realität von IA-Agenten-Plattformen in Bezug auf *Entwicklung in der realen Welt*. Es geht nicht nur darum, mit einer Demo zu spielen, sondern tatsächlich etwas Nützliches zu bauen, das nicht erfordert, einen Doktortitel in Prompt-Engineering zu haben oder eine Serverfarm im Garten zu besitzen. Genauer gesagt habe ich mich gefragt, wie diese Plattformen die banale, aber wesentliche Aufgabe bewältigen, mehrere Agenten für einen komplexen Workflow zu orchestrieren. Wir werden eine bestimmte Plattform betrachten, die in letzter Zeit viel Interesse geweckt hat, und wie sie sich schlägt, wenn man versucht, über die glänzenden Beispiele hinauszukommen.

Für diesen tiefen Einblick habe ich mich entschieden, mich auf **Workflow Composer von AgentForge** zu konzentrieren. Es ist ein relativ neuer Akteur, der Ende des letzten Jahres auf den Markt kam, und es wird stark für seine Drag-and-Drop-Oberfläche beworben, um Multi-Agenten-Systeme zu erstellen. Die Idee ist fantastisch: die Agenten visuell zu verbinden, ihre Eingaben und Ausgaben zu definieren und die Plattform die Kommunikation verwalten zu lassen. Aber funktioniert das, wenn man versucht, etwas zu bauen, das nicht einfach „fasse diesen Text zusammen“ oder „finde mir ein Rezept“ ist? Lass es uns herausfinden.

Der Traum: Visueller Workflow, ohne codebedingte Kopfschmerzen

Meine anfängliche Begeisterung für AgentForge war spürbar. Ich habe unzählige Stunden mit Python-Skripten verbracht, um die Interaktionen zwischen Agenten zu verwalten, Daten zwischen ihnen zu übermitteln, Fehler zu behandeln und einfach sicherzustellen, dass alles harmonisch funktioniert. Es ist chaotisch. Es ist anfällig für subtile Bugs. Und ehrlich gesagt, das ist nicht das, was ich tun möchte, wenn das ganze Ziel der Agenten darin besteht, mir das Leben zu erleichtern.

AgentForge versprach einen anderen Ansatz. Stell dir Folgendes vor: Du hast einen „Ideengenerator“-Agenten, einen „Rechercheassistenten“-Agenten und einen „Inhaltsredakteur“-Agenten. In einer perfekten Welt zeichnest du einfach Pfeile: Der Ideengenerator produziert Themen, die den Rechercheassistenten speisen, der dann den Inhaltsredakteur füttert. Die Demovideos von AgentForge zeigten genau das. Es schien magisch. Eine schöne und intuitive Leinwand, auf der du dein ganzes IA-System angeordnet sehen konntest.

Mein spezifisches Projekt, um dies zu testen, war etwas komplexer: einen automatisierten Content-Pipeline für soziale Medien zu erstellen. Ich wollte einen Agenten, der die neuen Trends überwacht, einen anderen, der basierend auf diesen Trends (angepasst an eine spezifische Persona) Ideen für Posts generiert, einen dritten, der die eigentlichen Posts verfasst (einschließlich Emojis und Hashtags), und einen letzten Agenten, der diese überprüft und Verbesserungsvorschläge macht. Das ist nicht außergewöhnlich, aber es umfasst mehrere unterschiedliche Schritte, eine bedingte Logik (zum Beispiel, wenn ein Trend nicht passend ist, lehne ihn ab) und den Austausch von strukturierten Daten. Ein perfekter Test für einen „Workflow-Compositer“.

Realitätscheck: Die Lücken treten zutage

Der Einstieg mit dem Workflow Composer von AgentForge war tatsächlich reibungslos. Ihre vorgefertigten Agenten für Basisaufgaben wie Zusammenfassungen, Webrecherche und Textgenerierung lassen sich leicht auf die Leinwand ziehen. Sie zu verbinden ist buchstäblich ein Drag-and-Drop-Vorgang. Für einfache, lineare Workflows funktioniert es genau wie erwartet.

Mein erstes Hindernis kam mit dem „Trendfilter“-Agenten. Ich wusste, dass er einen Feed verarbeiten und filtern sollte, um die Relevanz zu überprüfen. AgentForge bietet einen „Benutzerdefinierten Agenten“-Knoten, wo du Python-Code oder einen einfachen Prompt eingeben kannst. Ich wählte einen Python-Ausschnitt, der ihr SDK verwendete, um eine externe API aufzurufen und dann die Ergebnisse zu filtern. Das funktionierte gut für die Datenverarbeitung.

Der Datenübergang: Mehr Traum als Pipeline

Die echten Probleme begannen, als ich versuchte, die *strukturierte* Ausgabe meines „Trendfilter“-Agenten an den „Ideengenerator“-Agenten zu übergeben. Mein Trendfilter produzierte eine Liste von Dictionaries, etwa so:


[
 {"topic": "Durchbruch in der Quanteninformatik", "summary": "Neue Stabilität des Qubits erreicht...", "sentiment": "positiv"},
 {"topic": "Debatte über die Ethik der KI", "summary": "Regierungen diskutieren über Vorschriften...", "sentiment": "neutral"},
 ...
]

Der „Ideengenerator“-Agent (den ich als einen weiteren Benutzerdefinierten Agenten mit einem spezifischen Prompt erstellt hatte) sollte über *jeden einzelnen* Punkt dieser Liste iterieren und Ideen für *jede Thematik* generieren. An diesem Punkt begann der visuelle Composer von AgentForge zusammenzubrechen. Es gibt keinen „für jedes Element in der Liste“-Schleifenaufbau, den du visuell verbinden kannst. Die Ausgabe eines Knotens wird normalerweise als ein einzelner Block Text oder ein einzelnes JSON-Objekt für den nächsten Knoten behandelt.

Mein erster Gedanke war: „Okay, dann lasse ich einfach meinen Agenten ‘Trendfilter’ eine Liste von durch Kommas getrennten Themen produzieren, und der ‘Ideengenerator’ kann sie parsen.“ Aber dann verliere ich alle wertvollen Metadaten (Zusammenfassung, Sentiment), die ich wollte, dass der Ideengenerator berücksichtigt. Nicht ideal.

Der Workaround: Verketten von Agenten innerhalb eines Agenten

Nach einigen Stunden Frustration beim Durchforsten ihrer (etwas spärlichen) Dokumentation und den Community-Foren, erkannte ich, dass die „Lösung“ nicht darin bestand, den visuellen Composer effektiver zu nutzen, sondern mehr Logik *in* meine benutzerdefinierten Agenten zu integrieren. Anstatt den visuellen Composer die Iteration orchestrieren zu lassen, musste ich meinen „Ideengenerator“-Agenten dafür verantwortlich machen, über die Liste zu iterieren, die er erhielt.

Das bedeutete, dass mein „Trendfilter“-Agent die gesamte Liste von Dictionaries produzieren würde. Dann musste der Python-Code meines benutzerdefinierten „Ideengenerator“-Agenten:

Die gesamte Liste als Eingabe erhalten.
Jedes Dictionary in der Liste durchlaufen.
Für jedes Dictionary einen separaten Aufruf an das zugrunde liegende LLM (über das SDK von AgentForge im Code dieses benutzerdefinierten Agenten) machen, um Ideen für dieses spezifische Thema zu generieren.
Alle generierten Ideen in einer einzigen Ausgabeliste zusammenfassen.

Hier ist ein vereinfachter Ausschnitt, wie der Code dieses benutzerdefinierten „Ideengenerator“-Agenten schließlich aussah:


# Dieser Code wird innerhalb des Benutzerdefinierten Agenten-Knotens von AgentForge ausgeführt
import json
from agentforge_sdk import Agent

def process_input(agent_input):
 try:
 news_items = json.loads(agent_input) # Angenommen, die Eingabe ist eine JSON-kodierte Zeichenkette der Liste
 except json.JSONDecodeError:
 return "Fehler: Die Eingabe ist kein gültiges JSON."

 all_ideas = []
 agent = Agent() # Initialisiere das AgentForge-SDK für LLM-Anfragen

 for item in news_items:
 topic = item.get("topic", "unbekanntes Thema")
 summary = item.get("summary", "")

 prompt = f"""
 Angesichts des Nachrichtenthemas: "{topic}" und seiner Zusammenfassung: "{summary}", 
 generiere 3 einzigartige Posting-Ideen für ein technikbegeistertes Publikum.
 Formatiere jede Idee als kurzen Absatz.
 """
 
 # Mache einen internen Aufruf an das LLM für jedes Element
 response = agent.generate_text(prompt=prompt, model="gpt-4-turbo") 
 all_ideas.append({
 "topic": topic,
 "generated_ideas": response.text.strip().split('\n\n') # Angenommen, die Ideen sind durch doppelte Zeilenumbrüche getrennt
 })
 
 return json.dumps(all_ideas) # Kombinierte Ergebnisse im JSON-Format ausgeben

Siehst du, was da passiert ist? Ich habe im Grunde ein Mini-Orchester *innerhalb* eines meiner Agenten geschaffen und damit komplett den ursprünglichen Zweck des visuellen Workflows für diese Art von Iteration umgangen. Auch wenn es funktioniert, untergräbt es den Grund, warum ich mich ursprünglich für AgentForge entschieden habe: um die repetitiven Codezeilen zu vermeiden, die nötig sind, um Unteraufgaben zu verwalten.

Bedingte Logik: Eine weitere manuelle Umgehung

Die nächste Herausforderung war die bedingte Logik. Ich wollte, dass der „Überprüfungs“-Agent nur dann Verbesserungsvorschläge macht, wenn die Ausgabe des „Inhaltsredakteurs“-Agenten eine Qualitätsbewertung unter einem bestimmten Schwellenwert erhielt (den ich intern festlegen würde). AgentForge verfügt über einen „Bedingten“-Knoten, der vielversprechend aussieht. Du definierst eine Bedingung basierend auf der Ausgabe des vorhergehenden Knotens und leitest dann in unterschiedliche Pfade weiter.

Noch einmal ist das visuelle Konzept ausgezeichnet. In der Praxis war es jedoch schwierig, die Bedingung zu definieren. Es verwendet eine einfache Ausdruckssprache, aber die komplexe Logik (wie „wenn das Gefühl negativ ist UND die Länge weniger als 100 Wörter beträgt“) wird schnell mühsam, um sie in ihrem Eingabefeld auf einer einzigen Zeile zu schreiben. Vor allem bedeutete es, einen „Qualitätsscore“ von meinem Agenten „Content Writer“ zu erhalten, dass dieser Agent selbst den Score generieren und ihn strukturiert in seine Ausgabe einfügen musste, damit der Knoten „Bedingung“ ihn analysieren konnte. Das hat wiederum mehr Verantwortung in die interne Logik des Agenten verschoben, anstatt in den Workflow-Composer.

Mein Agent „Content Writer“ musste etwas wie Folgendes produzieren:


{
 "post_draft": "Entdecken Sie diesen unglaublichen neuen KI-Agenten! #KI #Tech",
 "quality_score": 0.75,
 "sentiment": "positiv"
}

Dann konnte der Knoten „Bedingung“ überprüfen, ob `output.quality_score < 0.6`, um zu entscheiden, ob er es an den „Überprüfer“ oder direkt an einen Agenten der „Veröffentlichungswarteschlange“ senden sollte.

Es funktioniert, aber das bedeutet, dass jeder Agent sich stark bewusst sein muss, was der *nächste* Agent in der Kette erwartet und eine Ausgabe in einem sehr spezifischen und analysierbaren JSON-Format produzieren muss. Der visuelle Composer routet nur das JSON; er hilft nicht dabei, es zu strukturieren oder zu validieren.

Meine Schlussfolgerungen und was ich mir wünschen würde

Der Workflow-Composer von AgentForge ist ein großartiges Konzept, und für wirklich einfache und lineare Aufgaben ist es eine willkommene Erleichterung. Wenn Sie ein System aufbauen, in dem Agent A eine Sache macht, seine einzige Ausgabe an Agent B weitergibt, der eine andere Sache macht, und so weiter, ist das ziemlich großartig. Der visuelle Aspekt erleichtert das Verständnis des Flusses auf einen Blick.

Allerdings, sobald Sie gängige Programmierparadigmen wie Folgendes einführen:

**Iteration:** Verarbeitung einer Liste von Elementen, bei der jedes Element denselben Unter-Workflow durchlaufen muss.
**Komplexe bedingte Logik:** Verzweigung basierend auf mehreren Kriterien oder abgeleiteten Werten.
**Dynamische Agentenauswahl:** Entscheiden, welchen Agenten man als Nächstes anruft, basierend auf dem Inhalt der aktuellen Ausgabe.

… erreicht der visuelle Composer schnell seine Grenzen. Sie enden damit, einen Großteil dieser Orchestrierungslogik wieder in Ihre individuellen, benutzerdefinierten Agenten zu verschieben, was einen erheblichen Teil des Versprechens des visuellen Workflows in Frage stellt. Es wird weniger eine Frage des „Komponierens“ eines Workflows und mehr eine Frage des „Verbindens“ von vorgefertigten, eigenständigen Unter-Workflows.

Das sind die Dinge, die ich mir in Plattformen wie AgentForge (und ehrlich gesagt, den meisten anderen visuellen Agenten-Composern, die ich ausprobiert habe) wünschen würde:

1. Erstklassige Iterationsknoten

Ein „Für jede“-Knoten, der eine Liste als Eingabe entgegennimmt und Ihnen dann ermöglicht, visuell einen Unter-Workflow zu definieren, der für jedes Element dieser Liste ausgeführt wird, wobei die Ergebnisse am Ende aggregiert werden. Das wäre eine große Bereicherung für die Verarbeitung von Datenmengen.

2. Verbesserte bedingte Logik mit Ausdrucksgeneratoren

Leistungsfähigere und mehrzeilige Ausdrucks-Editoren für bedingte Knoten, möglicherweise mit Zugriff auf Hilfsfunktionen oder sogar einer vereinfachten Skriptsprache direkt im Knoten. Das würde eine sophistiziertere Verzweigung ermöglichen, ohne die gesamte Logik in die Agenten selbst zu integrieren.

3. Datenumwandlungs-Knoten

Knoten, die speziell dafür entworfen sind, Daten zwischen Agenten zu manipulieren. Stellen Sie sich einen „JSON-Transformer“-Knoten vor, in dem Sie eine einfache Mapping-Sprache (wie JMESPath oder eine visuelle Entsprechung) verwenden könnten, um Datenfelder vor der Übergabe an den nächsten Agenten zu extrahieren, umzubenennen oder umzuformen. Das würde die Anforderungen an die Agenten verringern, perfekt formatierte Daten für den nächsten Schritt zu liefern.

4. Bessere Fehlerbehandlung und Wiederholungen

Visuelle Konfiguration für Wiederholungen (mit einer Wartezeit) und Festlegung von Fehlerpfaden, wenn ein Agent fehlschlägt. Derzeit stoppt häufig der gesamte Prozess, wenn ein Agent inmitten eines komplexen Workflows einen Fehler erzeugt, und das Debuggen kann mühsam sein.

5. Visuelles Debugging und Inspektion

Die Möglichkeit, auf jeden Knoten in einem laufenden Workflow zu klicken und die genaue Eingabe und Ausgabe zu diesem Zeitpunkt zu sehen. Das ist entscheidend, um zu verstehen, warum sich ein Workflow nicht wie erwartet verhält.

Umsetzbare Ideen für Ihr nächstes KI-Agenten-Projekt

Was bedeutet das für Sie, wenn Sie eine Plattform wie AgentForge oder einen anderen visuellen Agenten-Composer in Betracht ziehen?

**Fangen Sie einfach an, und bewerten Sie dann:** Wählen Sie für Ihr erstes Projekt einen wirklich linearen Workflow aus. Das hilft Ihnen, sich mit der Plattform vertraut zu machen, ohne sofort auf ihre Grenzen zu stoßen.
**Verstehen Sie den Datenfluss:** Bevor Sie beginnen zu bauen, kartieren Sie die genaue Eingabe und Ausgabe (Schema!) für *jeden* Agenten. Hier scheitern die meisten Projekte mit visuellen Composern.
**Kümmern Sie sich nicht um den „Benutzerdefinierten Agenten“-Code:** Obwohl das Ziel weniger Code ist, seien Sie bereit, Python (oder was auch immer die Plattform unterstützt) in Ihren benutzerdefinierten Agenten für komplexe Datenverarbeitung, Iterationen oder bedingte Logik zu schreiben, die der visuelle Composer nicht bewältigen kann.
**Adoptieren Sie JSON (oder ähnliche strukturierte Daten):** Stellen Sie sicher, dass Ihre Agenten so gestaltet sind, dass sie strukturierte Daten ausgeben, die von den nachfolgenden Agenten oder den bedingten Knoten leicht analysiert werden können. Eine reine Textausgabe ist ein schneller Weg zu Problemen.
**Prototypisieren Sie zuerst die schwierigen Teile:** Wenn Ihr Workflow eine Komplexität in der Iteration oder Verzweigung hat, versuchen Sie zunächst, eine kleine isolierte Version dieses spezifischen Teils zu bauen. Konstruieren Sie nicht das ganze System, nur um herauszufinden, dass die grundlegende Logik visuell nicht umsetzbar ist.

Visuelle Agenten-Composer wie AgentForge sind ein Schritt in die richtige Richtung und senken zweifellos die Einstiegsbarriere für bestimmte Multi-Agenten-Systeme. Aber für alles über eine einfache Kette hinaus sollten Sie bereit sein, sich mit etwas mehr Code als das, was das Marketing vielleicht vorschlägt, die Hände schmutzig zu machen. Der Traum von einem vollständig codefreien KI-System, das durch Drag-and-Drop funktioniert, ist noch etwas entfernt, aber wir kommen näher, ein benutzerdefinierter Agent nach dem anderen.

Das war’s für diesen tiefgründigen Einblick! Lassen Sie es mich in den Kommentaren wissen, ob Sie ähnliche Erfahrungen mit AgentForge oder anderen Plattformen gemacht haben. Welche Funktionen würden Sie sich als Standard in visuellen Workflow-Composer wünschen? Ich bin immer gespannt auf Ihre Gedanken!

Ich teste intelligente Agenten für die Entwicklung in der realen Welt.

Der Traum: Visueller Workflow, ohne codebedingte Kopfschmerzen

Realitätscheck: Die Lücken treten zutage

Der Datenübergang: Mehr Traum als Pipeline

Der Workaround: Verketten von Agenten innerhalb eines Agenten

Bedingte Logik: Eine weitere manuelle Umgehung

Meine Schlussfolgerungen und was ich mir wünschen würde

1. Erstklassige Iterationsknoten

2. Verbesserte bedingte Logik mit Ausdrucksgeneratoren

3. Datenumwandlungs-Knoten

4. Bessere Fehlerbehandlung und Wiederholungen

5. Visuelles Debugging und Inspektion

Umsetzbare Ideen für Ihr nächstes KI-Agenten-Projekt

Verwandte Artikel

Related Articles

Leave a Comment Cancel Reply

Der Traum: Visueller Workflow, ohne codebedingte Kopfschmerzen

Realitätscheck: Die Lücken treten zutage

Der Datenübergang: Mehr Traum als Pipeline

Der Workaround: Verketten von Agenten innerhalb eines Agenten

Bedingte Logik: Eine weitere manuelle Umgehung

Meine Schlussfolgerungen und was ich mir wünschen würde

1. Erstklassige Iterationsknoten

2. Verbesserte bedingte Logik mit Ausdrucksgeneratoren

3. Datenumwandlungs-Knoten

4. Bessere Fehlerbehandlung und Wiederholungen

5. Visuelles Debugging und Inspektion

Umsetzbare Ideen für Ihr nächstes KI-Agenten-Projekt

Verwandte Artikel

You May Also Like

📚 You Might Also Like

Related Articles

Leave a Comment Cancel Reply