Meine KI-Agenten können (noch) nicht zusammenarbeiten.

📖 12 min read•2,265 words•Updated Mar 30, 2026

Hey zusammen, Sarah hier von agnthq.com, und ich habe heute ein interessantes Thema für euch – oder besser gesagt, ein faszinierendes Thema, das wir gemeinsam erkunden können. Wir haben alle die Schlagzeilen gesehen, die atemberaubenden Vorhersagen über KI-Agenten, die unser Leben übernehmen. Aber wie sieht das eigentlich aus, wenn man versucht, etwas zu erledigen? Genauer gesagt, was passiert, wenn man versucht, eine Gruppe von KI-Agenten dazu zu bringen, zusammenzuarbeiten? Denn seien wir mal ehrlich, ein einzelner Agent ist cool, aber die wahre Magie (und die echten Kopfschmerzen) beginnen erst, wenn sie ein Team sein sollen.

In den letzten Wochen habe ich mich mit einem speziellen Problem auseinandergesetzt, das viele von euch vielleicht wiedererkennen: Ich musste eine Serie von Produktbeschreibungen für einen hypothetischen E-Commerce-Shop erstellen. Nicht irgendwelche Beschreibungen, versteht sich. Ich wollte, dass sie kreativ, ansprechend, SEO-freundlich und ausreichend unterschiedlich für verschiedene Produktkategorien sind (denkt an ausgefallene Haustierzubehörteile im Vergleich zu hochmodernen Küchen Gadgets). Dies manuell für Dutzende von Produkten zu erledigen, ist ein Albtraum. Es mit einem einzigen, monolithischen LLM-Prompt zu versuchen, führt oft zu generischem Schund. Also dachte ich, warum nicht eine Crew von KI-Agenten dafür einsetzen?

Das führte mich auf den Weg, Multi-Agenten-Orchestrierungsplattformen zu erkunden. Genauer gesagt, habe ich viel Zeit mit CrewAI verbracht, einem Framework, das in letzter Zeit viel Aufmerksamkeit erhalten hat. Mein Ziel war nicht nur zu sehen, ob es funktioniert, sondern auch die praktischen Aspekte, die Stolpersteine und die unerwarteten erfreulichen Erfahrungen zu verstehen, die mit dem Aufbau eines KI-Agententeams für eine reale Aufgabe verbunden sind. Dies ist kein theoretischer Ausflug; es geht darum, sich die Hände schmutzig zu machen und zu sehen, was passiert, wenn man einem Haufen digitaler Gehirne sagt, freundlich zu sein und die Arbeit zu erledigen.

Mein Frust mit “Single Brain” KI-Prompts

Bevor wir auf die Multi-Agenten-Sache eingehen, lasst uns die Szene setzen. Meine ersten Versuche, Produktbeschreibungen zu generieren, bestanden darin, einen massiven Prompt an ein LLM zu senden. Etwas wie: „Erzeuge 5 einzigartige Produktbeschreibungen für eine ‚Smart Coffee Maker‘. Mach sie ansprechend, SEO-optimiert für ‚beste Smart Coffee Maker 2026‘, füge einen Call to Action hinzu und variiere den Ton.“

Die Ergebnisse waren… in Ordnung. Sie waren nicht schlecht, fühlten sich aber oft so an, als wollten sie alle Anforderungen in jedem einzelnen Satz erfüllen. Die „Kreativität“ fühlte sich erzwungen an, die „SEO-Optimierung“ schien hinzugefügt zu sein, und der „varierte Ton“ bedeutete normalerweise, dass einer leicht enthusiastischer war als der andere. Es war, als würde man eine Person darum bitten, gleichzeitig Texter, SEO-Spezialist und Marketing-Strategist zu sein. Sie könnten in allem eine akzeptable Leistung erbringen, aber in keinem Bereich wirklich herausragend sein.

Hier beginnt die Idee des Multi-Agenten aufzukommen. Was wäre, wenn ich verschiedene Rollen zuweisen könnte? Was wäre, wenn ein Agent ein „Kreativer Texter“, ein anderer ein „SEO-Optimierer“ und ein dritter ein „Qualitätsprüfungs-Editor“ wäre? Könnten sie ihre Arbeit weitergeben, verfeinern und etwas wirklich Besseres produzieren?

Meine Crew einrichten: Das erste Design

Mein erster Schritt mit CrewAI war, die Rollen und Verantwortlichkeiten zu definieren. Das ist entscheidend. Genau wie in einem menschlichen Team, wenn jeder denkt, er mache die Arbeit der anderen, endet man im Chaos. Wenn die Rollen zu eng sind, gibt es Engpässe. Es ist eine delikate Balance.

So habe ich meine erste Crew zur Erstellung von Produktbeschreibungen strukturiert:

Der Produktforscher: Die Aufgabe dieses Agenten war es, einen rohen Produktnamen (z. B. „Smart Coffee Maker“) zu nehmen und wichtige Merkmale, Vorteile und Informationen zur Zielgruppe zu recherchieren. Ich wollte, dass er eine schnelle Online-Recherche simuliert.
Der Kreative Texter: Basierend auf der Recherche wurde dieser Agent beauftragt, fesselnde, ansprechende Beschreibungen zu erstellen, die die einzigartigen Verkaufsargumente und Vorteile des Produkts für den Kunden hervorheben.
Der SEO-Spezialist: Dieser Agent würde dann den Entwurf des Texters übernehmen und ihn mit relevanten Keywords anreichern, um sicherzustellen, dass er suchmaschinenoptimiert ist, ohne plump zu klingen. Er musste auch potenzielle Meta-Beschreibungen vorschlagen.
Der Qualitätsprüfungs-Editor: Schließlich würde dieser Agent die kombinierte Ausgabe auf Grammatik, Klarheit, Konsistenz und die allgemeine Einhaltung des (hypothetischen) Tons und der Richtlinien der Marke überprüfen. Er musste auch sicherstellen, dass alle ursprünglichen Anforderungen erfüllt wurden.

Jeder Agent benötigte ein spezifisches Ziel und eine Reihe von Werkzeugen. Zur Vereinfachung waren in diesem ersten Durchlauf ihre „Werkzeuge“ hauptsächlich ihr Zugang zum LLM (ich verwendete für dieses Experiment OpenAIs GPT-4, obwohl ich auch mit lokalen Modellen experimentiert habe). Die Schönheit von CrewAI ist, dass man Agenten mit echten Werkzeugen ausstatten kann – wie Web-Scrapern, API-Caller oder sogar Code-Interpretern – aber für diese spezifische Aufgabe war ihr interner „Denkprozess“ das Hauptwerkzeug.

Mein erster Versuch mit CrewAI: Code und Kontext

Schauen wir uns eine vereinfachte Version an, wie ich die Agenten und ihre Aufgaben eingerichtet habe. Dies ist nicht der vollständige, umfangreiche Code, aber genug, um ein Gefühl dafür zu bekommen, wie ich die Rollen definiert habe und wie sie interagieren.


from crewai import Agent, Task, Crew, Process
from langchain_openai import ChatOpenAI
import os

# Setze deinen OpenAI API-Schlüssel
os.environ["OPENAI_API_KEY"] = "DEIN_OPENAI_API_SCHLÜSSEL"
llm = ChatOpenAI(model_name="gpt-4-0125-preview") # Verwendung einer bestimmten GPT-4-Version

# Definiere die Agenten
product_researcher = Agent(
 role='Produktforscher',
 goal='Sammle wichtige Merkmale, Vorteile und Einblicke zur Zielgruppe für ein bestimmtes Produkt.',
 backstory="Du bist ein erfahrener Produktanalyst, der genau darauf achtet, den Kernwertvorschlag jedes Artikels zu finden.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)

creative_copywriter = Agent(
 role='Kreativer Texter',
 goal='Erstelle fesselnde, ansprechende Produktbeschreibungen, die die einzigartigen Verkaufsargumente und Vorteile für den Kunden hervorheben.',
 backstory="Du bist ein erfahrener Werbetexter, bekannt für deine Fähigkeit, Produkte unwiderstehlich zu machen.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)

seo_specialist = Agent(
 role='SEO-Spezialist',
 goal='Optimiere Produktbeschreibungen für Suchmaschinen, indem du relevante Keywords einfügst und Meta-Beschreibungen vorschlägst.',
 backstory="Du bist ein SEO-Guru, der sicherstellt, dass jedes Stück Inhalt hoch eingestuft wird und Verkehr anzieht.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)

qa_editor = Agent(
 role='Qualitätsprüfungs-Editor',
 goal='Überprüfe und verbessere Produktbeschreibungen hinsichtlich Grammatik, Klarheit, Konsistenz und Einhaltung der Marke.',
 backstory="Du bist ein gewissenhafter Editor mit einem scharfen Auge für Details, der sicherstellt, dass alle Texte perfekt sind.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)

# Definiere die Aufgaben
research_task = Task(
 description="Forsche nach dem 'Smart Coffee Maker' und identifiziere seine 5 besten Merkmale, 3 Hauptvorteile für den Nutzer und die ideale Zielgruppe.",
 agent=product_researcher,
 expected_output="Eine Auflistung von Merkmalen, Vorteilen und einer Zielgruppenanalyse für den 'Smart Coffee Maker'."
)

copywrite_task = Task(
 description="Verwende die bereitgestellten Recherchen, um eine 200-Wörter fesselnde Produktbeschreibung für den 'Smart Coffee Maker' zu schreiben. Konzentriere dich auf Storytelling und Kundenanwerbung.",
 agent=creative_copywriter,
 context=[research_task], # Das ist entscheidend: Ausgabe der vorherigen Aufgabe übergeben
 expected_output="Eine 200-Wörter fesselnde Produktbeschreibung."
)

seo_task = Task(
 description="Optimiere die bereitgestellte Produktbeschreibung für SEO. Schlage 3 Hauptkeywords vor und integriere sie natürlich. Schlage außerdem eine Meta-Beschreibung (150-160 Zeichen) vor.",
 agent=seo_specialist,
 context=[copywrite_task],
 expected_output="Die SEO-optimierte Produktbeschreibung mit Keyword-Vorschlägen und einer Meta-Beschreibung."
)

qa_task = Task(
 description="Überprüfe die SEO-optimierte Produktbeschreibung auf Klarheit, Grammatik, Tonkonsistenz und allgemeine Qualität. Stelle sicher, dass sie alle ursprünglichen Anforderungen erfüllt.",
 agent=qa_editor,
 context=[seo_task],
 expected_output="Die endgültige, optimierte Produktbeschreibung, bereit zur Veröffentlichung."
)

# Instanziiere die Crew
product_description_crew = Crew(
 agents=[product_researcher, creative_copywriter, seo_specialist, qa_editor],
 tasks=[research_task, copywrite_task, seo_task, qa_task],
 process=Process.sequential, # Aufgaben werden nacheinander ausgeführt
 verbose=True # Detaillierte Protokolle der Agentenaktivität anzeigen
)

# Starte die Crew
result = product_description_crew.kickoff()
print("\n######################################")
print("## Hier ist die endgültige Produktbeschreibung:")
print("######################################\n")
print(result)

Der context=[previous_task] Teil ist hier, wo die Magie passiert. Er sagt einem Agenten, dass er die Ausgabe einer vorhergehenden Aufgabe als seine Eingabe verwenden soll. So „kooperieren“ sie.

Das Gute, das Schlechte und das Unerwartete

Das Gute: Fokus und Qualität

Die sofortigste und bemerkbarste Verbesserung war die Qualität der Ausgabe. Die Beschreibungen fühlten sich kohärenter, zielgerichteter an. Der „Kreative Texter“ ging wirklich ins Storytelling hinein, und der „SEO-Spezialist“ schaffte es, Keywords einzufügen, ohne wie ein Roboter zu klingen. Der „QA-Editor“ erkannte einige ungeschickte Formulierungen, die ein LLM mit einem einzelnen Prompt möglicherweise übersehen hätte.

Ein Beispiel für einen „Smart Pet Feeder“:

Single-Prompt Ausgabe (Auszug): „Dieser smarte Haustierfütterer gibt automatisch Futter aus. Er verbindet sich mit dem WLAN und hat eine Kamera. Bester smarter Haustierfütterer für beschäftigte Besitzer.“

Multi-Agent Output (Auszug): “Stell dir vor, du musst dir nie wieder Sorgen um die Fütterungszeiten deines pelzigen Freundes machen. Unser revolutionärer Smart Pet Feeder ist nicht nur ein Futterspender; er ist ein Portal zur Sorgenfreiheit. Mit seiner integrierten HD-Kamera und nahtloser Wi-Fi-Konnektivität kannst du Fütterungen aus der Ferne planen, dein Haustier überwachen und sogar von überall aus mit ihm interagieren. Entdecke den besten smarten Futterspender für moderne Haustiereltern, die Bequemlichkeit und Verbindung verlangen.”

Siehst du den Unterschied? Die Multi-Agent-Version hat mehr Flair, einen besseren Fluss und integriert die SEO ganz natürlich.

Das Negative: Wortfülle und Kosten

Wie du vielleicht erwartest, ist es nicht billig, vier Agenten nacheinander mit GPT-4 zu betreiben. Der “Denkschritt” jedes Agenten umfasst mehrere LLM-Aufrufe. Wenn verbose=True gesetzt ist, siehst du alle internen Monologe, Beobachtungen und Aktionen. Während das unglaublich hilfreich für das Debugging und das Verständnis des Ablaufs ist, bedeutet es, dass viel mehr Tokens verbraucht werden. Mein “Smart Coffee Maker”-Durchlauf benötigte zum Beispiel etwa 15.000 Tokens, damit das gesamte Team eine Beschreibung abschließen konnte. Wenn ich das für 50 Produkte mache, summiert sich das schnell.

Ein weiteres Problem war gelegentliche Redundanz. Manchmal formulierte der SEO-Spezialist etwas um, was der Texter bereits gut optimiert hatte, was zu minoren stilistischen Konflikten führte, die der QA-Editor manchmal übersah. Es war, als hätte man zwei menschliche Experten, die beide ihren Stempel auf die Dinge setzen wollen.

Das Unerwartete: Emergenz und “Persönlichkeiten”

Das war der faszinierendste Teil. Trotz meiner eindeutigen Anweisungen schien jeder Agent eine subtile “Persönlichkeit” basierend auf seiner Vorgeschichte und seinem Ziel zu entwickeln. Der “Produktforscher” war sehr sachlich und fast klinisch. Der “Kreative Texter” war blumig und enthusiastisch. Der “SEO-Spezialist” suchte ständig nach Keyword-Möglichkeiten, manchmal zum Nachteil der Lesbarkeit (was der QA-Editor dann normalerweise behob). Es fühlte sich an, als würde ich eine kleine, funktionale digitale Bürokratie beobachten.

Ich beobachtete auch Fälle, in denen ein Agent leicht “Widerstand” leistete. Zum Beispiel könnte der SEO-Spezialist anmerken, dass ein Keyword gezwungen wirkte, oder der QA-Editor könnte auf eine logische Inkonsistenz hinweisen, die den anderen Agenten nicht sofort offensichtlich war. Dies war keine explizite Rebellion, sondern eher eine nuancierte Interpretation ihrer Rolle, was genau das ist, was man von einem spezialisierten Teammitglied erwartet.

Handlungsorientierte Erkenntnisse für deine eigenen Agenten-Teams

Rollen klar definieren, aber Überschneidungen zulassen: Gib jedem Agenten eine eindeutige Rolle und ein Ziel, verstehe jedoch, dass es in einem realen Szenario einige natürliche Überschneidungen geben wird. Gestalte deine Aufgaben so, dass Konflikte minimiert werden, aber erlaube den Agenten, auf der Arbeit des anderen aufzubauen.
Starte einfach und iteriere: Mein ursprüngliches Team bestand aus vier Agenten, die nacheinander arbeiteten. Wenn du dich wohler fühlst, kannst du komplexere Prozesse (wie hierarchische oder gleichzeitige Aufgaben) erkunden und mehr spezialisierte Agenten oder Tools hinzufügen. Versuche nicht, am ersten Tag die ultimative KI-Organisation aufzubauen.
Kontext ist entscheidend: Der context-Parameter in CrewAI ist entscheidend. Er bestimmt, wie Agenten kommunizieren und auf früheren Arbeiten aufbauen. Denke sorgfältig darüber nach, welche Informationen jeder Agent von seinen Vorgängern benötigt.
Beobachte deine Token-Zählung (und deine Brieftasche): Ausführliches Logging ist großartig für die Entwicklung, aber ziehe in Betracht, es auszuschalten oder günstigere Modelle für Produktionsläufe zu verwenden, besonders wenn du viele Daten verarbeitest. Sei dir bewusst, wie viele LLM-Aufrufe der “Denkschritt” jedes Agenten generiert.
Experimentiere mit Vorgeschichten und Tools: Die backstory ist nicht nur ein schicker Text; sie hilft, den Ansatz des Agenten zu formen. Und sobald du dich mit dem grundlegenden Ablauf wohlfühlst, beginne, tatsächliche Tools (Websuche, API-Aufrufe, benutzerdefinierte Python-Funktionen) zu integrieren, um deine Agenten zu verstärken.
Umarm den Schlamassel: Es wird beim ersten Versuch nicht perfekt sein. Du wirst sehen, dass Agenten stecken bleiben, Anweisungen falsch interpretieren oder weniger als idealen Output erzeugen. Das ist Teil des Lernprozesses. Genauso wie bei der Leitung eines menschlichen Teams erfordert es Verfeinerung und klare Kommunikation.

Das Erstellen von KI-Agententeams dreht sich nicht nur darum, Aufforderungen aneinanderzureihen; es geht darum, einen Workflow zu entwerfen, Verantwortlichkeiten zu definieren und die Zusammenarbeit zwischen digitalen Entitäten zu fördern. Es ist eine mächtige Möglichkeit, komplexe Aufgaben zu bewältigen, die einen einzelnen LLM-Aufruf überwältigen würden, und obwohl es eigene Herausforderungen mit sich bringt, ist das Potenzial für wirklich intelligente Automatisierung immens.

Ich bin wirklich gespannt, wohin das führt. Die Fähigkeit, ein großes Problem in kleinere, spezialisierte Aufgaben zu zerlegen und KI-Agenten jede Aufgabe abwickeln zu lassen, während sie den Staffelstab weitergeben, fühlt sich wie ein bedeutender Schritt nach vorne an. Es geht nicht nur darum, Dinge zu erledigen; es geht darum, Dinge besser zu erledigen. Also, geh hinaus, baue deine Teams und lass mich wissen, welche erstaunlichen Dinge sie erreichen!

🕒 Published: March 30, 2026

📊

Written by Jake Chen

AI technology analyst covering agent platforms since 2021. Tested 40+ agent frameworks. Regular contributor to AI industry publications.

Learn more →

Meine KI-Agenten können (noch) nicht zusammenarbeiten.

Mein Frust mit “Single Brain” KI-Prompts

Meine Crew einrichten: Das erste Design

Mein erster Versuch mit CrewAI: Code und Kontext

Das Gute, das Schlechte und das Unerwartete

Das Gute: Fokus und Qualität

Das Negative: Wortfülle und Kosten

Das Unerwartete: Emergenz und “Persönlichkeiten”

Handlungsorientierte Erkenntnisse für deine eigenen Agenten-Teams

Related Articles

Leave a Comment Cancel Reply

Mein Frust mit “Single Brain” KI-Prompts

Meine Crew einrichten: Das erste Design

Mein erster Versuch mit CrewAI: Code und Kontext

Das Gute, das Schlechte und das Unerwartete

Das Gute: Fokus und Qualität

Das Negative: Wortfülle und Kosten

Das Unerwartete: Emergenz und “Persönlichkeiten”

Handlungsorientierte Erkenntnisse für deine eigenen Agenten-Teams

You May Also Like

📚 You Might Also Like

Related Articles

Leave a Comment Cancel Reply