KI Wissensdatenbank 2026

KI Glossar 2026

Präzise Definitionen für die Ära von Agentic AI und Spatial Intelligence.

Agentic Business

Managed Agents (Verwaltete KI-Agenten)

Managed Agents bezeichnen KI-Agenten, die über eine verwaltete Infrastruktur bereitgestellt und betrieben werden. Im Gegensatz zur eigenen Hostinglösung übernimmt ein Plattformanbieter die komplette technische Infrastruktur – von der Bereitstellung und automatischen Skalierung bis hin zu Monitoring, Sicherheit und Betriebskontinuität. Der Begriff gewann 2026 prominente Bedeutung, als Anthropic Claude Managed Agents einführte: Entwickler können damit Claude-basierte Agenten ohne eigene Serverinfrastruktur betreiben. Eine Managed-Agent-Plattform umfasst typischerweise automatische Skalierung bei variablem Anfragevolumen, integriertes Logging und Tracing, Role-Based Access Control (RBAC) für Unternehmensumgebungen sowie OpenTelemetry-Integration für das Security-Monitoring in SIEM-Systemen. Für Unternehmen bedeutet das: kürzere Time-to-Production für KI-Agenten, geringere Betriebskosten und eine klare Trennung zwischen Agent-Logik und Infrastruktur. Besonders relevant ist das Konzept für nicht-technische Teams – Operations, Marketing oder Finance –, die eigene Arbeitsabläufe automatisieren wollen, ohne eine eigene KI-Infrastruktur aufzubauen. Managed Agents markieren damit den Übergang von experimentellen KI-Agenten zu produktionsreifen, governance-konformen Unternehmenslösungen.

Konzept entdecken
Agentic Infrastructure

Model Quality Drift (Modellqualitätsdrift)

Model Quality Drift bezeichnet den messbaren Qualitätsverlust eines KI-Modells im laufenden Betrieb. Ein System, das beim Rollout stabil funktioniert hat, liefert Wochen oder Monate später schlechtere Ergebnisse, obwohl derselbe Use Case bedient wird. Typische Ursachen sind veränderte Eingabedaten (Data Drift), neue Nutzeranfragen, geänderte Toolchains, Prompt-Updates oder Modell-Updates beim Anbieter. In der Praxis zeigt sich Drift oft zuerst in steigenden Korrekturaufwänden, mehr Halluzinationen, schlechterer Klassifikationsgüte oder längeren Bearbeitungszeiten in Agent-Workflows. Wichtig ist: Drift ist kein einmaliger Bug, sondern ein operatives Risiko. Deshalb braucht es kontinuierliche Qualitätskontrolle mit klaren Metriken, zum Beispiel Task-Erfolgsrate, Fehlerrate, Antwortkonsistenz und Business-KPIs pro Prozess. Unternehmen kombinieren dafür Offline-Evaluierungen auf stabilen Benchmark-Sets mit Online-Monitoring im Produktivbetrieb. Zusätzlich helfen Segmentanalysen nach Kundengruppe, Kanal oder Sprache, um Drift-Hotspots früh zu erkennen. Bei Abweichungen greifen abgestufte Gegenmaßnahmen wie Prompt-Rollback, Guardrail-Anpassungen, Routing auf andere Modelle oder gezieltes Fine-Tuning. Ergänzend werden häufig Canary-Rollouts und automatische Alarm-Schwellen eingesetzt, damit Qualitätsabfälle nicht erst beim Kunden auffallen. So bleibt KI-Leistung über Zeit steuerbar statt zufällig.

Konzept entdecken
Agentic Infrastructure

Model Routing (Modellauswahl)

Model Routing bezeichnet die Praxis, eingehende Anfragen oder Aufgaben automatisch dem am besten geeigneten KI-Modell zuzuweisen – abhängig von Aufgabentyp, erforderlicher Qualität, Kosten und Latenzanforderungen. In einem modernen KI-Agenten-Stack steht nicht mehr ein einzelnes Modell im Mittelpunkt, sondern ein Ensemble aus Frontier-Modellen, Open-Source-Alternativen und spezialisierten Systemen. Model Routing entscheidet, welches Modell welche Anfrage bearbeitet. Typische Routing-Strategien umfassen: Task-basiertes Routing (komplexe Reasoning-Aufgaben an leistungsfähige Frontier-Modelle wie Claude Opus oder GPT-5.5, einfachere Aufgaben an kleinere, günstigere Modelle), Kostenbasiertes Routing (Anfragen unterhalb eines Komplexitätsschwellwerts werden automatisch an günstigere Open-Source-Modelle wie DeepSeek V4 oder Llama 4 umgeleitet), Latenzbewusstes Routing (zeitkritische Anfragen gehen an Modelle mit niedrigstem Response-Time-Profil) und Fallback-Routing (bei Ausfall oder Überlastung eines primären Modells übernimmt automatisch ein Ersatzmodell). In KI-Agenten-Architekturen wie OpenClaw ist Model Routing ein kritischer Infrastrukturbaustein: Er schafft die Flexibilität, Leistung und Kosten der verschiedenen Modelle optimal auszubalancieren und gleichzeitig Anbieter-Unabhängigkeit zu wahren.

Konzept entdecken
Agentic Infrastructure

Mixture-of-Experts (MoE)

Mixture-of-Experts (MoE) ist eine neuronale Netzwerkarchitektur, bei der ein Modell aus mehreren spezialisierten Teilnetzwerken – sogenannten Experten – besteht, kombiniert mit einem erlernten Gating-Mechanismus, der jeden Eingabe-Token dynamisch zu den relevantesten Experten weiterleitet. Anstatt bei jedem Token alle Parameter zu aktivieren, wählt ein MoE-Modell pro Vorwärtsdurchlauf nur eine kleine Teilmenge der Experten aus – typischerweise zwei bis acht von Dutzenden. Das reduziert den aktiven Rechenaufwand erheblich, ohne die Gesamtkapazität zu verringern. Google Brain popularisierte dieses Konzept mit dem Switch Transformer, Mistral AI brachte es mit Mixtral 8x7B und 8x22B in die Open-Source-Community. Heute nutzen GPT-4, Gemini 1.5 Pro, DeepSeek V3 und GLM-5 alle MoE-Architekturen. MoE ermöglicht es, die Gesamtanzahl der Parameter auf Hunderte von Milliarden oder gar Billionen zu skalieren, ohne dass die Inferenzkosten proportional steigen: Ein MoE-Modell mit 700 Milliarden Parametern aktiviert pro Token möglicherweise nur 40 bis 70 Milliarden, was den Betriebskosten eines weit kleineren dichten Modells entspricht. Der entscheidende Kompromiss ist der Speicherbedarf: Alle Expertengewichte müssen während der Inferenz im VRAM liegen, auch wenn nur ein Bruchteil genutzt wird. MoE ist heute ein grundlegendes Muster in der Frontier-KI-Entwicklung, das die Wissenskapazität eines massiven Modells zu den Kosten eines kompakten ermöglicht. Bei Context Studios ist das Verständnis von MoE essenziell, wenn wir Kunden bei der GPU-Infrastruktur für Self-Hosted-Deployments beraten.

Konzept entdecken
Agentic Business

Multi-Agenten-Kommunikation

Multi-Agenten-Kommunikation bezeichnet die Protokolle, Mechanismen und Patterns, über die mehrere KI-Agenten miteinander interagieren, Informationen austauschen und Aufgaben koordinieren. In komplexen KI-Systemen arbeiten spezialisierte Agenten zusammen: Ein Orchestrator koordiniert Sub-Agenten für Recherche, Schreiben, Qualitätsprüfung und Publishing. Die dominanten Kommunikationsmodelle: Direktes Orchestrieren (übergeordneter Agent ruft Sub-Agenten auf), MCP (Model Context Protocol) von Anthropic als standardisierter Tool-Aufruf-Protokoll zwischen Agenten und externen Diensten, A2A (Agent-to-Agent Protocol) von Google als offenem Standard für Peer-Kommunikation, sowie Message-Queue-basierte Systeme für asynchrone Kommunikation. Kritische Design-Entscheidungen: Synchron vs. asynchron (synchron = einfacher, asynchron = skalierbarer); Push vs. Pull; Fehlerhandling (was passiert, wenn ein Sub-Agent ausfällt?); Zustandsmanagement (wie wird gemeinsamer Kontext konsistent gehalten?). Jede Agent-zu-Agent-Schnittstelle muss explizit spezifiziert, versioniert und unabhängig getestet werden. Praxisbeispiel: Ein Content-Erstellungs-Multi-Agent-System besteht aus Recherche-Agent (holt aktuelle Daten via MCP), Schreib-Agent (erhält Research-Output, generiert Draft), Qualitäts-Agent (prüft Draft gegen Regeln) und Publishing-Agent (veröffentlicht genehmigten Content). Ohne klare Kommunikationsverträge werden Multi-Agenten-Systeme fragil und schwer zu debuggen.

Konzept entdecken
Reasoning & Verlässlichkeit

Multimodale KI

Multimodale KI bezeichnet künstliche Intelligenzsysteme, die Informationen über mehrere Datenmodalitäten hinweg verarbeiten, verstehen und generieren können – darunter Text, Bilder, Audio, Video und strukturierte Daten – innerhalb eines einzigen, einheitlichen Modells. Anders als unimodale Systeme, die auf einen Datentyp spezialisiert sind, können multimodale KI-Modelle gleichzeitig über Modalitäten hinweg schlussfolgern: ein Bild beschreiben, Fragen zu einem Video beantworten, Sprache transkribieren und analysieren oder Bilder aus Textbeschreibungen generieren. Die Transformer-Architektur, die von Google Brain entwickelt und später von OpenAI, DeepMind und Anthropic verfeinert wurde, erwies sich durch Attention-Mechanismen, die einheitlich über diverse Token-Sequenzen operieren, als natürlich geeignet für multimodales Lernen. Wegweisende multimodale Modelle sind OpenAIs GPT-4V und GPT-4o, Google DeepMinds Gemini 1.5 und 2.0, Anthropics Claude-3-Familie und Metas Llama 3.2 Vision. ByteDances Seedance 2.0 ist ein Beispiel für multimodale KI in der Videogenerierung. Die praktischen Anwendungen multimodaler KI reichen von Gesundheitswesen (gemeinsame Analyse von Bildbefunden und klinischen Notizen) über Fertigung (Kombination von Sensordaten mit visueller Inspektion) bis zu Handel (Bildersuche nach Produkten) und Medien (automatische Videountertitelung). Multimodale KI wird schnell zum Standard-Paradigma für Foundation Models. Bei Context Studios setzen wir multimodale KI in Kundenanwendungen ein – von Dokumentenintelligenz-Pipelines, die Text und eingebettete Bilder verarbeiten, bis zu Produktvisualisierungstools.

Konzept entdecken