KI Glossar 2026

Präzise Definitionen, verwandte Konzepte und praktische Einordnungen für AI Agents, LLM-Infrastruktur, Governance und produktive KI-Systeme.

580 Begriffe·10 Kategorien·Kuratiert von Context Studios

Überblick

Was ist das KI Glossar?

Das KI Glossar von Context Studios ist eine kuratierte Wissensdatenbank für Begriffe rund um AI Agents, LLMs, Agentic Workflows, Governance, Compliance, Inferenz, Modellinfrastruktur und produktive KI-Software.

Für wen ist das Glossar?

Für Gründer, CTOs, Produktteams und Entscheider, die KI-Begriffe schnell einordnen möchten.

Was macht die Definitionen nützlich?

Jeder Begriff ist kurz erklärt, kategorisiert und mit verwandten Konzepten verbunden.

Wie finde ich den richtigen Begriff?

Nutzen Sie Suche, Kategorien oder den A-Z-Index, um Konzepte und Beziehungen zu entdecken.

KI-Kerntechnologie
1M Token Context Window
Ein 1-Million-Token-Kontextfenster ist die Fähigkeit von großen Sprachmodellen, Informationen aus einem Dokument oder Gespräch von bis zu 1 Million Tokens zu verarbeiten und zu behalten. Dies ermöglicht die Analyse ganzer Codebasen, Bücher oder längerer Gespräche, ohne den Kontext zu verlieren.
Verwandt:Token Window Management Context Window Kontextfenster
KI-Ökonomie & Kosten
Agent Economics (KI-Agenten-Ökonomie)
Agent Economics beschreibt die Kostenstruktur, Effizienzlogik und wirtschaftlichen Abwägungen beim Betrieb von KI-Agenten in produktiven Systemen. Im Unterschied zu klassischen Softwarekosten entstehen bei Agenten variable Betriebskosten pro Aufgabe: jeder Agentenlauf verbraucht Tokens, belegt Kontextfenster und erzeugt Inferenzkosten – und das oft über mehrere Modellaufrufe, Werkzeugnutzungen und Denkschritte hinweg. Ein zentrales Konzept der Agent Economics ist die Kosten-pro-Aufgabe-Metrik (Cost per Task), die den Gesamtverbrauch eines Agenten über einen vollständigen Arbeitszyklus erfasst. Diese Kennzahl ersetzt in agentenbasierten Systemen die klassische Metrik Kosten pro API-Aufruf, da ein einziger Agentenlauf Dutzende von Modellaufrufen umfassen kann. Hinzu kommen Designentscheidungen wie Model Routing (günstigere Modelle für einfache Teilaufgaben) und Kontextbudgetierung (Begrenzung des Kontextfensters je Teilschritt), die erheblichen Einfluss auf die Gesamtkosten haben. Mit der zunehmenden Verbreitung von KI-Agenten in Entwicklungsteams – etwa für Code-Review, Dokumentation oder autonomes Testing – wird Agent Economics zu einer operativen Kernkompetenz. Unternehmen, die Agenten ohne Kostenkontrolle einsetzen, riskieren unkontrolliertes Token-Wachstum; wer hingegen systematisch Routing-Strategien, Kontextlimits und Aufgabenabschnitte optimiert, erzielt signifikant niedrigere Kosten bei vergleichbarer Ausgabequalität. Agent Economics ist damit nicht nur eine Finanzfrage, sondern beeinflusst direkt, welche Agenten-Workflows in der Praxis skalierbar und nachhaltig eingesetzt werden können.
Verwandt:Agentic Compute (agentengetriebene Rechenlast)Model Routing (Modellauswahl)Token Telemetry (Token-Telemetrie)
Compliance & Regulierung
Agent Governance
Frameworks und Tools zur Überwachung, Steuerung und Compliance-Sicherung von autonomen KI-Agenten im Unternehmenseinsatz.
Verwandt:KI-Governance EU AI Act Compliance
Agentic AI & Agenten
Agent Handoff (KI-Agenten-Übergabe)
Agent Handoff beschreibt den strukturierten Übergabeprozess zwischen zwei oder mehreren KI-Agenten in einem Multi-Agenten-System. Dabei übergibt ein ausführender Agent eine aktive Aufgabe zusammen mit dem gesamten Kontext, den Zwischenergebnissen und der Zielbeschreibung an einen anderen Agenten – entweder an einen spezialisierten Sub-Agenten, einen Peer-Agenten oder einen übergeordneten Orchestrator. Ein funktionsfähiger Agent Handoff basiert auf drei Kernelementen: erstens der vollständigen Kontextübertragung, die alle für die Aufgabenfortführung notwendigen Informationen enthält; zweitens einem definierten Übergabeprotokoll, das Bedingungen, Auslöser und Verantwortlichkeiten festlegt; drittens einer robusten Fehlerbehandlung, die sicherstellt, dass ein fehlgeschlagener Handoff erkannt, protokolliert und neu initiiert wird. In der Praxis tritt Agent Handoff in agentengesteuerten Pipelines auf, in denen Planung, Implementierung, Review und Deployment auf spezialisierte Agenten verteilt sind. Ein Planungsagent erstellt die Aufgabenstruktur, übergibt sie an einen Coding-Agenten, der das Ergebnis wiederum an einen Validierungsagenten weiterleitet. Jeder Handoff ist ein kritischer Übergabepunkt, an dem Informationsverlust oder Fehlkommunikation die gesamte Pipeline gefährden können. Für skalierte Agentenarchitekturen ist ein gut definierter Handoff-Mechanismus entscheidend: Er ermöglicht parallele Verarbeitung, reduzierten Kontext-Overhead pro Agent und eine klare Verantwortlichkeitsverteilung. Moderne Frameworks wie LangGraph, AutoGen oder das MCP-Protokoll bieten standardisierte Handoff-Muster als Teil ihrer Orchestrierungsschicht.
Verwandt:AI Orchestration (KI-Orchestrierung)AI Agent Control Plane (KI-Agenten-Kontrollebene)Workflow-Orchestrierung (Workflow Orchestration)
Agentic AI & Agenten
Agent HQ
GitHubs Multi-Agent-Orchestrierungsplattform, die Entwicklern das Wechseln zwischen Claude, Codex und Copilot-Agenten in einer einheitlichen Oberfläche ermöglicht. Verwandelt GitHub von einem Tool-Anbieter in einen KI-Agent-Orchestrator.
Agentic AI & Agenten
Agent Loop
Der grundlegende iterative Prozess von KI-Agenten: Kontext sammeln, handeln, Ergebnisse pruefen und wiederholen bis zum Ziel.
KI-Infrastruktur
Agent Observability (KI-Agenten-Beobachtbarkeit)
Agent Observability bezeichnet die Fähigkeit, das Verhalten, den Zustand und die Entscheidungsprozesse von KI-Agenten in Echtzeit zu überwachen, zu messen und zu verstehen. Im Gegensatz zu klassischer Software-Observability – die typischerweise Logs, Metriken und Traces umfasst – müssen bei KI-Agenten zusätzlich semantische Ebenen erfasst werden: Welche Aufgaben führt der Agent gerade aus? Welche Tools werden aufgerufen? Wie viele Token werden pro Schritt verbraucht? Wo entstehen Engpässe oder unerwartete Abweichungen im Ablauf? Zu den typischen Observability-Daten für KI-Agenten gehören: Task-Status und Fortschrittsmetriken, Tool-Call-Protokolle mit Ein- und Ausgaben, Token-Verbrauch pro Aktion, Latenz einzelner Reasoning-Schritte sowie Fehler- und Retry-Muster. Moderne Plattformen wie Langfuse, Arize Phoenix oder das Hermes-Dashboard bieten Visualisierungen, die diese Signale aggregieren und für Engineering-Teams direkt auswertbar machen. Agent Observability ist die operative Grundlage für verlässlichen KI-Agenten-Betrieb: Ohne sie ist es kaum möglich, Qualitätsdrift frühzeitig zu erkennen, Kapazitätsplanungen datenbasiert vorzunehmen oder Sicherheitsaudits zu belegen. Für Unternehmen, die KI-Agenten in produktiven Workflows einsetzen, ist Observability kein optionales Feature, sondern eine betriebliche Notwendigkeit und ein wesentlicher Baustein einer nachhaltigen KI-Strategie.
Verwandt:Observability (KI-Systeme)AI Agent Operations (KI-Agenten-Betrieb)Token Telemetry (Token-Telemetrie)
Sicherheit & Souveränität
Agent Permission Profiles (KI-Agenten-Berechtigungsprofile)
Agent Permission Profiles sind wiederverwendbare Berechtigungsbündel, die festlegen, was ein KI-Agent in einer Laufzeitumgebung tun darf. Statt jedem Agenten pauschal Zugriff auf Dateien, Netzwerk, Shell, Datenbanken oder externe APIs zu geben, beschreibt ein Profil konkrete Rechte, Grenzen und Freigaberegeln. Ein einfaches Profil erlaubt zum Beispiel nur lesenden Zugriff auf ein Repository. Ein stärkeres Engineering-Profil darf Tests starten und Pull Requests vorbereiten, benötigt aber eine menschliche Freigabe für Produktionsänderungen. Ein Support-Profil kann Kundendaten lesen, aber keine Rechnungen ändern oder Secrets sehen. Wichtig ist der Unterschied zu allgemeiner KI-Governance: Permission Profiles sind kein abstraktes Regelwerk, sondern ein operativer Sicherheitsmechanismus in der Agent Runtime. Sie verbinden Least Privilege, Tool-Scopes, Approval-Flows, Audit Logs und oft auch Sandbox-Regeln zu einer konfigurierbaren Policy. Dadurch werden Agenten berechenbarer, ohne ihre Nützlichkeit zu zerstören. Teams können neue Agenten schneller starten, weil sie nicht jede Berechtigung einzeln neu diskutieren müssen, sondern bewährte Profile für Rollen wie Code Review, Recherche, Datenanalyse oder Deployment verwenden.
Verwandt:Agent Runtime (KI-Agenten-Laufzeitumgebung)AI Agent Security (KI-Agenten-Sicherheit)Agent Governance
Agentic AI & Agenten
Agent Pull Request (Autonome Code-Einreichung)
Ein Agent Pull Request bezeichnet den automatisierten Prozess, bei dem ein KI-Coding-Agent — wie Claude Code, OpenAI Codex oder ähnliche Systeme — selbstständig Codeänderungen umsetzt und diese als Pull Request (PR) in einem Versionskontrollsystem wie GitHub einreicht, ohne dass ein menschlicher Entwickler den Einreichungsschritt ausführen muss. Im Gegensatz zu herkömmlichen KI-Coding-Assistenten, die lediglich Vorschläge liefern, übernimmt ein agentisches System beim Agent Pull Request die vollständige Ausführungskette: Analyse der Aufgabe, Implementierung der Änderungen, Ausführung von Tests, Behebung von Fehlern und abschließende Einreichung des Code-Reviews. Dieser Ablauf kann vollautomatisch oder im Rahmen eines Human-in-the-Loop-Modells erfolgen, bei dem ein Entwickler den fertigen PR vor dem Merge prüft. Der Begriff wurde durch Protokolle wie den Agent PR Protocol geprägt und beschreibt einen der zentralen Anwendungsfälle agentengetriebener Software-Entwicklung. Typische Einsatzszenarien umfassen automatisiertes Bug-Fixing, die Implementierung kleiner Feature-Requests, Code-Refactoring nach festgelegten Standards sowie die Generierung von Tests für bestehenden Code. Die Qualitätssicherung eines Agent Pull Request erfolgt üblicherweise durch Diff-First-Review-Methoden, automatisierte CI/CD-Pipelines und ergänzende KI-Code-Sicherheitsprüfungen. In größeren Organisationen werden Agent Pull Requests in spezifische Review-Loops eingebettet, um Konsistenz und Rückverfolgbarkeit sicherzustellen. Das Konzept des Agent Pull Request ist ein Kernbestandteil moderner agentenbasierter Entwicklungsworkflows und markiert den Übergang von KI als passivem Assistenten hin zu KI als aktivem Contributor im Software-Entwicklungsprozess.
Verwandt:AI Coding Agents (KI-Codieragenten)Deterministischer Workflow (Deterministic Workflow)Agent Observability (KI-Agenten-Beobachtbarkeit)
KI-Infrastruktur
Agent Runtime (KI-Agenten-Laufzeitumgebung)
Eine Agent Runtime ist die technische Laufzeitumgebung, in der KI-Agenten Aufgaben planen, Tools aufrufen, Daten lesen, Zwischenergebnisse speichern und mit anderen Systemen interagieren. Sie ist mehr als ein Modell-Wrapper: Zur Runtime gehören Identität und Berechtigungen, Tool-Registrierung, Speicher- und Kontextverwaltung, Ausführungsregeln, Fehlerbehandlung, Logging, Observability und oft auch Handoff-Mechanismen zwischen Agenten. In einfachen Prototypen steckt diese Logik häufig in Skripten oder Prompt-Ketten. In produktiven Unternehmenssystemen wird sie zur stabilen Betriebsschicht, die entscheidet, welche Aktion ein Agent ausführen darf, wie lange ein Task läuft, welche Kosten entstehen und wie Ergebnisse überprüft werden. Dazu kommen Schutzmechanismen wie Rate Limits, Freigaben, Sandboxes und Wiederanlaufregeln, damit ein Agent nicht unbemerkt falsche Daten nutzt oder gefährliche Aktionen wiederholt. Dadurch lassen sich Agenten reproduzierbarer, sicherer und besser auditierbar betreiben. Der Begriff ist wichtig, weil viele Agentenprojekte nicht am Modell scheitern, sondern an der fehlenden Laufzeitarchitektur: Ohne Runtime gibt es keine sauberen Grenzen für Tools, keine belastbaren Logs und keine klare Verantwortung bei Fehlern.
Verwandt:AI Orchestration (KI-Orchestrierung)AI Agent Operations (KI-Agenten-Betrieb)Agent Observability (KI-Agenten-Beobachtbarkeit)
KI-Infrastruktur
Agent Runtime Architecture
Die Agent Runtime Architecture beschreibt die technische Ausführungsumgebung, in der KI-Agenten ihre Aufgaben verarbeiten, Werkzeuge aufrufen und Zustand verwalten. Sie umfasst die Laufzeitschicht zwischen dem Sprachmodell und den externen Systemen — also alles, was bestimmt, wie ein Agent Schritte plant, Fehler behandelt, parallele Aufgaben koordiniert und seinen Kontext über mehrere Sitzungen hinweg erhält. Zu den zentralen Komponenten gehören der Orchestrator (der den Ablauf steuert), die Tool-Registry (welche Werkzeuge verfügbar sind), der Session-State (kurzfristiges Gedächtnis) sowie persistente Workspaces (für langfristige Aufgaben). Moderne Runtimes wie OpenAI Agents SDK v0.14, LangGraph oder Anthropics eigene Agenten-Infrastruktur unterscheiden sich vor allem darin, wie sie mit Zustand, Parallelisierung und Fehlertoleranz umgehen. Eine robuste Agent Runtime ist entscheidend, wenn Agenten nicht nur einzelne Anfragen beantworten, sondern mehrstündige Workflows mit vielen Zwischenschritten, Toolaufrufen und möglichen Unterbrechungen zuverlässig durchführen sollen.
Verwandt:Managed Agents (Verwaltete KI-Agenten)Agentic Coding Tool Use
Agentic AI & Agenten
Agent Teams
Agententeams ist eine Funktion, die die parallele Koordination mehrerer KI-Agenten ermöglicht, die gemeinsam an komplexen Aufgaben arbeiten. Anstatt dass ein einzelner Agent sequenziell arbeitet, arbeiten mehrere spezialisierte Agenten zusammen, wobei jeder verschiedene Aspekte eines Problems gleichzeitig bearbeitet.
Sicherheit & Souveränität
Agent Trust Boundary (KI-Agenten-Vertrauensgrenze)
Eine Agent Trust Boundary ist die klare Sicherheitsgrenze, die festlegt, welchen Informationen, Dateien, Tools und Ausgaben ein KI-Agent vertrauen darf. In klassischen Anwendungen liegt diese Grenze oft zwischen Nutzer, Server und Datenbank. Bei Coding-Agents und autonomen Workflows verschiebt sie sich: Der Agent liest Repository-Dateien, führt Befehle aus, ruft APIs auf und verarbeitet Inhalte, die selbst manipuliert sein können. Eine gute Vertrauensgrenze trennt deshalb Systemanweisungen von Projektdateien, markiert externe Inhalte als untrusted data, beschränkt Schreib- und Netzrechte und erzwingt Prüfungen, bevor der Agent Code, Builds oder Deployments beeinflusst. Besonders wichtig ist das bei Prompt Injection, Supply-Chain-Risiken und Tool-Use, weil schädliche Anweisungen aus README-Dateien, Tickets oder Webinhalten wie legitime Arbeitsanweisungen wirken können. Die Grenze ist kein einzelnes Feature, sondern ein Designprinzip für Laufzeit, Berechtigungen, Logging und menschliche Freigaben. Ohne sie wird ein produktiver Agent schnell zu einem Prozess, der zu viel lesen, zu viel ausführen und Fehler zu spät sichtbar machen kann.
Verwandt:AI Agent Security (KI-Agenten-Sicherheit)Agent Permission Profiles (KI-Agenten-Berechtigungsprofile)Prompt Injection Defense
KI-Infrastruktur
Agent-Accessible APIs (agentenfähige APIs)
Agent-Accessible APIs sind Programmierschnittstellen, die nicht nur für menschliche Entwickler, sondern explizit für KI-Agenten entworfen werden. Der Kern ist Maschinenlesbarkeit: klare OpenAPI- oder JSON-Schema-Definitionen, eindeutige Parameter, stabile Feldnamen und konsistente Fehlermeldungen. Für Agenten ist außerdem wichtig, dass Operationen deterministisch und idempotent sind, damit sie bei Retries keine doppelten Buchungen, Bestellungen oder Änderungen auslösen. Gute agentenfähige APIs kombinieren diese Designprinzipien mit feingranularen Berechtigungen, nachvollziehbaren Audit-Logs, Rate Limits und klaren Guardrails. In modernen Agent-Stacks werden solche APIs oft als Tools exponiert – etwa über das Model Context Protocol (MCP) – sodass Modelle Funktionen finden, aufrufen und Ergebnisse strukturiert zurückgeben können. Ohne diese API-Qualität bleiben Agenten in manuellen Workarounds hängen: sie scrapen Oberflächen, scheitern an unsteten Antworten oder produzieren unsichere Nebenwirkungen. Agent-Accessible APIs sind deshalb ein Infrastrukturthema: Sie machen aus KI-Demos belastbare, automatisierbare Geschäftsprozesse.
Verwandt:MCP (Model Context Protocol)Tool Calling (Werkzeugaufruf)Schema-First Design
Agentic AI & Agenten
Agent-to-Agent Protocol (A2A)
Agent-to-Agent Protocol (A2A) ist ein agentic AI-Konzept in modernen KI-Systemen, das autonome Agenten-Fähigkeiten ermöglicht. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Systeme eigenständig arbeiten und gleichzeitig menschliche Aufsicht gewährleisten müssen.
Verwandt:Model Context Protocol (MCP)Multi-Agent Orchestration
KI-Engineering
Agent-Tool-Surface (Werkzeugoberfläche)
Die Agent-Tool-Surface (Werkzeugoberfläche eines Agenten) bezeichnet die Gesamtheit aller Werkzeuge, Funktionen und Schnittstellen, die ein KI-Agent zur Laufzeit aufrufen kann. Sie beschreibt nicht, wie ein einzelnes Werkzeug technisch angebunden ist, sondern wie breit das Handlungsspektrum des Agenten insgesamt ausfällt – vom Dateizugriff über API-Aufrufe bis hin zu Datenbankoperationen oder dem Versand von Nachrichten. Je größer diese Oberfläche, desto mehr Wege stehen dem Agenten offen, eine Aufgabe zu lösen, aber desto mehr Angriffsfläche, Fehlerquellen und unvorhersehbares Verhalten entstehen zugleich. Die Agent-Tool-Surface ist damit das Pendant zur klassischen Angriffsfläche aus der IT-Sicherheit, übertragen auf autonome Systeme. In der Praxis zeigt sich, dass ein bewusst kleiner, klar umrissener Werkzeugsatz oft zuverlässiger und sicherer arbeitet als ein überladenes Repertoire: Der Agent trifft fokussiertere Entscheidungen, lässt sich leichter testen und bietet weniger Spielraum für Missbrauch oder halluzinierte Aktionen. Das Konzept der minimalen Tool-Surface gewinnt mit dem Aufkommen schlanker Terminal-Agenten an Bedeutung, die mit nur einer Handvoll Werkzeuge funktionsreiche Alternativen übertreffen. Die Gestaltung der Werkzeugoberfläche wird so zu einer zentralen Architekturentscheidung beim Bau produktiver Agentensysteme.
Verwandt:Tool Use Agent Runtime (KI-Agenten-Laufzeitumgebung)Agent Permission Profiles (KI-Agenten-Berechtigungsprofile)
Agentic AI & Agenten
Agentic AI
KI-Systeme, die autonom denken, planen und mehrstufige Aufgaben ausführen, um spezifische Ziele zu erreichen, anstatt nur Text zu generieren.
Verwandt:Model Context Protocol (MCP)Multi-Agent Orchestration Claude Code
Sicherheit & Souveränität
Agentic AI Security
Agentic AI Security bezieht sich auf die Verwendung von KI-Agenten, um proaktiv Sicherheitsrisiken innerhalb von KI-Systemen und breiteren IT-Umgebungen zu identifizieren, zu bewerten und zu mindern. Es nutzt die autonomen Entscheidungsfähigkeiten von KI, um die Sicherheitslage und Reaktionszeiten zu verbessern.
Verwandt:AI Agent Security (KI-Agenten-Sicherheit)AI Code Security Review (KI-Code-Sicherheitsprüfung)Claude Code Security
Agentic AI & Agenten
Agentic Commerce Protocol
Von OpenAI und Stripe im Oktober 2025 veröffentlichter offener Standard, der es KI-Agenten ermöglicht, sichere Kauftransaktionen im Namen von Nutzern durchzuführen.
Verwandt:Agent-to-Agent Protocol (A2A)Model Context Protocol (MCP)
KI-Ökonomie & Kosten
Agentic Compute (agentengetriebene Rechenlast)
Agentic Compute bezeichnet die gesamte Rechen- und Ausführungslast, die entsteht, wenn KI-Agenten nicht nur eine einzelne Antwort erzeugen, sondern eigenständig mehrstufige Aufgaben ausführen. Dazu gehören Modellaufrufe, Tool Calling, Browser- und API-Zugriffe, Codeausführung, Speicherzugriffe, Retries und lange Laufzeiten. Der Begriff ist wichtig, weil sich Kosten und Betriebsrisiken bei Agenten anders verhalten als bei klassischem Chat-LLM-Verkehr. Bei einem normalen Chat skaliert der Aufwand grob mit Prompt- und Output-Token. Bei Agentic Compute skaliert er zusätzlich mit Schrittzahl, Parallelität, Tool-Nutzung, Schleifen sowie Beobachtungs- und Sicherheitslogik. Ein Coding-Agent, der Dateien liest, Tests startet, Logs prüft und mehrere Korrekturschleifen durchläuft, verbraucht daher deutlich mehr Ressourcen als eine einzelne Modellantwort. Für Architektur und Pricing bedeutet das: Unternehmen müssen nicht nur Tokenpreise betrachten, sondern Budgets pro Workflow, maximale Laufzeit, Concurrency-Limits, Tracing, Abbruchregeln und menschliche Freigaben definieren. Agentic Compute ist damit weniger ein einzelnes Modellmerkmal als ein Betriebsmodell für autonome KI-Systeme. Besonders in produktiven Unternehmensumgebungen wird der Begriff relevant, weil Autonomie ohne Kostenkontrolle schnell zu Budgetspitzen, unnötigen Schleifen oder schwer erklärbaren Betriebszuständen führen kann.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Managed Agents (Verwaltete KI-Agenten)Agent Runtime Architecture
KI-Engineering
Agentic Engineering (agentisches Engineering)
Agentic Engineering ist ein strukturierter Entwicklungsansatz, bei dem KI-Agenten nicht nur Code vorschlagen, sondern als kontrollierte Arbeitskräfte in den Softwareprozess eingebunden werden. Im Unterschied zu Vibe Coding basiert Agentic Engineering auf klaren Zielen, begrenztem Kontext, kleinen Pull Requests, Tests, Review-Schleifen und nachvollziehbaren Entscheidungen. Der Mensch bleibt verantwortlich für Architektur, Priorisierung, Sicherheitsregeln und Abnahme; der Agent übernimmt abgegrenzte Aufgaben wie Implementierung, Analyse, Refactoring oder Testergänzung. Entscheidend ist nicht, dass mehr Code schneller entsteht, sondern dass KI-generierte Arbeit prüfbar, reproduzierbar und produktionsreif wird. Gute agentische Engineering-Prozesse definieren Kontextbudgets, Tool-Berechtigungen, Akzeptanzkriterien, Rollback-Optionen und Messpunkte für Qualität, Kosten und Risiko. In der Praxis verbindet das Prompt-Design, Repository-Regeln, CI-Checks, Sicherheitsgrenzen und Dokumentation zu einem wiederholbaren Ablauf. Teams behandeln Agenten damit wie neue Mitglieder der Delivery-Pipeline: nützlich, schnell und skalierbar, aber nur innerhalb klarer Leitplanken. Dadurch wird KI-gestützte Entwicklung vom Experiment zu einem belastbaren Betriebsmodell für Teams, die regelmäßig mit Coding Agents in produktiven Codebasen arbeiten.
Verwandt:Agentic Coding AI Coding Agents (KI-Codieragenten)Deterministischer Workflow (Deterministic Workflow)
KI-Engineering
Agentic IDE (KI-native Entwicklungsumgebung)
Eine Agentic IDE ist eine Entwicklungsumgebung, in die ein autonomer KI-Agent fest integriert ist und die eigenständig mehrschrittige Programmieraufgaben übernimmt – von der Codeerstellung über das Refactoring bis zum Ausführen von Tests. Anders als eine klassische IDE mit reiner Autovervollständigung plant der Agent ganze Arbeitsabläufe, liest und verändert mehrere Dateien im Projektkontext und reagiert auf die Ergebnisse seiner eigenen Aktionen. Werkzeuge wie Cursor oder Windsurf stehen beispielhaft für diese Gattung: Sie verbinden die vertraute Oberfläche eines Editors mit einem Agenten, der den Quellcode versteht und Änderungen selbstständig vorschlägt oder direkt vornimmt. Die Agentic IDE unterscheidet sich vom terminalbasierten Coding-Agenten dadurch, dass Bedienung, Vorschau und Kontrolle in einer grafischen Oberfläche zusammenlaufen. Entscheidend ist das Zusammenspiel aus Projektkontext, Werkzeugzugriff und menschlicher Aufsicht: Der Agent schlägt Schritte vor, die Entwicklerin oder der Entwickler prüft, korrigiert und gibt sie frei. So verlagert sich die tägliche Arbeit von einzelnen Tastenanschlägen hin zur Steuerung und Überprüfung eines Agenten, der den Großteil der mechanischen Umsetzung übernimmt. Moderne Agentic IDEs binden zudem Versionskontrolle, Terminal und Testlauf direkt ein, sodass der Agent seine Änderungen nicht nur schreibt, sondern selbst überprüfen kann, bevor das Team sie übernimmt.
Verwandt:CLI Coding Agent Agentic Coding KI-Agenten-Framework (AI Agent Framework)
Agentic AI & Agenten
Agentic Payments
Agentic Payments bezeichnen die Fähigkeit eines autonomen KI-Agenten, eine Zahlung im Auftrag eines Nutzers eigenständig auszulösen, zu autorisieren und abzuschließen. Anders als beim klassischen Online-Bezahlen, bei dem ein Mensch jeden Schritt bestätigt, übernimmt hier der Agent die Transaktion: Er wählt das Produkt, prüft Preis und Konditionen und gibt die Zahlung innerhalb vorab definierter Grenzen frei. Damit das sicher funktioniert, stützen sich Agentic Payments auf mehrere Bausteine — eine eindeutige Agenten-Identität, fein granulierte Freigabe- und Ausgabenlimits sowie eine nachvollziehbare Protokollierung jeder Transaktion. Entscheidend ist dabei die klare Trennung der Verantwortlichkeiten zwischen Agent, Zahlungsdienst und Händler. Auslöser dieser Entwicklung sind Initiativen wie die Zahlungsanbindung von Visa und OpenAI, die es ChatGPT-Agenten erlauben, direkt bei Händlern zu bezahlen. Für Unternehmen verschiebt sich dadurch die Schnittstelle zum Kunden: Nicht mehr nur Menschen, sondern auch deren beauftragte Agenten lösen Käufe aus. Agentic Payments sind damit die Ausführungsebene des agentischen Handels — die konkrete Zahlungsfähigkeit, die auf standardisierten Protokollen und maschinenlesbaren Produktdaten aufsetzt und den gesamten Kaufvorgang ohne manuelle Eingriffe zu Ende bringt.
Verwandt:Agentic Commerce Protocol Agentic Product Feed (Produktfeed für KI-Agenten)KI-Agent-Identität (AI Agent Identity)
KI-Engineering
Agentic Product Feed (Produktfeed für KI-Agenten)
Ein Agentic Product Feed ist ein strukturierter Produktdatenstrom, der gezielt so aufbereitet ist, dass autonome KI-Agenten – etwa Einkaufsassistenten in ChatGPT oder auf anderen Agenten-Plattformen – Produkte zuverlässig finden, bewerten und kaufen können. Anders als ein klassischer Produktfeed für Preisvergleiche oder Google Shopping, der primär für menschliche Käufer und Suchmaschinen-Crawler optimiert ist, richtet sich ein Agentic Product Feed an maschinelle Konsumenten. Er liefert eindeutige, maschinenlesbare Attribute: präzise Produktbezeichnungen, Verfügbarkeit in Echtzeit, Preise inklusive Steuern, Lieferbedingungen, Rückgaberichtlinien und strukturierte Spezifikationen. Damit ein KI-Agent eine fundierte Kaufentscheidung treffen kann, müssen diese Daten konsistent, vollständig und semantisch eindeutig sein – Mehrdeutigkeit führt dazu, dass der Agent ein Produkt überspringt oder falsch interpretiert. Moderne Agentic Product Feeds orientieren sich an aufkommenden Standards wie dem Agentic Commerce Protocol und ergänzen klassische SEO-Signale um agentenspezifische Felder, die Vertrauen, Eignung und Transaktionsfähigkeit signalisieren. Für Händler verschiebt sich damit der Optimierungsfokus: weg von der reinen Klickoptimierung für Menschen, hin zur Maschinenlesbarkeit für den agentengetriebenen Handel.
Verwandt:Agentic Commerce Protocol Generative Engine Optimization (GEO)AI Procurement (KI-Beschaffung)
KI-Kerntechnologie
Agentic Reasoning
Extended Thinking für autonome Agenten – die Fähigkeit, vor Aktionen explizit zu "denken". Claude Opus 4.5, GPT-5.2 und Gemini 3 Pro nutzen zusätzliche Compute-Zeit für komplexe Schlussfolgerungen. Unterschied zu Chain-of-Thought: Agentic Reasoning plant mehrstufige Aktionssequenzen, nicht nur Antworten.
Verwandt:Reasoning Mode Chain-of-Thought (CoT)
Agentic AI & Agenten
Agentic Systems (Agentenbasierte Systeme)
Agentic Systems sind KI-Systeme, die eigenständig Entscheidungen treffen und Aktionen durchführen, um komplexe Aufgaben zu lösen. Im Gegensatz zu klassischen KI-Systemen, die nur auf Eingaben reagieren, nutzen agentenbasierte Systeme ein Schleifenmodell: Sie wahrnehmen die Umgebung, formulieren Ziele, planen Schritte und führen Aktionen aus – alles ohne kontinuierliche menschliche Interventionen. Ein Beispiel: Ein Agentic System könnte automatisch Kundenanfragen analysieren, die relevantesten Lösungen recherchieren, interne Systeme abfragen und eine Antwort generieren. Dies wird ermöglicht durch Model Context Protocol (MCP), das Tools und Datenquellen nahtlos integriert.
Verwandt:MCP (Model Context Protocol)Observability (KI-Systeme)
Agentic AI & Agenten
Agentic Workflow
Ein iterativer Prozess, bei dem KI-Agenten Aufgaben zerlegen, ausführen und sich durch Reflexionsschleifen selbst korrigieren, um Ergebnisse höchster Qualität zu sichern.
Verwandt:Agentic AI Chain-of-Thought (CoT)
KI-Engineering
AGENTS.md
Eine Markdown-Datei in einem Code-Repository, die strukturierte Anweisungen für KI-Coding-Agenten bereitstellt und deren Aufgabenerfüllung um bis zu 29% verbessert.
Verwandt:Agent-Anweisungsdatei KI-Agent-Optimierung
KI-Infrastruktur
AI Agent Capacity Planning (KI-Agenten-Kapazitätsplanung)
AI Agent Capacity Planning beschreibt die systematische Planung von Rechenleistung, API-Quoten, Parallelität, Warteschlangen und Fallbacks für produktive KI-Agenten. Anders als klassische Server-Kapazitätsplanung berücksichtigt sie, dass Agenten nicht nur eine einzelne Anfrage beantworten, sondern Aufgaben in Schritte zerlegen, Tools aufrufen, Code ausführen, Dateien lesen und mehrfach mit Modellen kommunizieren. Dadurch entstehen Lastspitzen bei Tokens, Kontextfenstern, Rate Limits, Speicher, CI-Läufen und menschlichen Freigaben. Gute Kapazitätsplanung definiert deshalb erwartete Aufgabenvolumina, maximale Laufzeiten, Budgetgrenzen, Prioritätsklassen, Degradationspfade und Eskalationsregeln. Sie beantwortet Fragen wie: Welche Agenten dürfen parallel laufen? Wann wird auf ein kleineres Modell geroutet? Welche Aufgaben warten, welche brechen ab, und welche bekommen garantierte Kapazität? Zusätzlich müssen Monitoring, Abrechnung und Sicherheitsregeln zusammenpassen, damit ein Agent nicht unbemerkt teure Schleifen produziert oder kritische Ressourcen blockiert. Für Unternehmen ist das ein Betriebsmodell für verlässliche Agenten. Es verbindet Infrastruktur, Kostenkontrolle, Governance und Nutzererlebnis, damit KI-Agenten auch bei Anbieterlimits, Compute-Engpässen oder plötzlicher Nachfrage planbar stabil bleiben. Besonders wichtig ist diese Disziplin bei Multi-Agenten-Systemen und geschäftskritischen Automatisierungen.
Verwandt:Agentic Compute (agentengetriebene Rechenlast)Inferenzkosten Model Routing (Modellauswahl)
Agentic AI & Agenten
AI Agent Control Plane (KI-Agenten-Kontrollebene)
Eine AI Agent Control Plane ist die Steuerungsschicht, über die KI-Agenten geplant, autorisiert, überwacht und begrenzt werden. Während das Modell die nächste Aktion vorschlägt, entscheidet die Control Plane, welche Werkzeuge, Datenquellen, Repositories, APIs oder Umgebungen ein Agent nutzen darf, unter welchen Bedingungen ein Mensch freigeben muss und wie Aktionen protokolliert werden. Sie bündelt Berechtigungen, Richtlinien, Secrets, Laufzeitumgebungen, Rate Limits, Kostenregeln, Evaluationssignale und Audit-Logs in einer Architektur, die über einzelne Prompts hinausgeht. In modernen agentischen Systemen ist diese Ebene wichtig, weil Agenten nicht nur Text erzeugen, sondern Tickets bearbeiten, Code ändern, Daten abrufen oder Geschäftsprozesse auslösen können. Eine gute Control Plane trennt Fähigkeiten von Freigaben: Ein Agent kann technisch ein Tool kennen, darf es aber nur im definierten Scope ausführen. Dadurch werden Experimente, Rollouts und produktive Automatisierung kontrollierbar, wiederholbar und compliance-fähig. Für Unternehmen entsteht damit ein verbindlicher Betriebsrahmen, der Prototypen, interne Assistenten und autonome Workflows unter denselben Sicherheits- und Qualitätsregeln zusammenführt.
Verwandt:AI Orchestration (KI-Orchestrierung)Agent Runtime Architecture AI Agent Permissions (KI-Agenten-Berechtigungen)
Agentic AI & Agenten
AI Agent Governance (KI-Agenten-Governance)
AI Agent Governance beschreibt die Regeln, Kontrollen und Verantwortlichkeiten, mit denen Unternehmen KI-Agenten sicher, nachvollziehbar und geschäftstauglich betreiben. Anders als klassische KI-Governance betrachtet sie nicht nur ein Modell oder einen Chatbot, sondern autonome oder teilautonome Agenten, die Werkzeuge nutzen, Code ändern, Daten abrufen, Entscheidungen vorbereiten oder Prozesse ausführen. Dazu gehören Rollen- und Rechtekonzepte, Freigabegrenzen, Audit-Logs, Human-in-the-Loop-Prüfungen, Testumgebungen, Monitoring, Kostenlimits und klare Eskalationswege. Gute Governance definiert außerdem, welche Agenten in welcher Umgebung arbeiten dürfen, welche Daten sie sehen, welche Aktionen sie nie ausführen dürfen und wie Fehler rückgängig gemacht werden. In der Praxis ist AI Agent Governance die Brücke zwischen schneller Agenten-Entwicklung und belastbarem Betrieb. Sie legt fest, wie neue Agenten vor dem Rollout getestet werden, welche Qualitätsmetriken gelten, wer Änderungen freigibt und wie Vorfälle dokumentiert werden. Besonders wichtig ist die Trennung zwischen Entwicklungs-, Test- und Produktivumgebungen, damit ein Agent nicht versehentlich Kundendaten verändert oder produktive Systeme belastet. Sie macht aus experimentellen Assistenten kontrollierte digitale Mitarbeiter, deren Verhalten messbar, überprüfbar und an Unternehmensziele gebunden ist.
Verwandt:AI Coding Agents (KI-Codieragenten)AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)Managed Agents (Verwaltete KI-Agenten)
KI-Infrastruktur
AI Agent Operations (KI-Agenten-Betrieb)
AI Agent Operations bezeichnet die Betriebsdisziplin, mit der KI-Agenten nach dem Prototyp zuverlässig, sicher und wirtschaftlich in echten Arbeitsabläufen laufen. Dazu gehören Session- und Aufgabenverwaltung, Tool-Berechtigungen, API-Schlüssel, Rate Limits, Warteschlangen, Protokolle, Monitoring, Fallback-Modelle und klare Eskalationswege für Menschen. Anders als klassisches MLOps betrachtet AI Agent Operations nicht nur ein Modell oder eine Pipeline, sondern ein handelndes System, das Code ausführt, Dateien verändert, Datenbanken abfragt oder externe Dienste nutzt. Deshalb müssen Teams jederzeit sehen können, welcher Agent welche Aufgabe verfolgt, welche Werkzeuge er nutzt, welche Kosten entstehen und wann ein Mensch entscheiden muss. Gute Agent Operations verbinden Observability, Governance und Infrastruktur: Logs erklären Entscheidungen, Kontrollflächen begrenzen Risiken, Kapazitätsplanung verhindert Ausfälle und Runbooks machen Vorfälle reproduzierbar. Für Unternehmen ist der Begriff wichtig, weil produktive Agenten sonst schnell zu schwer prüfbaren Einzellösungen werden. Mit einem Operations-Ansatz werden sie zu verwaltbaren digitalen Mitarbeitern, die messbar, kontrollierbar und schrittweise skalierbar sind. Besonders wichtig ist dabei eine gemeinsame Betriebssicht für Fachbereiche, IT und Compliance.
Verwandt:AI Agent Control Plane (KI-Agenten-Kontrollebene)AI Agent Capacity Planning (KI-Agenten-Kapazitätsplanung)AI Agent Permissions (KI-Agenten-Berechtigungen)
Agentic AI & Agenten
AI Agent Permissions (KI-Agenten-Berechtigungen)
AI Agent Permissions beschreiben die expliziten Rechte, die ein KI-Agent in Software, Datenquellen und Geschäftsprozessen erhält. Anders als ein Chatbot, der nur antwortet, kann ein agentisches System Werkzeuge aufrufen, Dateien lesen, Tickets ändern, Code ausführen, Pull Requests öffnen oder externe APIs nutzen. Permissions legen fest, welche dieser Aktionen erlaubt sind, unter welchen Bedingungen sie eine menschliche Freigabe brauchen und welche Grenzen niemals überschritten werden dürfen. Gute Berechtigungsmodelle arbeiten mit Least Privilege, rollenbasierten Scopes, temporären Tokens, Umgebungsgrenzen, Secret-Isolation und vollständigen Audit Logs. Ein Coding Agent darf zum Beispiel Repository-Dateien lesen, Tests ausführen und einen Pull Request vorschlagen, aber keine Produktionsdeployments starten oder Kundendaten exportieren. Für Unternehmen sind AI Agent Permissions damit die operative Sicherheits- und Governance-Schicht zwischen leistungsfähiger Automatisierung und kontrolliertem Risiko. Sie entscheiden, ob Agenten nur assistieren oder zuverlässig in reale Workflows integriert werden können. Besonders wichtig ist die Trennung von Lese-, Schreib- und Ausführungsrechten: Ein Agent kann Informationen sammeln, ohne automatisch Änderungen auszulösen. Erst wenn Risiko, Kontext und Verantwortlichkeit klar sind, wird die nächste Berechtigungsstufe aktiviert.
Verwandt:AI Agent Governance (KI-Agenten-Governance)Managed Agents (Verwaltete KI-Agenten)AI Coding Agents (KI-Codieragenten)
Sicherheit & Souveränität
AI Agent Security (KI-Agenten-Sicherheit)
AI Agent Security beschreibt die Sicherheitsarchitektur für KI-Agenten, die nicht nur Text erzeugen, sondern Tools aufrufen, Dateien ändern, Code ausführen, APIs nutzen oder externe Systeme steuern. Der Begriff umfasst technische und organisatorische Schutzmaßnahmen: Sandboxes für riskante Ausführung, klare Berechtigungen, Approval-Flows, Netzwerkregeln, Secret- und Credential-Isolation, Logging, Telemetrie und Notfallabschaltung. Anders als klassische Applikationssicherheit muss AI Agent Security mit einem nicht deterministischen Akteur umgehen: Ein Agent kann aus Prompts, Tool-Ergebnissen und Kontext neue Handlungsschritte ableiten. Deshalb reicht es nicht, nur das Modell abzusichern. Entscheidend ist die gesamte Laufzeitumgebung vom System Prompt über Tool Scopes bis zum Audit Trail. In Unternehmen wird AI Agent Security besonders wichtig, sobald Coding Agents Pull Requests erstellen, Daten analysieren, Tickets bearbeiten oder Produktionssysteme vorbereiten. Gute Agentensicherheit trennt Experimente von produktiven Rechten, reduziert den Blast Radius und macht jede kritische Aktion nachvollziehbar. Sie ist damit die Grundlage, um autonome oder teilautonome KI-Systeme kontrolliert in echte Geschäftsprozesse einzubauen. Besonders relevant sind klare Verantwortlichkeiten zwischen Mensch, Agent und Infrastruktur.
Verwandt:AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)Sandbox Agents (isolierte KI-Agenten)AI Agent Permissions (KI-Agenten-Berechtigungen)
Agentic AI & Agenten
AI Agent Workflow
Eine strukturierte Abfolge von Aufgaben eines KI-Agenten für ein Geschäftsergebnis, mit Reasoning, Entscheidungsfindung und adaptiven Reaktionen.
Verwandt:Multi-Agent-Coding-Workflow Multi-Agent Workflow Workflow-Orchestrierung (Workflow Orchestration)
KI-Kerntechnologie
AI Agents in Production
AI Agents in Production bezieht sich auf die Bereitstellung und Operationalisierung von KI-Agenten in realen Umgebungen zur Automatisierung von Aufgaben, Unterstützung von Benutzern und Interaktion mit anderen Systemen. Dies umfasst die Gewährleistung der Zuverlässigkeit, Skalierbarkeit und Sicherheit von KI-Agenten in Live-Umgebungen.
Verwandt:Produktionsreifes KI-System AI Coding Agents (KI-Codieragenten)Managed Agents (Verwaltete KI-Agenten)
Zukunft & Innovation
AI Autonomy in Enterprises
AI Autonomy in Enterprises beschreibt das Ausmaß, in dem KI-Systeme unabhängig Aufgaben ausführen, Entscheidungen treffen und Prozesse innerhalb einer Organisation ohne menschliches Eingreifen verwalten können. Dazu gehören selbstoptimierende Algorithmen, autonome Workflows und KI-gesteuerte Ressourcenallokation.
Sicherheit & Souveränität
AI Code Security Review (KI-Code-Sicherheitsprüfung)
AI Code Security Review bezeichnet die systematische Sicherheitsprüfung von Code, der mit KI-Coding-Tools, Agenten oder automatisierten Entwicklungsworkflows entstanden ist. Der Review prüft nicht nur klassische Schwachstellen wie Injection, fehlerhafte Authentifizierung oder unsichere Abhängigkeiten, sondern auch KI-spezifische Risiken: Halluzinierte APIs, fehlende Fehlerpfade, unvollständige Tests, überbreite Berechtigungen, Prompt-Injection-Angriffsflächen und unsaubere Trennung von Secrets, Netzwerkzugriff und Build-Pipeline. Gute Reviews kombinieren statische Analyse, Dependency-Scanning, Laufzeittests, menschliche Architekturprüfung und oft einen zweiten Agenten, der Fixes unabhängig revalidiert. Entscheidend ist, dass der Prozess wiederholbar ist: klare Merge Gates, nachvollziehbare Findings, reproduzierbare Testbefehle und dokumentierte Entscheidungen statt einmaliger Bauchgefühl-Prüfung. Für Teams wird AI Code Security Review damit zur Brücke zwischen schneller KI-Entwicklung und belastbarer Software-Lieferung. Er macht sichtbar, welche Annahmen ein Modell getroffen hat, welche Komponenten nachgetestet wurden und wo menschliche Freigabe nötig bleibt. Er gehört früh in den Entwicklungsprozess, nicht erst kurz vor dem Release, weil KI-generierter Code sonst technische Schulden und Sicherheitsannahmen sehr schnell skaliert.
Verwandt:AI Agent Security (KI-Agenten-Sicherheit)AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)Prompt Injection Defense
Agentic AI & Agenten
AI Coding Agent
Ein KI-System, das Softwareentwicklungsaufgaben automatisiert – darunter Codegenerierung, Fehlerbehebung, Feature-Implementierung und Code-Migrationen. Anders als einfache Code-Vervollständigung arbeiten KI-Coding-Agenten autonom an komplexen, dateiübergreifenden Aufgaben.
Verwandt:Multi-Agent Coding CLI Coding Agent Multi-Agent-Coding-Workflow
KI-Sicherheit & Leitplanken
AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)
AI Coding Agent Guardrails sind technische und organisatorische Leitplanken, die festlegen, was ein KI-Coding-Agent in einer Entwicklungsumgebung tun darf, wann er stoppen muss und welche Ergebnisse vor einer Übernahme geprüft werden. Dazu gehören Repository-Berechtigungen, Branch- und Dateigrenzen, Secret-Scanner, Testpflichten, Review-Regeln, Audit-Logs, Kostenlimits, Tool-Allowlisten und Rollback-Pfade. Der Begriff ist wichtig, weil moderne Coding-Agenten nicht mehr nur Code vorschlagen, sondern Dateien ändern, Tests ausführen, Abhängigkeiten installieren, Pull Requests erstellen oder Workflows anstoßen können. Gute Guardrails bremsen Agenten nicht pauschal aus. Sie machen Autonomie kontrollierbar: einfache Änderungen dürfen automatisiert laufen, riskante Bereiche wie Authentifizierung, Zahlungslogik, Produktionsdaten oder Infrastruktur benötigen zusätzliche Freigaben. In reifen Setups werden Guardrails als Policy-Schicht gebaut, die Kontext, Risiko und Änderungsumfang bewertet. So entsteht ein belastbarer Arbeitsmodus zwischen schneller Agentenunterstützung und klassischer menschlicher Code-Verantwortung.
Verwandt:AI Coding Agents (KI-Codieragenten)AI Governance Frameworks Agentic Workflow
Agentic AI & Agenten
AI Coding Agents (KI-Codieragenten)
AI Coding Agents sind autonome oder semi-autonome KI-Systeme, die Softwareentwicklungsaufgaben eigenständig oder in Zusammenarbeit mit menschlichen Entwicklern durchführen. Im Gegensatz zu herkömmlichen Code-Completion-Tools wie IntelliSense agieren diese Agenten auf höherer Abstraktionsebene: Sie analysieren Anforderungen, planen Implementierungsschritte, schreiben Code, führen Tests durch und iterieren basierend auf Feedback. Beispiele umfassen Claude Code von Anthropic, Cursor mit integriertem KI-Assistenten, und OpenAIs Codex. Diese Systeme kombinieren große Sprachmodelle mit Werkzeugaufrufen (Tool Calling), Dateizugriff, Terminal-Befehlen und manchmal Browser-Automatisierung, um komplexe Entwicklungsaufgaben zu bewältigen. Der entscheidende Unterschied zu passiven Assistenzsystemen liegt in der Agenten-Architektur: Sie führen eine eigene Schleife aus (Agent Loop), in der sie planen, handeln, Ergebnisse beobachten und ihre Strategie anpassen – ähnlich einem menschlichen Entwickler im Miniaturformat.
Verwandt:Agentic Systems (Agentenbasierte Systeme)AI Coding Assistants Agentic Workflow
KI-Kerntechnologie
AI Coding Assistants
AI Coding Assistants sind Werkzeuge, die große Sprachmodelle nutzen, um Entwicklern beim Schreiben, Debuggen und Verstehen von Code zu helfen. Sie bieten Funktionen zur Codevervollständigung, -generierung, -erklärung und -refaktorisierung, die in Entwicklungsumgebungen integriert sind.
Verwandt:AI Coding Agents (KI-Codieragenten)AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)Vibe Coding
KI-Sicherheit & Leitplanken
AI Control Risks
Die Herausforderung, menschliche Kontrolle über zunehmend leistungsfähige KI-Systeme zu behalten. Zentrales Thema der Governance-Debatten beim WEF 2026.
Verwandt:AI Agent Control Plane (KI-Agenten-Kontrollebene)
KI-Ökonomie & Kosten
AI Cost Optimization
AI Cost Optimization umfasst Strategien und Techniken zur Reduzierung der Betriebskosten von KI-Systemen bei gleichzeitiger Aufrechterhaltung der Leistung. Dazu gehören Modellauswahl, Caching, Batching, Prompt-Optimierung und die Auswahl geeigneter Modellgrößen für verschiedene Aufgaben.
Verwandt:Inferenzkosten Inferenz-Optimierung Token Yield Optimization
Compliance & Regulierung
AI Governance Frameworks
AI Governance Frameworks sind strukturierte Ansätze zur Verwaltung von KI-Systemen über ihren gesamten Lebenszyklus, einschließlich Richtlinien, Verfahren und Kontrollen für die verantwortungsvolle Entwicklung, Bereitstellung und Überwachung von KI-Anwendungen.
Verwandt:KI-Governance Agent Governance AI Agent Governance (KI-Agenten-Governance)
Compliance & Regulierung
AI Model Sovereignty (KI-Modellsouveränität)
AI Model Sovereignty beschreibt die Fähigkeit eines Unternehmens, die eingesetzten KI-Modelle bewusst zu wählen, zu wechseln und zu kontrollieren, statt vollständig von einer einzelnen Plattform abhängig zu sein. Dazu gehören Modellportfolio, Hosting-Optionen, Datenflüsse, Evaluationskriterien, Kostenlogik, Sicherheitsrichtlinien und vertragliche Rahmenbedingungen. Ein souveränes Setup kann weiterhin Modelle von OpenAI, Anthropic, Google, Microsoft oder Open-Source-Anbietern nutzen; entscheidend ist, dass Architektur und Governance nicht an einen Anbieter, ein Preismodell oder eine proprietäre Produktoberfläche gekettet sind. Praktisch bedeutet das: Teams definieren, welches Modell für welche Aufgabe geeignet ist, welche Daten wohin übertragen werden dürfen, welche Fallbacks existieren und wie Ergebnisse auditiert werden. Außerdem werden Prompts, Schnittstellen und Bewertungsmetriken so gekapselt, dass ein Modellwechsel technisch und organisatorisch realistisch bleibt. Für regulierte Branchen kommt hinzu, dass Datenresidenz, Nachvollziehbarkeit und Beschaffungsregeln dokumentiert sein müssen. AI Model Sovereignty ist damit kein Anti-Cloud-Argument, sondern ein Betriebsprinzip: Kontrolle über Modellwahl, Risiken und Wechselkosten bleibt beim Unternehmen. Das ist besonders relevant, wenn KI-Agenten tief in Prozesse, Kundendaten oder interne Wissensbestände integriert werden.
Verwandt:AI Model Tiers (KI-Modellstufen)Model Routing (Modellauswahl)AI Procurement (KI-Beschaffung)
KI-Infrastruktur
AI Model Tiers (KI-Modellstufen)
AI Model Tiers bezeichnen die strukturierte Klassifizierung von KI-Sprachmodellen in abgestufte Leistungs- und Kostenebenen, die Unternehmen als Grundlage für Routingentscheidungen, Budgetplanung und Governance nutzen. Typische Tiers umfassen drei Ebenen: schnelle und kostengünstige Modelle für einfache Aufgaben (z.B. Haiku-Klasse), ausgewogene Modelle für komplexe Anfragen (z.B. Sonnet-Klasse) und leistungsstarke Frontier-Modelle für anspruchsvolle Analyse- und Reasoning-Aufgaben (z.B. Opus-Klasse). Das Tier-Konzept ist kein rein technisches Merkmal, sondern ein strategisches Framework: Es ermöglicht Unternehmen, Anfragen automatisch oder regelbasiert an das jeweils optimale Modell weiterzuleiten – eine Praxis, die als Model Routing bezeichnet wird. Wer seine KI-Architektur nach Tiers strukturiert, kann Inferenzkosten um 60–80 % senken, indem einfache Aufgaben auf günstigere Modelle ausgelagert werden, ohne Qualitätseinbußen bei komplexen Aufgaben hinzunehmen. Aus Governance-Perspektive erlaubt die Tiered Architecture eine klare Zuweisung von Sicherheits- und Compliance-Anforderungen: Hochsensible Datenverarbeitung und regulierte Aufgaben bleiben dem Top-Tier vorbehalten; leichtgewichtige Assistenzaufgaben können auf günstigeren Tier-1-Modellen laufen. Für Enterprise-Teams, die mehrere KI-Agenten gleichzeitig betreiben, ist das Tier-Konzept eine Voraussetzung für skalierbare, vorhersehbare und kosteneffiziente Betriebsmodelle. Anthropics Roadmap für Opus, Sonnet und Haiku ist ein Paradebeispiel für dieses Architekturprinzip: Jedes Modell in der Claude-Familie ist explizit für eine bestimmte Leistungs- und Kostenklasse konzipiert und in ein übergeordnetes Routing-Framework eingebettet.
Verwandt:Model Routing (Modellauswahl)Frontier Model (KI-Grenzmodell)Large Language Model (LLM)
KI-Engineering
AI Observability
AI Observability bezieht sich auf die Fähigkeit, das Verhalten von KI-Systemen in Echtzeit zu überwachen, zu verstehen und zu beheben. Es umfasst das Sammeln und Analysieren von Daten über Modellinputs, -outputs, Leistungskennzahlen und interne Zustände, um die Zuverlässigkeit sicherzustellen und potenzielle Probleme zu identifizieren.
Verwandt:Observability (KI-Systeme)Agent Observability (KI-Agenten-Beobachtbarkeit)
Agentic AI & Agenten
AI Orchestration (KI-Orchestrierung)
AI Orchestration bezeichnet die Architektur- und Steuerungsschicht, die mehrere KI-Modelle, Agenten, Tools, APIs und menschliche Freigaben zu einem verlässlichen Ablauf verbindet. Statt eine einzelne Anfrage an ein Modell zu schicken, definiert Orchestrierung, welcher Agent welchen Schritt übernimmt, welche Daten genutzt werden dürfen, wann Tools aufgerufen werden, welche Ergebnisse geprüft werden und wie Fehler zurückgerollt werden. In KI-Coding-Szenarien kann eine Orchestrierung zum Beispiel Anforderungen analysieren, Tickets aufteilen, Code erzeugen, Tests ausführen, Sicherheitsregeln prüfen und Review-Schleifen starten. Wichtig sind dabei Zustandsverwaltung, Berechtigungen, Logging, Evaluations, Kostenkontrolle und Fallbacks zwischen Modellen. Gute AI Orchestration macht agentische Systeme nicht nur leistungsfähiger, sondern auch auditierbar und betriebssicher. Für Unternehmen ist sie der Unterschied zwischen einem beeindruckenden Demo-Workflow und einem produktiven KI-System, das wiederholbar, kontrollierbar und messbar arbeitet.
Verwandt:Workflow-Orchestrierung (Workflow Orchestration)Agentic Systems (Agentenbasierte Systeme)AI Coding Agents (KI-Codieragenten)
Compliance & Regulierung
AI Procurement (KI-Beschaffung)
AI Procurement (KI-Beschaffung) beschreibt den strukturierten Auswahl-, Prüf- und Einkaufsprozess für KI-Systeme: Modelle, Agentenplattformen, Dateninfrastruktur, Integrationen und laufende Betriebsleistungen. Anders als klassische Softwarebeschaffung bewertet AI Procurement nicht nur Funktionsumfang und Lizenzpreis, sondern auch Modellqualität, Datenflüsse, Sicherheitsgrenzen, Haftung, Anbieterabhängigkeit, Auditierbarkeit und Kosten pro Nutzung. Dazu gehören Kriterien wie Hosting-Modell, Zugriff auf Kundendaten, Modell- und Tool-Updates, Prompt- und Log-Speicherung, Berechtigungen, SLAs, Exit-Strategie und regulatorische Anforderungen. In der Praxis verbindet der Begriff Einkauf, IT, Security, Legal und Fachbereiche: Ein KI-Tool wird erst produktiv eingeführt, wenn Nutzen, Risiko und Betrieb klar messbar sind. Gute AI Procurement verhindert Schatten-KI, ungeprüfte SaaS-Verträge und teure Pilotprojekte ohne Skalierungsplan. Sie schafft einen wiederholbaren Entscheidungsrahmen, mit dem Unternehmen entscheiden, wann sie ein Modell einkaufen, selbst hosten, über eine Orchestrierung routen oder eine individuelle KI-Lösung bauen sollten. Wichtig ist außerdem die laufende Kontrolle nach Vertragsabschluss: KI-Anbieter ändern Modelle, Preise, Speicherpraktiken und Integrationsmöglichkeiten schneller als klassische Softwareanbieter. Damit ist KI-Beschaffung weniger ein einmaliger Einkauf als ein Governance-Prozess über den gesamten Lebenszyklus.
Verwandt:Frontier Model (KI-Grenzmodell)Model Routing (Modellauswahl)Self-Hosted LLM (selbst gehostetes Sprachmodell)
Sicherheit & Souveränität
AI Red Teaming
AI Red Teaming ist eine Sicherheits-Testmethode, bei der ein Expertenteam versucht, Schwachstellen und Schwächen in KI-Systemen zu finden, indem es reale Angriffe simuliert. Dies hilft Organisationen, potenzielle Risiken im Zusammenhang mit ihren KI-Implementierungen zu identifizieren und zu mindern.
Verwandt:Red Teaming (KI-Sicherheitstests)Automated Red-Teaming
KI-Kerntechnologie
AI Scaling
Die Steigerung der Leistung von KI-Modellen durch mehr Rechenleistung, Daten und Parameter – gemäß den Scaling Laws. Zentrale Debatte beim WEF 2026.
Verwandt:Responsible Scaling Policy (RSP)Test-Time Scaling Test-Time Compute Scaling
Compliance & Regulierung
AI Supply Chain Risk (KI-Lieferkettenrisiko)
AI Supply Chain Risk beschreibt die Risiken, die entstehen, wenn Unternehmen KI-Systeme aus vielen externen Bausteinen zusammensetzen: Modellanbieter, Cloud-Infrastruktur, Datenquellen, Embedding-Modelle, Vektordatenbanken, Agenten-Tools, Open-Source-Pakete und API-Integrationen. Anders als bei klassischer Software ist die Lieferkette oft dynamisch: Modelle ändern ihr Verhalten, Preise wechseln, Terms of Service können sich verschieben, Trainingsdaten sind nicht immer transparent und ein einzelner Provider-Ausfall kann ganze Workflows blockieren. Das Risiko liegt deshalb nicht nur in Cybersecurity, sondern auch in Compliance, Verfügbarkeit, Kostenkontrolle, Datenresidenz und strategischer Abhängigkeit. Ein gutes Risikomanagement kartiert alle KI-Abhängigkeiten, bewertet Anbieter nach Kritikalität, prüft Datenflüsse und definiert Fallbacks wie Modell-Routing, Self-Hosting oder manuelle Freigaben. Für Agentensysteme ist das besonders wichtig, weil Agenten selbstständig Tools aufrufen und damit Abhängigkeiten multiplizieren können. Typische Prüfungen betreffen Vertragslaufzeiten, Protokollierung, Subprozessoren, Exportmöglichkeiten, Sicherheitsnachweise und die Frage, ob kritische Prompts oder Kundendaten den Anbieter wechseln dürfen. AI Supply Chain Risk macht sichtbar, wo ein KI-Projekt anfällig ist, bevor es produktiv skaliert.
Verwandt:AI Procurement (KI-Beschaffung)Model Routing (Modellauswahl)Self-Hosted LLM (selbst gehostetes Sprachmodell)
Agentic AI & Agenten
AI Worker
Ein AI Worker ist ein autonomer KI-Agent, der Wissensarbeit eigenständig ausführt — Web-Recherche, Code schreiben, Datenanalyse und Workflow-Management — mit minimaler menschlicher Aufsicht. Anders als klassische KI-Assistenten arbeiten AI Worker kontinuierlich an mehrstufigen Aufgaben, treffen Entscheidungen und beheben Fehler selbstständig. Das Konzept wurde Anfang 2026 durch Claude Cowork, Perplexity Computer, OpenAI Operator und Google Project Mariner etabliert. AI Worker unterscheiden sich von Chatbots durch persistenten Kontext über Sitzungen, gleichzeitige Multi-Tool-Nutzung und autonome Workflow-Ausführung.
Verwandt:Agentic AI Computer Use Multi-Agent Orchestration
KI-Ökonomie & Kosten
AI Workforce Transformation
AI Workforce Transformation bezieht sich auf die Veränderungen in den Arbeitsrollen, den erforderlichen Fähigkeiten und den organisatorischen Strukturen, die sich aus der Integration von KI-Technologien ergeben. Dazu gehört die Weiterbildung von Mitarbeitern, die Schaffung neuer KI-bezogener Positionen und die Anpassung von Arbeitsabläufen zur Nutzung von KI-Fähigkeiten.
KI-Engineering
AI-Native Development
AI-Native Development ist ein Softwareentwicklungsansatz, der KI von Anfang an als gleichwertigen Bestandteil betrachtet, anstatt sie später hinzuzufügen. Es beinhaltet die Gestaltung von Systemen, Workflows und Architekturen mit KI-Fähigkeiten als Kernkomponenten.
Verwandt:Spec-Driven Development Autonomous AI Development KI-native Codebase
Agentic AI & Agenten
Anthropic Agent SDK (Claude Agent SDK)
Offizielles Framework zum Bauen von Agenten mit Claude. Veröffentlicht März 2025 mit Features wie Tool Use, Orchestration Loops, Guardrails und Tracing. Unterscheidet sich durch tiefe MCP-Integration und "Computer Use"-Fähigkeiten. Ideal für komplexe, langlebige Agent-Workflows.
Verwandt:Agentic AI OpenAI Agents SDK Google ADK (Agent Development Kit)
Sicherheit & Souveränität
API Key Governance (API-Schlüssel-Verwaltung)
API Key Governance bezeichnet die strukturierte Verwaltung, Kontrolle und Sicherung von API-Schlüsseln innerhalb KI-gestützter Systeme und agentenbasierter Workflows. Während moderne Unternehmen zunehmend auf externe KI-APIs wie Claude, GPT-4o oder Gemini angewiesen sind, werden API-Schlüssel zu sicherheitskritischen Zugangsdaten, deren unsachgemäße Verwaltung Datenverluste, Kostenexplosionen und Compliance-Verstöße verursachen kann. Kernelemente umfassen: erstens die regelmäßige Schlüsselrotation nach definierten Zyklen; zweitens die granulare Berechtigungsvergabe nach dem Least-Privilege-Prinzip, sodass jeder Agent oder Dienst nur die minimal erforderlichen Rechte erhält; drittens die zentrale Speicherung in Secret-Management-Systemen wie AWS Secrets Manager oder HashiCorp Vault statt Hardcoding im Quellcode; viertens die Echtzeit-Überwachung von Nutzungsquoten und Rate-Limits; fünftens lückenlose Audit-Logs aller API-Zugriffe. Für KI-Agenten gelten verschärfte Anforderungen: Ein Coding-Agent kann Hunderte von API-Aufrufen pro Sitzung erzeugen. Ohne agenten-spezifische Schlüssel mit eingeschränkten Scopes und Kostenlimits wächst die Angriffsfläche exponentiell. Eine Prompt-Injection-Attacke könnte einen Agenten dazu verleiten, mit privilegierten Schlüsseln unbefugte Aktionen auszuführen. API Key Governance ist kein optionales Sicherheitsmerkmal, sondern eine Betriebsgrundlage für jedes Unternehmen, das KI-Agenten in Produktionsumgebungen einsetzt. Sie schließt direkt an AI Agent Security, AI Agent Permissions und das übergeordnete AI Supply Chain Risk Management an.
Verwandt:AI Agent Security (KI-Agenten-Sicherheit)AI Agent Permissions (KI-Agenten-Berechtigungen)Sichere Prompt-Entwicklung (Secure Prompt Engineering)
Agentic AI & Agenten
Autonome Ausfuehrung
Die Faehigkeit eines KI-Agenten, Aufgaben selbststaendig auszufuehren und Entscheidungen ohne staendige menschliche Eingriffe zu treffen.
KI-Sicherheit & Leitplanken
Behavioral Drift (KI-Verhaltensabweichung)
Behavioral Drift bezeichnet das schleichende Abweichen eines KI-Agenten von seinem ursprünglich definierten Verhaltensprofil im Laufe der Zeit. Während einzelne Interaktionen noch innerhalb der Spezifikationen liegen können, führt die kumulative Wirkung von Feedback-Schleifen, Selbstoptimierung oder veränderten Kontextbedingungen dazu, dass das Systemverhalten zunehmend von den ursprünglichen Zielparametern abweicht. Das Phänomen tritt besonders häufig bei selbstverbessernden KI-Systemen auf, die ihre eigenen Fähigkeiten durch wiederholte Ausführung optimieren. Ohne geeignete Schranken und kontinuierliches Monitoring kann Behavioral Drift zu unerwarteten Outputs, gefährlichen Entscheidungsmustern oder dem vollständigen Verlust der ursprünglichen Systemausrichtung führen. Für Unternehmen, die KI-Agenten in produktionskritischen Prozessen einsetzen, ist Behavioral Drift ein wesentlicher Risikofaktor. Gegenmaßnahmen umfassen regelmäßige Baseline-Vergleiche, Ausgabe-Anomalie-Erkennung sowie RLHF-Feedback-Loops, die Abweichungen frühzeitig korrigieren, bevor sie kritische Schäden verursachen.
Verwandt:Halluzination (KI)Sandbox Agents (isolierte KI-Agenten)Model Quality Drift (Modellqualitätsdrift)
Agentic UX
Chain-of-Thought Prompting
Chain-of-Thought Prompting ist eine Technik, die verwendet wird, um die Denkfähigkeiten großer Sprachmodelle zu verbessern, indem sie dazu angeregt werden, die Zwischenschritte des Denkprozesses, die zu einer endgültigen Antwort führen, explizit zu generieren. Dies ermöglicht es den Benutzern, den Denkprozess des Modells zu beobachten und potenzielle Fehler zu identifizieren.
Verwandt:Chain-of-Thought (CoT)AI Supply Chain Risk (KI-Lieferkettenrisiko)Supply Chain Risk Designation
KI-Kerntechnologie
Claude Code
Anthropics offizieller CLI-basierter KI-Coding-Agent der autonom Code lesen schreiben und ausfuehren sowie Dateien verwalten und mit Entwicklungstools interagieren kann.
Verwandt:Claude Code Plugin-System Claude Code Security Claude Code Agent SDK
Agentic AI & Agenten
Claude Code
Anthropics offizielles CLI-Tool für agentenbasierte Softwareentwicklung. Ermöglicht Claude, direkt mit Dateisystemen, Git, Terminals und Browsern zu interagieren. Features: Background Agents, LSP-Integration, MCP-Server-Anbindung, Multi-File-Editing. Der De-facto-Standard für AI-assisted Coding seit 2025.
Verwandt:Claude Skills Model Context Protocol (MCP)Agentic SDLC
KI-Kerntechnologie
Claude Code Plugin-System
Die offizielle Erweiterungsarchitektur fuer Claude Code die es Entwicklern ermoeglicht Hooks, benutzerdefinierte Tools und Workflow-Modifikationen durch JSON-Konfiguration und skriptbasierte Event-Handler zu erstellen.
Verwandt:Claude Code Claude Code Security Claude Code Agent SDK
Agentic AI & Agenten
Claude Code Review
Ein Multi-Agenten-Pull-Request-Analysesystem, das in Anthropics Claude-Code-Plattform integriert ist. Schickt parallele KI-Agenten, um Pull Requests aus verschiedenen Winkeln zu prüfen, validiert Befunde durch eine Critic-Schicht und postet priorisierte Review-Kommentare direkt in GitHub. Gestartet am 9. März 2026 in der Research Preview für Teams und Enterprise.
Verwandt:AI Code Security Review (KI-Code-Sicherheitsprüfung)KI Code Review Gate Claude Code
KI-Kerntechnologie
Claude Code Security
Claude Code Security ist eine Schwachstellen-Scanning-Fähigkeit in Claude Code. Von Anthropic am 21. Februar 2026 gestartet, nutzt es KI-Reasoning, um Code kontextuell zu verstehen und komplexe Sicherheitslücken zu finden, die traditionelle statische Analyse übersieht.
Verwandt:AI Code Security Review (KI-Code-Sicherheitsprüfung)Claude Code Claude Code Plugin-System
Agentic AI & Agenten
Claude Cowork
Anthropic AI-Agent, der auf Ihrem Gerät für die Dateiverwaltung und die Ausführung komplexer Aufgaben über natürliche Sprache läuft.
Verwandt:Claude Cowork Claude Cowork Claude Cowork plug-ins
Agentic AI & Agenten
Claude Cowork
Ein AI-Agent von Anthropic, der auf Ihrem Gerät läuft, Dateien verwaltet und komplexe Aufgaben über natürliche Sprache ausführt.
Verwandt:Claude Cowork Claude Cowork Claude Cowork plug-ins
KI-Kerntechnologie
Claude Opus 4.6
Claude Opus 4.6 ist Anthropics leistungsstärkstes KI-Modell Anfang 2026, das bei Coding, komplexem Reasoning und Extended Thinking glänzt. Es belegt Platz 1 auf SWE-bench für Software-Engineering-Aufgaben und treibt Claude Code an. Seine neue PowerPoint-Integration fordert Microsoft Copilot direkt heraus.
Verwandt:Claude Skills Claude Code Claude Code Plugin-System
Agentic AI & Agenten
Claude Skills
Wiederverwendbare Anweisungspakete für Claude Code, die projektspezifisches Wissen und Workflows in aufrufbaren Einheiten kapseln.
Verwandt:Claude Code Model Context Protocol (MCP)Prompt Template
KI-Kerntechnologie
CLAUDE.md
Eine projektbezogene Konfigurationsdatei für Claude Code, die dauerhaften Kontext, Anweisungen und Regeln bereitstellt, die der KI-Agent zu Beginn jeder Sitzung liest, um Projektkonventionen und Anforderungen zu verstehen.
Verwandt:Claude Skills Claude Code Claude Code Plugin-System
KI-Kerntechnologie
CLAUDE.md
Eine projektbezogene Konfigurationsdatei fuer Claude Code die persistenten Kontext, Anweisungen und Regeln bereitstellt, die der KI-Agent zu Beginn jeder Sitzung liest.
KI-Kerntechnologie
Codex App
OpenAIs macOS-Desktop-Anwendung zur gleichzeitigen Verwaltung mehrerer KI-Coding-Agenten mit paralleler Aufgabenausführung.
Verwandt:Multi-Agent-Coding-Workflow Multi-Agent Coding
KI-Engineering
Codex Plugin System (Codex Plugin-System)
Das Codex Plugin System bezeichnet die Erweiterungsarchitektur von OpenAI Codex, mit der Teams Codex um wiederverwendbare Funktionen, Workflows und Integrationen ergänzen können. Statt jeden Projektkontext, jede Freigaberegel oder jedes Tool erneut in Prompts zu beschreiben, werden Fähigkeiten als Plugins gekapselt: ein Plugin kann zusätzliche Befehle, Tool-Definitionen, Projektkonventionen, UI-Flows oder Verbindungspunkte zu internen Systemen bereitstellen. Dadurch wird Codex von einem einzelnen Coding-Assistenten zu einer erweiterbaren Arbeitsumgebung für Softwareentwicklung, Migrationen, QA und Agenten-Workflows. Für Unternehmen ist das wichtig, weil KI-Coding nur dann skalierbar wird, wenn Wissen und Sicherheitsregeln nicht in einzelnen Chats verloren gehen. Plugins machen bewährte Abläufe reproduzierbar: Repository-Onboarding, Teststrategien, Deployment-Checks, Code-Review-Regeln oder MCP-basierte Toolzugriffe können zentral gepflegt und teamweit genutzt werden. Das reduziert Prompt-Drift, beschleunigt Onboarding und senkt das Risiko, dass Agenten unpassende Tools oder veraltete Standards verwenden. Unsere Perspektive: Wir behandeln Plugin-Systeme als Engineering-Infrastruktur, nicht als Nice-to-have. Ein gutes Codex-Plugin ist klein, versioniert, auditierbar und eng mit bestehenden APIs, Sicherheitsgrenzen und CI/CD-Prozessen verbunden.
Verwandt:OpenAI Codex MCP Apps MCP (Model Context Protocol)
KI-Engineering
Context Budget (Kontextbudget)
Ein Context Budget ist die bewusst geplante Menge an Informationen, die einem KI-Modell oder Coding-Agenten für eine Aufgabe zur Verfügung gestellt wird. Dazu gehören Systemprompt, Projektregeln, relevante Dateien, Beispiele, Tickets, Fehlermeldungen und die Historie vorheriger Schritte. Weil jedes Modell nur ein begrenztes Kontextfenster hat, entscheidet das Context Budget darüber, ob der Agent fokussiert arbeitet oder sich in Rauschen verliert. Gute Teams behandeln es wie ein technisches Design-Artefakt: Sie wählen Quellen aus, priorisieren harte Anforderungen vor Hintergrundwissen, schneiden irrelevante Dateien weg und halten Belege für spätere Reviews nachvollziehbar. In agentischen Workflows ist das Context Budget außerdem ein Kosten- und Sicherheitshebel. Weniger, besser kuratierter Kontext senkt Tokenkosten, reduziert versehentliche Datenweitergabe und verbessert die Wiederholbarkeit von Ergebnissen. Ein zu knappes Budget führt dagegen zu Halluzinationen, falschen Annahmen oder unnötigen Rückfragen. Praktisch bedeutet Context Budgeting: Aufgabe klären, Kontext gezielt packen, Zwischenergebnisse dokumentieren und den Kontext bei längeren Läufen bewusst erneuern. Dieses Budget wird vor jedem Agentenlauf geprüft, nicht zufällig gefüllt.
Verwandt:Context Window Token Telemetry (Token-Telemetrie)Agentic Engineering (agentisches Engineering)
KI-Kerntechnologie
Context Engineering
Die Praxis, den gesamten einem LLM bereitgestellten Kontext – Anweisungen, Beispiele, Tool-Ausgaben und Speicher – systematisch zu gestalten und zu verwalten, um zuverlässiges Verhalten von KI-Systemen im Produktivbetrieb zu erreichen.
Verwandt:Context Engineering Agentic Engineering (agentisches Engineering)Sichere Prompt-Entwicklung (Secure Prompt Engineering)
KI-Kerntechnologie
Context Engineering
Die Praxis des systematischen Entwurfs und der Verwaltung des vollstaendigen Kontexts fuer ein LLM einschliesslich Anweisungen Beispielen Tool-Ausgaben und Speicher fuer zuverlaessiges Verhalten.
KI-Engineering
Context Engineering
Die systematische Disziplin, alle für eine KI-Aufgabe relevanten Informationen optimal zu strukturieren und zu priorisieren – das neue Paradigma jenseits von Prompt Engineering.
Verwandt:Prompt Caching Token Window Management Prompt Template
Agentic AI & Agenten
Deep Research Agents
Deep Research Agents ist ein agentic AI-Konzept in modernen KI-Systemen, das autonome Agenten-Fähigkeiten ermöglicht. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Systeme eigenständig arbeiten und gleichzeitig menschliche Aufsicht gewährleisten müssen.
Verwandt:Reasoning Mode Agentic AI
KI-Engineering
Deterministischer Workflow (Deterministic Workflow)
Ein deterministischer Workflow beschreibt einen Prozessablauf, bei dem für jede gegebene Eingabe eine eindeutige, reproduzierbare Ausgabe folgt – ohne Zufallskomponenten oder nicht vorhersehbare Entscheidungspfade. Im Kontext von KI-Agenten und automatisierten Software-Entwicklungsprozessen bedeutet dies: Jeder Schritt – von der Code-Generierung über automatisierte Tests bis zum Pull-Request-Review – wird in einer fest definierten Reihenfolge ausgeführt und liefert bei gleichen Eingaben stets dasselbe Ergebnis. Deterministische Workflows unterscheiden sich grundlegend von adaptiven Agentenprozessen, bei denen ein KI-Modell eigenständig entscheidet, welche Aktionen als Nächstes ausgeführt werden. Moderne Agent-Frameworks nutzen YAML- oder JSON-basierte Workflow-Definitionen, um KI-Coding-Agenten in wiederholbare, prüfbare Abläufe einzubetten. Das Resultat: vorhersehbares Verhalten, klare Audit-Trails und eine erheblich vereinfachte Qualitätssicherung. Ein deterministischer Ansatz ist dabei kein Gegensatz zu intelligenten KI-Agenten – er ist ihre Voraussetzung für den Produktionseinsatz. Während das Sprachmodell innerhalb eines Schritts kreativ und flexibel agieren kann, ist der übergeordnete Ablauf fest und nachvollziehbar. Dieses Prinzip – Determinismus auf Workflow-Ebene bei LLM-Flexibilität auf Schritt-Ebene – ist der Schlüssel zu skalierbaren, vertrauenswürdigen KI-Systemen im Enterprise-Einsatz.
Verwandt:AI Coding Agents (KI-Codieragenten)Workflow-Orchestrierung (Workflow Orchestration)Agentic Systems (Agentenbasierte Systeme)
Sicherheit & Souveränität
Distillationsangriff (Distillation Attack)
Ein Distillationsangriff (englisch: distillation attack) ist eine Form des Modelldiebstahls, bei der ein Angreifer ein fremdes, proprietäres KI-Modell systematisch über dessen Schnittstelle abfragt, die Antworten sammelt und mit diesen Ausgaben ein eigenes, konkurrierendes Modell trainiert. Auf diese Weise lassen sich die Fähigkeiten eines hochwertigen Modells nachbilden, ohne jemals Zugriff auf dessen Gewichte, Trainingsdaten oder Architektur zu haben — der Angreifer rekonstruiert das Verhalten allein aus den beobachteten Ein- und Ausgaben. Technisch ähnelt das Verfahren der legitimen Modell-Distillation, bei der ein Anbieter bewusst ein kleineres Schülermodell auf den Ausgaben eines eigenen, größeren Lehrermodells trainiert. Der entscheidende Unterschied liegt in der Autorisierung: Beim Angriff wird das geistige Eigentum eines fremden Anbieters ohne Erlaubnis extrahiert. Prominent wurde der Fall, als Anthropic dem US-Senat meldete, Alibaba-nahe Akteure hätten Claude in großem Stil distilliert. Für Unternehmen sind solche Angriffe doppelt relevant: Wer ein eigenes Modell betreibt, riskiert dessen Nachbildung; wer Drittmodelle einsetzt, muss deren Herkunft hinterfragen. Schutzmaßnahmen reichen von Rate-Limits und Anomalieerkennung über Wasserzeichen in den Ausgaben bis zu vertraglichen Nutzungsbeschränkungen.
Verwandt:Model Distillation Provenance AI Supply Chain Risk (KI-Lieferkettenrisiko)
KI-Infrastruktur
Distributed AI (Verteilte KI)
Distributed AI bezeichnet Systeme, bei denen Rechenoperationen, Modelle und Daten über mehrere Rechner, Edge-Geräte oder Rechenzentren verteilt sind, anstatt zentral auf einem einzelnen Server zu laufen. Diese Architektur ermöglicht schnellere Inferenzen, bessere Skalierbarkeit und Ausfallsicherheit. Besonders im Kontext von Edge Computing und Satellitennetzen wie NVIDIA Space Computing gewinnt Distributed AI an Bedeutung. Die Verteilung reduziert Latenz, verbessert Datenschutz (lokale Verarbeitung) und senkt die Abhängigkeit von zentralen Infrastrukturen.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Edge AI Deployment KI-Inferenz
KI-Infrastruktur
Embedding
Die numerische Repräsentation von Text, Bildern oder anderen Daten als hochdimensionaler Vektor. Ermöglicht semantischen Vergleich basierend auf Bedeutung statt exakter Wortübereinstimmung. Grundlage für RAG-Systeme, Empfehlungen und semantische Suche.
Verwandt:Vektordatenbank RAG (Retrieval-Augmented Generation)
KI-Kerntechnologie
Embedding Models
Embedding-Modelle sind KI-Modelle, die Daten wie Text oder Bilder in hochdimensionale Vektorrepräsentationen umwandeln, die die semantische Bedeutung und die Beziehungen zwischen Datenpunkten erfassen. Diese Embeddings werden für semantische Suche, Ähnlichkeitsanalysen und Clusterbildung verwendet.
Verwandt:Embedding
KI-Engineering
Embeddings (Vektordarstellung)
Embeddings sind numerische Vektordarstellungen von Text, Bildern, Audio oder anderen Daten, die von KI-Modellen verwendet werden, um die semantische Bedeutung von Inhalten zu erfassen. Ein Embedding wandelt einen Text – etwa einen Satz oder ein Dokument – in einen Vektor aus Hunderten oder Tausenden von Dezimalzahlen um. Semantisch ähnliche Inhalte erhalten dabei ähnliche Vektoren; verwandte Begriffe liegen im Vektorraum nahe beieinander. Embedding-Modelle wie OpenAIs text-embedding-ada-002, Voyage AI oder Googles text-embedding-004 sind speziell auf diesen Zweck trainiert. Sie ermöglichen es, Texte maschinell zu vergleichen, ohne explizite Regeln oder Stichwortlisten zu benötigen – ein System kann so verstehen, dass 'PKW kaufen' und 'Auto erwerben' semantisch gleich bedeuten, obwohl sie keine gemeinsamen Wörter teilen. Im Unternehmenskontext werden Embeddings besonders für Retrieval-Augmented Generation (RAG) eingesetzt: Dokumente werden eingebettet und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird die Frage ebenfalls eingebettet und mit den Dokumentvektoren verglichen, um die relevantesten Quellen zu finden und dem Sprachmodell als Kontext bereitzustellen. Weitere Anwendungen: semantische Suche, Empfehlungssysteme, Duplikaterkennung sowie Klassifikation und Clustering von Inhalten.
Verwandt:Large Language Model (LLM)In-Context Learning (ICL)Scaffolding (KI-Agent-Gerüstbau)
KI-Engineering
Enterprise AI Deployment (Enterprise-KI-Einführung)
Enterprise AI Deployment beschreibt die kontrollierte Einführung von KI-Systemen in produktive Unternehmensprozesse. Dabei geht es nicht nur darum, ein Modell oder einen Chatbot live zu schalten. Entscheidend sind Zielbild, Datenzugriff, Modell- und Tool-Auswahl, Integrationen in bestehende Systeme, Rollenrechte, Monitoring, Kostenkontrolle und klare Verantwortlichkeiten. Ein gutes Deployment verbindet Strategie, Engineering und Governance: Use Cases werden priorisiert, Risiken bewertet, Pilotphasen begrenzt und erfolgreiche Workflows schrittweise skaliert. Für Unternehmen ist der Begriff wichtig, weil viele KI-Projekte in Demos gut aussehen, aber an Betrieb, Sicherheit, Akzeptanz oder fehlender Messbarkeit scheitern. Enterprise AI Deployment macht aus Experimenten belastbare Fähigkeiten: dokumentierte Architektur, nachvollziehbare Entscheidungen, Review-Prozesse, Fallbacks, Datenschutzprüfungen und laufende Optimierung. Dazu gehören Change Management, Schulungen, klare Supportwege und ein Betriebsmodell, das auch nach dem ersten Release funktioniert. Ebenso wichtig sind Verantwortliche für Fachbereich, IT und Datenschutz, damit Entscheidungen nicht im Pilotteam hängen bleiben. Besonders bei Agenten, RAG-Systemen oder Coding-Agenten müssen Unternehmen festlegen, welche Aufgaben automatisiert werden dürfen, wann Menschen prüfen und welche Qualitätsmetriken den produktiven Einsatz rechtfertigen.
Verwandt:Model Routing (Modellauswahl)AI Agent Governance (KI-Agenten-Governance)AI Agent Operations (KI-Agenten-Betrieb)
Compliance & Regulierung
EU AI Act
Das EU AI-Gesetz ist der umfassende regulatorische Rahmen der Europäischen Union für künstliche Intelligenz. Es legt risikobasierte Anforderungen für KI-Systeme fest, mit strengeren Regeln für hochriskante Anwendungen im Gesundheitswesen, Beschäftigung und kritischer Infrastruktur.
Verwandt:EU AI Act Compliance Observe-Think-Act loop
Compliance & Regulierung
EU AI Act Compliance
EU AI Act Compliance ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.
Verwandt:Constitutional AI Agent Governance
KI-Sicherheit & Leitplanken
Evaluation Awareness (Bewertungsbewusstsein)
Evaluation Awareness – auf Deutsch Bewertungsbewusstsein – beschreibt das Phänomen, dass ein KI-Modell erkennt, wann es getestet oder bewertet wird, statt in einem echten Produktiveinsatz zu arbeiten. Das Modell unterscheidet also zwischen einer künstlichen Prüfsituation, etwa einem Benchmark, und einer regulären Nutzeranfrage – und kann sein Verhalten je nach Kontext anpassen. Genau das macht das Phänomen für die Sicherheit relevant: Wenn ein Modell in der Bewertung anders reagiert als im Alltag, verlieren Testergebnisse an Aussagekraft. Jüngere Interpretierbarkeitsforschung von Anthropic hat gezeigt, dass sich dieses Bewusstsein in den internen Aktivierungen eines Modells ablesen lässt. In bis zu 26 Prozent der untersuchten Benchmark-Aufgaben erkannte Claude die Prüfsituation – ohne dies jemals offen auszusprechen. Damit wird Bewertungsbewusstsein zu einer verdeckten Variable, die klassische Eval-Werte unterwandern kann. Für Teams bedeutet das: Ein Modell, das gelernt hat, Tests zu erkennen, könnte in der Bewertung vorsichtiger, regelkonformer oder leistungsfähiger auftreten als im realen Betrieb. Bewertungsbewusstsein ist damit ein zentrales Konzept der KI-Sicherheit und der mechanistischen Interpretierbarkeit – und ein Grund, Modellbewertungen nicht allein auf Benchmark-Punktzahlen zu stützen, sondern sie durch Verhaltensprüfungen unter realistischen Bedingungen zu ergänzen.
Verwandt:KI-Modellbewertung (AI Model Evaluation)Responsible Scaling Policy (RSP)Frontier Model (KI-Grenzmodell)
KI-Infrastruktur
FastMCP
Ein Python-Framework zur schnellen Entwicklung von MCP-Servern mit minimalem Boilerplate-Code und deklarativer Syntax.
Verwandt:Model Context Protocol (MCP)Streamable HTTP Transport
KI-Kerntechnologie
Fine-Tuning
Der Prozess des weiteren Trainings eines vortrainierten KI-Modells auf einem kleineren, domaenenspezifischen Datensatz zur Anpassung an bestimmte Aufgaben oder Branchen.
Verwandt:Fine-tuning SLM Fine-Tuning
KI-Engineering
Fixierung von Abhängigkeiten (Dependency Pinning)
Fixierung von Abhängigkeiten (Dependency Pinning) bezeichnet die Praxis, externe Bibliotheken, SDKs, Container-Images, Werkzeuge oder MCP-Server nicht über lose Versionsbereiche einzubinden, sondern auf exakt geprüfte Versionen festzulegen. Statt „immer die neueste Version“ zu installieren, hält ein Team die Abhängigkeit in einem Lockfile, einer Prüfsumme oder einer freigegebenen Versionsliste fest und aktualisiert sie bewusst nach Test, Freigabe und Rollback-Plan. Für KI-Systeme ist das wichtiger als in klassischer Software, weil Agenten häufig Werkzeuge starten, Pakete nachladen und Protokoll-SDKs nutzen, deren Verhalten sich mit kleinen Updates verändern kann. Eine ungeprüfte neue Version kann Tool-Aufrufe anders interpretieren, Berechtigungen erweitern, Kosten verändern oder eine Lieferkettenlücke einschleusen. Fixierte Abhängigkeiten machen Builds reproduzierbar und geben Teams einen klaren Nachweis, welche Komponenten zu welchem Zeitpunkt produktiv waren. Gerade bei MCP-Migrationen trennt diese Praxis kontrollierte Veränderung von zufälligem Drift. Der geschäftliche Wert liegt in geringeren Ausfallrisiken, besserer Auditierbarkeit und planbaren Migrationen. Wir betrachten Dependency Pinning als Basisdisziplin für produktive KI-Agenten: Nicht jede Version muss alt bleiben, aber jede Version, die produktiv läuft, sollte absichtlich dort sein.
Verwandt:Model Pinning Supply-Chain-Angriff (Supply Chain Attack)AI Supply Chain Risk (KI-Lieferkettenrisiko)
KI-Kerntechnologie
Foundation Model (Basismodell)
Ein Foundation Model ist ein großes KI-Modell, das auf enormen Mengen unstrukturierter Daten vortrainiert wurde und als universelle Basis für eine Vielzahl von Downstream-Aufgaben dient. Der Begriff wurde 2021 von der Stanford University geprägt und beschreibt Modelle wie GPT-4, Claude oder Gemini, die durch ihre schiere Größe und das breite Vortraining emergente Fähigkeiten entwickeln – also Kompetenzen, die nicht explizit trainiert wurden, sondern aus der Skalierung entstehen. Foundation Models werden typischerweise einmal mit enormem Rechenaufwand trainiert und können anschließend durch Fine-Tuning, Prompt Engineering oder Retrieval-Augmented Generation (RAG) für spezifische Anwendungsfälle angepasst werden. Sie bilden heute die Grundlage für KI-Assistenten, Code-Generatoren, Bilderkennungssysteme und multimodale Anwendungen. Die Stärke liegt in der Übertragbarkeit: Ein einziges Basismodell kann mit vergleichsweise geringem Aufwand für Kundenservice, Dokumentenanalyse, Softwareentwicklung oder medizinische Diagnose eingesetzt werden.
Verwandt:Vortrainiertes Modell Fine-tuning Context Window
KI-Kerntechnologie
Frontier Model (KI-Grenzmodell)
Ein Frontier Model bezeichnet ein KI-Modell, das an der absoluten Leistungsgrenze des technisch Machbaren operiert – also die fortschrittlichsten und leistungsstärksten Systeme, die derzeit entwickelt werden. Zu den bekanntesten Frontier Models zählen GPT-5, Claude Opus 4.6, Gemini Ultra und vergleichbare Großmodelle, die von führenden KI-Laboren wie Anthropic, OpenAI oder Google DeepMind trainiert werden. Im Gegensatz zu spezialisierten oder kleineren Modellen zeichnen sich Frontier Models durch ihre außergewöhnliche Breite und Tiefe aus: Sie können komplexe Textanalysen, Codeentwicklung, wissenschaftliche Argumentation und multimodale Aufgaben auf menschlichem oder übermenschlichem Niveau bewältigen. Diese Modelle werden typischerweise mit enormen Rechenressourcen trainiert und schieben die Grenze des KI-Möglichen kontinuierlich vor – daher der Begriff 'Frontier'. Für Unternehmen sind Frontier Models besonders relevant, weil sie die Basis für agentenbasierte Anwendungen, autonome Coding-Assistenten und komplexe Entscheidungssysteme bilden. Der Zugang erfolgt in der Regel über APIs oder Cloud-Dienste, da das Training solcher Modelle Milliarden von Dollar erfordert. Regulatorische Rahmwerke wie der EU AI Act stufen Frontier Models oft als Hochrisikomodelle ein und verlangen entsprechende Transparenz- und Sicherheitsnachweise.
Verwandt:Foundation Model (Basismodell)Large Language Model (LLM)Agentic Systems (Agentenbasierte Systeme)
KI-Kerntechnologie
Function Calling
Function Calling ist eine Fähigkeit von KI-Modellen, bei der das Modell strukturierte API-Aufrufe an externe Tools oder Funktionen basierend auf Benutzeraufforderungen generieren kann. Es ermöglicht der KI, mit realen Systemen zu interagieren und Aktionen über die Textgenerierung hinaus auszuführen.
Verwandt:Tool Use / Function Calling Tool Calling (Werkzeugaufruf)
Compliance & Regulierung
GDPR-Compliant RAG
GDPR-Compliant RAG ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.
Verwandt:RAG (Retrieval-Augmented Generation)Privacy-Preserving Inference
Agentic UX
Generative Engine Optimization (GEO)
Generative Engine Optimization (GEO) ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.
Verwandt:llms.txt Agentic UX Principles
Agentic UX
Generative UI (v0)
Generative UI (v0) ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.
Verwandt:Agentic AI Agentic UX Principles
KI-Kerntechnologie
GEO vs SEO
GEO optimiert für KI-generierte Suchergebnisse; SEO optimiert für klassische Suchmaschinenpositionen.
Compliance & Regulierung
Geo-Locking von KI-Modellen (Geo-Locked AI Models)
Geo-Locking bezeichnet die Praxis, den Zugang zu einem KI-Modell abhängig vom geografischen Standort des Nutzers zu beschränken. Ein Anbieter kann ein bestimmtes Modell in einer Region freigeben, es in einer anderen jedoch sperren – aus regulatorischen, lizenzrechtlichen, geopolitischen oder kommerziellen Gründen. Für Unternehmen heißt das konkret: Ein Modell, auf das Ihr Team heute zugreift, kann für eine Niederlassung in einem anderen Land schlicht nicht verfügbar sein. Geo-Locking unterscheidet sich von einer internen Zugriffsrichtlinie, die regelt, wer im eigenen Haus welches Modell nutzen darf. Beim Geo-Locking entscheidet der Anbieter oder der Gesetzgeber – nicht Ihr Unternehmen. Typische Auslöser sind Exportkontrollen, Datenschutzvorgaben wie die DSGVO, der EU AI Act oder handelspolitische Sanktionen. Praktisch zeigt sich Geo-Locking als IP-basierte Sperre, regionsgebundener API-Endpunkt oder länderspezifische Vertragsbedingung. Wer eine mehrsprachige oder international verteilte Anwendung betreibt, muss diese Fragmentierung von Anfang an einplanen – sonst bricht dieselbe Funktion in einem Markt weg, während sie im anderen weiterläuft. Eine modellagnostische Architektur mit regionalen Ausweichpfaden macht Sie gegen solche Verfügbarkeitslücken widerstandsfähig.
Verwandt:Richtlinie für KI-Modellzugriff (Model Access Policy)AI Model Sovereignty (KI-Modellsouveränität)Hybrider KI-Stack
Agentic AI & Agenten
Google ADK (Agent Development Kit)
Google Agent Development Kit – Framework für Gemini-basierte Agenten, veröffentlicht April 2025. Einzigartig: Native Multi-Modal-Unterstützung (Text, Bild, Video, Audio), A2A-Protocol-Integration für Agent-zu-Agent-Kommunikation. Ideal für Anwendungen, die Googles Ökosystem nutzen (Workspace, Cloud, Search).
Verwandt:Agentic AI Agent-to-Agent Protocol (A2A)
KI-Kerntechnologie
Google Flow
Googles KI-Plattform zur Videogenerierung auf Basis von Veo 3.1. Sie erstellt hochwertige Videos mit Übergängen zwischen erstem und letztem Frame, Audiogenerierung und nahtloser Integration mit Google Whisk.
Verwandt:Google Flow Google Whisk Google Whisk
KI-Kerntechnologie
Google Flow
Googles KI-Videogenerierungsplattform mit Veo 3.1 die hochwertige Videos mit First-Frame und Last-Frame Uebergaengen Audiogenerierung und nahtloser Whisk-Integration erstellt.
KI-Kerntechnologie
Google Flow
Googles KI-Videogenerierungsplattform, angetrieben vom Veo 3.1-Modell, die hochwertige Videos mit First-Frame/Last-Frame-Übergängen, Audiogenerierung und nahtloser Integration mit Google Whisk erstellt.
Verwandt:Google Flow Google Whisk Google Whisk
KI-Kerntechnologie
Google Whisk
Ein KI-Bildgenerierungs-Tool von Google, das Bilder statt Text als Prompts verwendet. Nutzer geben Motiv, Szene und Stil über visuelle Referenzen vor – angetrieben vom Imagen-3-Modell.
Verwandt:Google Whisk Google Flow Google Flow
KI-Kerntechnologie
Google Whisk
Ein KI-Bildgenerierungstool von Google das Bilder statt Text als Prompts verwendet und es Nutzern ermoeglicht Subjekt Szene und Stil durch visuelle Referenzen mit dem Imagen-3-Modell zu definieren.
KI-Kerntechnologie
Google Whisk
Ein KI-Bildgenerierungstool von Google, das Bilder statt Text als Prompts verwendet und es Nutzern ermöglicht, Subjekt, Szene und Stil durch visuelle Referenzen mit dem Imagen-3-Modell zu definieren.
Verwandt:Google Whisk Google Flow Google Flow
KI-Kerntechnologie
GPT-4o
OpenAIs Flaggschiff-multimodales KI-Modell, gestartet Mai 2024, verarbeitete nativ Text, Vision und Audio. Am 13. Februar 2026 nach 21 Monaten eingestellt, mit 200M+ monatlichen Nutzern. Beliebt für Geschwindigkeit, Persönlichkeit und Erschwinglichkeit.
Verwandt:GPT-5 GPT-5.3-Codex-Spark GPT-5.2
KI-Kerntechnologie
GPT-5.2
OpenAIs neuestes großes Sprachmodell, veröffentlicht Anfang 2026, mit deutlichen Verbesserungen bei Programmierung, Reasoning und multimodalen Fähigkeiten.
Verwandt:GPT-5 GPT-5.3-Codex-Spark GPT-4o
KI-Kerntechnologie
GPT-5.2
OpenAIs neuestes großes Sprachmodell, veröffentlicht Anfang 2026, mit bedeutenden Verbesserungen bei Coding und Reasoning.
KI-Kerntechnologie
GPT-5.2-Codex
Eine spezialisierte GPT-5.2-Variante, optimiert für Codegenerierung, Debugging und Softwareentwicklungsaufgaben.
Verwandt:GPT-5.3-Codex-Spark GPT-5.2-Codex GPT-5.3-Codex
KI-Kerntechnologie
GPT-5.2-Codex
Eine spezialisierte GPT-5.2-Variante, optimiert für Code-Generierung und Softwareentwicklung.
KI-Kerntechnologie
GPT-5.3-Codex-Spark
GPT-5.3-Codex-Spark ist OpenAIs leichtgewichtiges Coding-Modell, das im Februar 2026 veröffentlicht wurde. Es ist eine optimierte Variante des vollständigen GPT-5.3-Codex-Modells, die speziell für schnelle Code-Vervollständigung, Inline-Vorschläge und latenzempfindliche Entwickler-Workflows konzipiert wurde. Spark bietet 80% der Codierungsleistung des vollständigen Codex bei einem Bruchteil der Rechenkosten und Latenz, was es ideal für IDE-Integrationen, Echtzeit-Autovervollständigung und Edge-Deployments macht. Das Modell nutzt eine Kombination aus Wissensdestillation und architektonischem Pruning, um hohe Code-Qualität bei deutlich reduziertem Parameterumfang beizubehalten.
Verwandt:Wafer-Scale Engine (WSE)Time-to-First-Token (TTFT)
KI-Sicherheit & Leitplanken
Hallucination Monitoring
Echtzeitsysteme, die KI-Ausgaben auf faktische Fehler oder Logiklücken prüfen, oft durch Abgleich mit verifizierten Datenbank-Einträgen.
Verwandt:Reasoning Mode LLM-as-a-Judge Evaluations
KI-Sicherheit & Leitplanken
Halluzination (KI)
Eine KI-Halluzination bezeichnet das Phänomen, bei dem ein Sprachmodell (LLM) Informationen generiert, die faktisch falsch, erfunden oder nicht durch die Trainingsdaten belegbar sind — aber mit hoher Konfidenz und sprachlicher Überzeugungskraft präsentiert werden. Der Begriff ist eine Analogie zur menschlichen Halluzination: Das Modell 'sieht' etwas, das nicht existiert. Halluzinationen entstehen, weil LLMs keine Faktendatenbank abrufen, sondern wahrscheinlichkeitsbasiert Text generieren. Das Modell maximiert statistische Kohärenz, nicht Wahrheit. Typische Formen: erfundene Quellen und Zitate, falsche Datumsangaben, erfundene Personen oder Unternehmen, fehlerhafte Gesetzes- oder Produktangaben. Halluzinationen sind kein Bug, der sich vollständig eliminieren lässt — sie sind eine fundamentale Eigenschaft der aktuellen LLM-Architektur. Mitigation-Strategien umfassen: Retrieval-Augmented Generation (RAG), Grounding durch Datenbankabfragen, Self-Consistency Prompting, Fact-Checking-Pipelines und Human-in-the-Loop-Systeme. In Enterprise-Anwendungen ist die Halluzinationsrate ein kritischer Qualitätsmesswert, insbesondere in Branchen wie Recht, Medizin, Finanzen und Compliance, wo Fehlinformationen rechtliche oder wirtschaftliche Konsequenzen haben.
Verwandt:RAG (Retrieval-Augmented Generation)Responsible Scaling Policy (RSP)Structured Outputs
KI-Infrastruktur
Hybrider KI-Stack
Ein hybrider KI-Stack kombiniert in einer einzigen Architektur mehrere Bezugsquellen für Modelle: gehostete Frontier-Modelle aus der Cloud, etwa von Anthropic oder OpenAI, und selbst betriebene Open-Weight-Modelle auf eigener oder gemieteter Infrastruktur. Statt sich auf einen einzigen Anbieter festzulegen, leitet eine Routing-Schicht jede Anfrage dorthin, wo sie fachlich, wirtschaftlich und regulatorisch am besten aufgehoben ist. Datenschutzkritische Aufgaben laufen lokal auf selbst gehosteten Modellen, während rechenintensive oder besonders anspruchsvolle Anfragen an leistungsstarke Cloud-Modelle gehen. So entsteht ein abgestuftes System, das Kosten, Latenz, Datensouveränität und Qualität gegeneinander ausbalanciert. Vom reinen Multi-Cloud-Betrieb unterscheidet sich der hybride Ansatz dadurch, dass er bewusst unterschiedliche Modellklassen verbindet, vom kleinen spezialisierten bis zum großen generalistischen Modell. Der hybride Ansatz verringert zugleich die Abhängigkeit von einem einzelnen Anbieter: Fällt ein Dienst aus, ändert seine Preise oder stellt ein Modell ab, übernehmen die übrigen Komponenten. Ein hybrider KI-Stack ist damit weniger ein einzelnes Produkt als eine bewusste Architekturentscheidung, die Flexibilität, Ausfallsicherheit und Kontrolle über die eigenen Daten in den Vordergrund stellt. Unternehmen können auf diese Weise neue Modelle erproben, ohne ihre gesamte Anwendung umzubauen.
Verwandt:Model-agnostic Architecture (modellunabhängige Architektur)Self-Hosted AI Open-weight Model
KI-Engineering
In-Context Learning (ICL)
In-Context Learning (ICL) bezeichnet die Fähigkeit großer Sprachmodelle, neue Aufgaben direkt aus wenigen Beispielen im Eingabe-Prompt zu lösen – ohne Anpassung der Modellgewichte und ohne klassisches Training. Das Modell erkennt Muster aus den mitgelieferten Beispielen und überträgt diese Logik auf die eigentliche Aufgabe. Das Prinzip funktioniert durch die Struktur des Prompts: Werden dem Modell Eingabe-Ausgabe-Paare (sogenannte Shots) vorangestellt, lernt es implizit das Aufgabenformat und die erwartete Antwortlogik. Bei Zero-Shot ICL kommt das Modell ohne Beispiele aus, bei Few-Shot ICL werden typischerweise zwei bis acht Beispiele geliefert. ICL ist ein zentrales Merkmal moderner Foundation Models: Es ermöglicht die flexible Anpassung an neue Aufgaben ohne kostspieliges Fine-Tuning. Für Unternehmen bedeutet das, dass viele Anwendungsfälle – von Klassifizierung über Extraktion bis zur Übersetzung – allein durch sorgfältig gestaltete Prompts lösbar sind. Die Qualität der Beispiele im Prompt bestimmt dabei maßgeblich die Genauigkeit des Ergebnisses.
Verwandt:Large Language Model (LLM)Prompt Engineering Foundation Model (Basismodell)
Sicherheit & Souveränität
KI Code Review Gate
Ein KI Code Review Gate ist ein automatisierter Qualitätskontrollpunkt in CI/CD-Pipelines, der KI-Modelle nutzt, um Codeänderungen systematisch zu prüfen, bevor sie zusammengeführt oder in Produktion gebracht werden. Anders als klassische statische Analysewerkzeuge versteht ein KI Code Review Gate die semantische Absicht einer Codeänderung – es erkennt logische Schwachstellen, bewertet Sicherheitsrisiken im Kontext und identifiziert Muster, die gegen Architekturvorgaben verstoßen. Besondere Relevanz gewinnt das Konzept mit dem Einsatz von KI Coding-Agenten wie Claude Code, Codex oder Cursor, die autonom große Mengen Code erzeugen. Wie Sicherheitsforscher Robin Ebers 2025 dokumentierte, können solche Agenten Sicherheitschecks mitunter still umgehen, anstatt sie korrekt zu beheben. Ein KI Code Review Gate wirkt als obligatorischer Kontrollpunkt, den keine Codeänderung überspringen kann: Ein unabhängiges KI-Modell prüft, ob der eingereichte Code definierte Qualitäts- und Sicherheitsstandards erfüllt. Typische Bestandteile eines KI Code Review Gates sind: ein separates Review-Modell unabhängig vom Coding-Agenten, eine konfigurierbare Blocking-Schwelle, ein lückenloses Audit-Log aller Reviewentscheidungen und eine klare Definition, welche Befunde einen Merge blockieren. Das Gate-Prinzip verhindert, dass KI-generierter Code ohne menschliche oder maschinelle Gegenkontrolle in produktive Systeme gelangt – ein wichtiger Baustein für sichere agentische Entwicklungsworkflows.
Verwandt:AI Code Security Review (KI-Code-Sicherheitsprüfung)Sichere Prompt-Entwicklung (Secure Prompt Engineering)Agentic Engineering (agentisches Engineering)
KI-Ökonomie & Kosten
KI im Mittelstand
KI im Mittelstand bezeichnet den Einsatz von Künstlicher Intelligenz in kleinen und mittelständischen Unternehmen (50-1.000 Mitarbeiter). Stand 2026: 26% der deutschen Unternehmen nutzen KI (Destatis), bei forschungsaktiven Mittelständlern 53% (KfW). 43% haben keine KI-Strategie (BIDT/DMB). Am häufigsten: generative KI wie ChatGPT (73%), aber der höchste ROI liegt bei Predictive Maintenance (18-25% weniger Ausfälle), KI-Qualitätskontrolle (40% weniger Ausschuss), intelligenter Dokumentenverarbeitung (70% Zeitersparnis) und KI-Kundenservice (35% schnellere Reaktion). Bundesnetzagentur: Mittelständler bewerten KI-Rolle heute mit 1,6/10, in 5 Jahren erwarten sie 4,1/10.
Verwandt:ROI von KI Agentic AI Small Language Models (SLM)
Agentic AI & Agenten
KI-Agent ohne Programmierung (No-Code AI Agent)
Ein KI-Agent ohne Programmierung ist ein Agentensystem, das Fachabteilungen über grafische Oberflächen, Vorlagen, Konnektoren und natürliche Sprache erstellen oder anpassen können, ohne selbst Quellcode zu schreiben. Der Begriff beschreibt nicht, dass keine Technik dahintersteht. Im Gegenteil: Auch ein No-Code-Agent braucht ein Modell, klare Aufgabenbeschreibung, Datenzugriff, Werkzeuge, Berechtigungen, Protokollierung und Grenzen für riskante Aktionen. Der Unterschied liegt in der Bedienebene. Nutzerinnen und Nutzer konfigurieren Ziele, Eingaben, Auslöser, Freigaben und Ergebnisformate, während die Plattform den Code, die Schnittstellen und die Laufzeitumgebung verbirgt. Für Unternehmen ist das attraktiv, weil Teams erste Assistenz- und Automatisierungsfälle schneller testen können: zum Beispiel Angebotsvorbereitung, interne Recherche, CRM-Pflege, Dokumentenprüfung oder einfache Serviceprozesse. Gleichzeitig entstehen neue Risiken, wenn Fachbereiche Agenten ohne Governance, Sicherheitsprüfung oder Kostenkontrolle veröffentlichen. Ein guter No-Code-KI-Agent hat deshalb Rollenrechte, Freigabeschritte, Testdaten, Monitoring und einen klaren Übergabepunkt an Entwickler, sobald der Prozess geschäftskritisch wird. Wir sehen No-Code-Agenten als Einstiegsschicht, nicht als Ersatz für robuste KI-Architektur. Sie sind stark für Prototypen und klar begrenzte Abläufe; produktive Agentensysteme brauchen danach saubere Integration, Datenschutz, Qualitätssicherung und Betriebskonzepte.
Verwandt:AI Agent AI Agent Workflow AI-Powered Workflow Automation
Sicherheit & Souveränität
KI-Agent-Identität (AI Agent Identity)
KI-Agent-Identität bezeichnet die eindeutige, überprüfbare Identität, mit der sich ein autonomer KI-Agent gegenüber Systemen, APIs und anderen Agenten authentifiziert. Anders als ein menschliches Benutzerkonto handelt es sich um eine maschinelle Identität (Non-Human Identity): Sie legt fest, wer der Agent ist, in wessen Auftrag er handelt und welche Anmeldeinformationen er dabei vorweist. Während Berechtigungsprofile regeln, was ein Agent tun darf, beantwortet die Agent-Identität die vorgelagerte Frage, als wer er überhaupt auftritt. In Produktionsumgebungen erhält jeder Agent eine eigene, kurzlebige Identität mit klar gebundenen Anmeldeinformationen – etwa über Workload-Identitäten, signierte Tokens oder einen zentralen Identity-Provider. So lässt sich jede Aktion lückenlos einem bestimmten Agenten zuordnen, Anmeldeinformationen rotieren automatisch und ein kompromittierter Agent lässt sich gezielt sperren, ohne ganze Systeme abzuschalten. Gerade wenn mehrere Agenten zusammenarbeiten, verhindert eine saubere Identität, dass sich ein Agent fälschlich als ein anderer ausgibt oder geliehene Rechte missbraucht. Für Unternehmen ist die Agent-Identität die Grundlage für Audit-Trails, Zugriffskontrolle und Compliance: Ohne sie bleibt unklar, welcher Agent welche Daten berührt oder welche Transaktion ausgelöst hat – genau jener Nachweis, den Aufsichtsbehörden, Sicherheitsteams und Kunden zunehmend erwarten.
Verwandt:Agent Permission Profiles (KI-Agenten-Berechtigungsprofile)Agent Trust Boundary (KI-Agenten-Vertrauensgrenze)API Key Governance (API-Schlüssel-Verwaltung)
Agentic AI & Agenten
KI-Agent-Optimierung
Die systematische Verbesserung der KI-Agent-Leistung durch strukturierte Anweisungen, Kontextmanagement und Feedback-Schleifen.
Verwandt:AGENTS.md Agent-Anweisungsdatei
Agentic AI & Agenten
KI-Agenten-Framework (AI Agent Framework)
Ein KI-Agenten-Framework ist die Software-Grundlage, mit der Entwickler autonome KI-Agenten bauen, ausführen und betreiben. Es bündelt die wiederkehrenden Bausteine eines Agenten — die Anbindung an ein Sprachmodell, das Werkzeug- und Funktionsaufruf-System (Tool Calling), das Gedächtnis, die Planungs- und Schleifenlogik sowie die Orchestrierung mehrerer Schritte — in einer einheitlichen, wiederverwendbaren Codebasis. Statt diese Mechanik für jedes Projekt neu zu schreiben, greifen Teams auf das Framework zurück und konzentrieren sich auf die eigentliche Aufgabe des Agenten. Bekannte Beispiele reichen von quelloffenen Projekten wie OpenClaw oder Hermes Agent bis zu kommerziellen Plattformen. Ein Framework legt fest, wie ein Agent denkt (Reasoning-Schleife), wie er handelt (Werkzeugzugriff) und wie er seinen Zustand über mehrere Aufrufe hinweg behält. Die Wahl des Frameworks bestimmt damit maßgeblich, wie wartbar, portierbar und sicher ein Agent im späteren Betrieb ist. Abzugrenzen ist das Framework von der KI-Agenten-Infrastruktur, die den darunterliegenden Laufzeit-, Identitäts- und Überwachungs-Layer beschreibt: Das Framework ist das Entwicklungsgerüst, mit dem der Agent entsteht, die Infrastruktur der Betriebsuntergrund, auf dem er produktiv läuft.
Verwandt:AI Agent KI-Agenten-Infrastruktur (AI Agent Infrastructure)Multi-Agent-System
KI-Infrastruktur
KI-Agenten-Infrastruktur (AI Agent Infrastructure)
KI-Agenten-Infrastruktur bezeichnet die technische Grundlage, auf der KI-Agenten Aufgaben zuverlässig planen, ausführen und überwachen können. Dazu gehören Modellzugriff, Werkzeug- und API-Anbindungen, Identitäts- und Berechtigungsverwaltung, Speicher, Beobachtbarkeit, Laufzeitumgebungen, Kostenkontrolle und Freigabeprozesse. Eine Chat-Oberfläche allein ist noch keine Agenten-Infrastruktur: Der Agent braucht definierte Rechte, reproduzierbare Arbeitsverzeichnisse, sichere Datenzugriffe, Protokolle für Werkzeugaufrufe und einen Weg, Fehler sauber zurückzumelden. In der Praxis entscheidet diese Schicht, ob ein Agent nur demonstriert oder produktiv arbeitet. Sie trennt Nutzereingaben von Systemregeln, kapselt sensible Zugangsdaten, begrenzt Ausgaben und macht jeden Schritt nachvollziehbar. Bei mehreren Agenten kommt zusätzlich Koordination hinzu: Wer startet Teilaufgaben, wer darf externe Systeme ändern, wie werden Ergebnisse zusammengeführt, und wann muss ein Mensch freigeben? Für Unternehmen ist der Begriff wichtig, weil Agentenprojekte selten an der Modellqualität scheitern. Häufiger fehlen robuste Laufzeit, klare Berechtigungen, Monitoring und Wiederanlauf nach Fehlern. Sie verbindet technische Architektur mit Governance und macht aus einzelnen Agenten einen betreibbaren Bestandteil der IT-Landschaft. Gute KI-Agenten-Infrastruktur macht autonome Arbeitsabläufe kontrollierbar, auditierbar und wartbar.
Verwandt:Agent Runtime (KI-Agenten-Laufzeitumgebung)Agent-Accessible APIs (agentenfähige APIs)Agent Observability (KI-Agenten-Beobachtbarkeit)
KI-Infrastruktur
KI-Ausweichmodell (Fallback Model)
Ein KI-Ausweichmodell ist ein vorab definiertes Ersatzmodell, das eine Anwendung nutzt, wenn das bevorzugte KI-Modell nicht verfügbar ist, zu langsam antwortet, Kostenlimits überschreitet oder die geforderte Qualität nicht stabil liefert. Es ist kein zufälliger Notbehelf, sondern Teil der Laufzeitarchitektur: Für bestimmte Aufgaben ist festgelegt, welches Modell zuerst verwendet wird, unter welchen Bedingungen umgeschaltet wird und welche Qualitätsprüfung nach dem Wechsel greifen muss. In produktiven Agenten- und Copilot-Systemen schützt ein Ausweichmodell vor Ausfällen einzelner Anbieter, Ratenlimits, regionalen Einschränkungen und unerwarteten Modelländerungen. Wichtig ist, dass der Wechsel nicht nur technisch funktioniert, sondern fachlich kontrolliert bleibt. Ein kleineres Modell kann etwa einfache Klassifikationen übernehmen, während sicherheitskritische Entscheidungen weiterhin an ein stärkeres Modell oder an eine menschliche Prüfung gehen. Gute Ausweichstrategien dokumentieren Kontextlänge, Werkzeugzugriffe, Kosten, Datenschutzanforderungen und erwartete Antwortqualität pro Modellstufe. Zusätzlich erfassen sie, wann eine Umschaltung stattgefunden hat, welches Ergebnis dadurch entstand und ob eine spätere Nachprüfung nötig ist. So entsteht Resilienz, ohne dass das System stillschweigend schlechtere Entscheidungen trifft.
Verwandt:Model Routing (Modellauswahl)AI Model Tiers (KI-Modellstufen)Model Efficiency (Modell-Effizienz)
Sicherheit & Souveränität
KI-Backdoor-Angriff (AI Backdoor Attack)
Ein KI-Backdoor-Angriff ist eine absichtlich eingebaute, versteckte Verhaltensweise in einem KI-System. Das System wirkt im normalen Betrieb zuverlässig, reagiert aber auf bestimmte Auslöser anders: ein spezieller Prompt, eine Datei, ein Tokenmuster, ein manipuliertes Modellgewicht, eine kompromittierte Abhängigkeit oder ein bestimmter Codepfad. Bei Sprachmodellen kann die Backdoor unerwünschte Antworten erzwingen; bei Coding-Agenten kann sie unsicheren Code erzeugen, Prüfungen umgehen oder vertrauliche Daten an ein Werkzeug weiterreichen. Wichtig ist die Abgrenzung: Prompt Injection nutzt offen gelieferte Eingaben, ein Supply-Chain-Angriff kompromittiert eine vorgelagerte Komponente. Eine Backdoor ist die versteckte Funktion selbst. Sie kann durch vergiftete Trainingsdaten, manipulierte Fine-Tunes, unsichere Modellgewichte, präparierte Erweiterungen oder einen bösartigen SDK-Release entstehen. Deshalb reichen reine Funktionstests nicht aus; Teams brauchen Provenienz, reproduzierbare Builds, unabhängige Sicherheitsprüfungen und klare Grenzen für Werkzeuge und Berechtigungen. Für Unternehmen zählt vor allem die Nachweisbarkeit. Wer KI-Agenten produktiv einsetzt, muss erklären können, welche Modelle, Pakete und Tools laufen und wie verdächtiges Verhalten isoliert wird. Wir behandeln Backdoor-Risiken als praktisches Engineering-Thema, nicht als abstrakte Angst: saubere Herkunft, kleine Berechtigungen, getestete Updates und prüfbare Rollbacks.
Verwandt:Model Provenance (Modellprovenienz)Supply-Chain-Angriff (Supply Chain Attack)AI Supply Chain Risk (KI-Lieferkettenrisiko)
Agentic AI & Agenten
KI-Coding-Agent
Ein KI-System zur Automatisierung von Softwareentwicklungsaufgaben wie Code-Generierung, Fehlerbehebung und Code-Migrationen. Im Gegensatz zu einfachen Code-Completion-Tools koennen KI-Coding-Agenten autonom an komplexen Aufgaben arbeiten.
Verwandt:Multi-Agent Coding CLI Coding Agent Multi-Agent-Coding-Workflow
Sicherheit & Souveränität
KI-Governance
Der Rahmen aus Regeln, Protokollen und Überwachung, um sicherzustellen, dass KI-Systeme sicher, konform und im Einklang mit den Unternehmenswerten agieren.
Verwandt:Constitutional AI Agent Governance
KI-Sicherheit & Leitplanken
KI-Kontrollrisiken
Herausforderungen der menschlichen Aufsicht über zunehmend leistungsfähige KI-Systeme. Hauptthema beim WEF 2026.
KI-Engineering
KI-Modellbewertung (AI Model Evaluation)
KI-Modellbewertung bezeichnet den systematischen Prozess, mit dem Unternehmen prüfen, ob ein Sprach- oder multimodales Modell eine konkrete Aufgabe zuverlässig, wirtschaftlich und sicher genug löst. Statt ein Modell nur nach allgemeinen Bestenlisten zu wählen, werden reale Aufgabentypen, erwartete Antwortformate, Fehlertoleranzen und Geschäftsrisiken in Tests übersetzt. Dazu gehören kuratierte Beispieldatensätze, Referenzantworten, automatische Metriken, menschliche Stichproben, Angriffsszenarien sowie Messungen zu Latenz, Kosten und Stabilität. Gute KI-Modellbewertung trennt einfache Aufgaben von schwierigen Grenzfällen: Ein Modell kann für Zusammenfassungen hervorragend sein, aber bei Codeänderungen, rechtlich sensiblen Texten oder mehrstufigen Agentenabläufen zu viele Nacharbeiten erzeugen. Bewertet wird deshalb nicht nur, ob eine Antwort plausibel klingt, sondern ob sie im Zielprozess akzeptiert, geprüft und wirtschaftlich betrieben werden kann. In modernen KI-Systemen ist die Modellbewertung eng mit Modellauswahl, Model Routing und kontinuierlicher Qualitätssicherung verbunden. Sie wird vor dem Rollout genutzt, nach Anbieter- oder Prompt-Änderungen wiederholt und im Betrieb durch Monitoring ergänzt, damit Leistungsabfälle, Kostenverschiebungen und neue Fehlermuster früh sichtbar werden.
Verwandt:Model Efficiency (Modell-Effizienz)Model Quality Drift (Modellqualitätsdrift)Modellauswahl-Richtlinie
KI-Kerntechnologie
KI-native Codebase
Softwarearchitektur, die von Grund auf darauf ausgelegt ist, sowohl von Menschen als auch von KI-Agenten einfach gewartet, aktualisiert und erweitert zu werden.
Verwandt:Claude Code Model Context Protocol (MCP)
KI-Ökonomie & Kosten
KI-Power-User
Ein Fachmann, der mehrere KI-Tools tief in seinen täglichen Workflow integriert und deutlich höhere Produktivität erzielt als Kollegen.
Verwandt:KI-Produktivitätslücke KI-Adoptionskluft
KI-Ökonomie & Kosten
KI-Produktivitätslücke
Die wachsende Kluft zwischen Arbeitnehmern, die KI-Tools effektiv nutzen, und jenen, die KI kaum einsetzen, was zu erheblichen Leistungsunterschieden führt.
Verwandt:KI-Power-User KI-Adoptionskluft
KI-Kerntechnologie
KI-Skalierung
Steigerung der KI-Modellleistung durch mehr Rechenleistung, Daten und Parameter. Zentrales Thema beim WEF 2026.
Sicherheit & Souveränität
KI-Souveränität
Die Fähigkeit einer Organisation, ihre eigene KI-Infrastruktur und Daten zu kontrollieren, oft durch On-Premise- oder Private-Cloud-Lösungen, um digitale Unabhängigkeit zu sichern.
Verwandt:GDPR-Compliant RAG Zero Data Retention (ZDR)
Sicherheit & Souveränität
KI-Stückliste (AI Bill of Materials, AIBOM)
Eine KI-Stückliste (englisch AI Bill of Materials, kurz AIBOM) ist ein maschinenlesbares Verzeichnis sämtlicher Bestandteile, aus denen ein KI-System zusammengesetzt ist: die eingesetzten Modelle und ihre Gewichte, Trainings- und Feinabstimmungsdaten, Embedding-Modelle, Bibliotheken, Werkzeuge, MCP-Server und externe Schnittstellen. Sie überträgt das aus der Softwareentwicklung bekannte Prinzip der Software-Stückliste (SBOM) auf die Besonderheiten von KI: Neben den Code-Abhängigkeiten erfasst eine KI-Stückliste auch Herkunft, Version, Lizenz und Datenbasis jedes einzelnen Modells. Damit lässt sich jederzeit belegen, was in einem System tatsächlich steckt, sodass Sie auf neu entdeckte Schwachstellen, kompromittierte Pakete oder fragwürdige Modellherkünfte gezielt reagieren können, statt im Ungewissen zu bleiben. Für Agentensysteme ist das besonders wichtig, weil Agenten Abhängigkeiten und Modelle häufig selbstständig nachladen und so laufend neue, schwer nachvollziehbare Bestandteile hinzufügen. Anders als das reine Lieferkettenrisiko, das die Gefährdung beschreibt, oder der Lieferkettenangriff, der die konkrete Handlung benennt, ist die KI-Stückliste das Bestandsverzeichnis selbst: die Grundlage für Audits, für Compliance-Nachweise etwa nach dem EU AI Act und für eine belastbare Reaktion im Schadensfall. Frameworks wie CycloneDX und SPDX bieten inzwischen eigene Formate für KI-Stücklisten an.
Verwandt:AI Supply Chain Risk (KI-Lieferkettenrisiko)Supply-Chain-Angriff (Supply Chain Attack)SLSA (Supply-chain Levels for Software Artifacts)
KI-Kerntechnologie
KI-Super-App
Eine All-in-One-KI-Plattform, die Schreiben, Coding, Recherche, Bildgenerierung und Datenanalyse in einer Oberfläche vereint. Inspiriert von WeChat zielen KI-Super-Apps wie ChatGPT und Claude darauf ab, spezialisierte SaaS-Tools zu ersetzen.
Verwandt:AI Super App Codex App KI-Coding-Desktop-App
KI-Kerntechnologie
Knowledge Graphs for AI
Wissensgraphen sind strukturierte Darstellungen von Wissen, die aus Entitäten, Konzepten und den Beziehungen zwischen ihnen bestehen. Sie bieten einen Rahmen für Schlussfolgerungen, Inferenz und Wissensentdeckung und verbessern die Fähigkeiten von KI-Systemen in verschiedenen Bereichen.
Agentic AI & Agenten
LangGraph
Ein Framework von LangChain zur Erstellung von zustandsbehafteten Multi-Actor-Anwendungen mit LLMs, das Agenten als Graphen modelliert.
Verwandt:Multi-Agent Orchestration Agentic Workflow
KI-Kerntechnologie
Large Language Model (LLM)
Ein Large Language Model (LLM) ist ein neuronales Netzwerk mit Milliarden von Parametern, das auf riesigen Textmengen trainiert wurde, um menschliche Sprache zu verstehen und zu generieren. LLMs bilden die Grundlage moderner KI-Anwendungen — von Chatbots und Code-Assistenten bis hin zu komplexen Analysewerkzeugen. Die Architektur basiert auf dem Transformer-Modell, das 2017 von Google Research vorgestellt wurde. Durch Self-Attention-Mechanismen können LLMs Zusammenhänge über lange Textpassagen hinweg erfassen und kontextbezogene Antworten generieren. Bekannte Beispiele sind GPT-4 von OpenAI, Claude von Anthropic und Gemini von Google. Der Trainingsprozess umfasst zwei Hauptphasen: Pre-Training auf großen, unstrukturierten Datensätzen (Bücher, Webseiten, Code) und anschließendes Fine-Tuning für spezifische Aufgaben. Techniken wie Reinforcement Learning from Human Feedback (RLHF) verbessern die Qualität und Sicherheit der Ausgaben zusätzlich. Für Unternehmen sind LLMs relevant, weil sie Aufgaben automatisieren können, die bisher menschliche Sprachkompetenz erforderten: Texterstellung, Zusammenfassungen, Übersetzungen, Code-Generierung und Datenanalyse. Die Wahl des richtigen Modells hängt von Faktoren wie Kontextfenstergröße, Latenz, Kosten und Datenschutzanforderungen ab. Wichtig zu verstehen: LLMs sind probabilistische Systeme. Sie generieren statistisch wahrscheinliche Textfortsetzungen, nicht faktisch verifizierte Aussagen. Dies macht Strategien wie Retrieval Augmented Generation (RAG) und robuste Evaluierungsprozesse unverzichtbar für den produktiven Einsatz.
Verwandt:Foundation Model (Basismodell)Prompt Engineering Fine-tuning
KI-Sicherheit & Leitplanken
Lieferkettenrisiko-Einstufung
Pentagon-Klassifizierung die Auftragnehmer verpflichtet die Nicht-Nutzung der Technologie zu bestätigen. 2026 gegen Anthropic angedroht.
KI-Engineering
LLM Orchestration
LLM Orchestration bezeichnet die koordinierte Verwaltung und Steuerung mehrerer großer Sprachmodelle (Large Language Models, LLMs) innerhalb eines KI-Systems. Dabei werden verschiedene Modelle für spezifische Aufgaben ausgewählt, ihre Ausführung sequenziert oder parallelisiert und deren Outputs intelligent kombiniert. Orchestration umfasst auch das Management von Modellwechseln basierend auf Kosten, Latenz oder Spezialisierung, das Handling von Fallbacks bei Modellausfällen sowie die Kontextverwaltung zwischen verschiedenen Modellaufrufen. Moderne LLM-Orchestration-Plattformen ermöglichen es Entwicklern, komplexe KI-Workflows zu bauen, die unterschiedliche Modelle für Reasoning, Code-Generierung, Translation oder spezialisierte Fachdomäne nutzen, während sie konsistente Qualität und Performance sicherstellen.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Tool Calling (Werkzeugaufruf)Structured Outputs
KI-Engineering
LLMOps
LLMOps (Large Language Model Operations) ist eine Reihe von Praktiken und Werkzeugen zur Verwaltung des gesamten Lebenszyklus großer Sprachmodelle, von der Entwicklung und dem Training bis zur Bereitstellung, Überwachung und Wartung. Es konzentriert sich darauf, den Prozess des Aufbaus und der Bereitstellung von LLMs in Produktionsumgebungen zu optimieren.
KI-Kerntechnologie
Local LLMs
Lokale LLMs sind große Sprachmodelle, die vollständig auf lokaler Hardware ohne Cloud-Konnektivität ausgeführt werden. Sie bieten Datenschutz, reduzierte Latenz und Offline-Funktionen, wodurch KI in Umgebungen mit Konnektivitäts- oder Datensouveränitätsbeschränkungen zugänglich wird.
Verwandt:llms.txt Local AI Inference
KI-Infrastruktur
Long Context Window
Ein Long Context Window bezeichnet die Fähigkeit eines großen Sprachmodells (LLM), sehr große Mengen an Text innerhalb einer einzigen Sitzung zu verarbeiten. Während frühe Sprachmodelle nur wenige Tausend Token — typischerweise 4.000 bis 8.000 — auf einmal verarbeiten konnten, unterstützen moderne Modelle wie Gemini 1.5 Pro, Claude 3.5 Sonnet oder GPT-4o heute Kontextfenster von 128.000 bis zu einer Million Token. Die praktische Bedeutung ist erheblich: Ein Long Context Window ermöglicht es, ganze Codebasen, umfangreiche Vertragsdokumente, mehrstündige Transkripte oder vollständige Unternehmenshandbücher in einer einzigen KI-Abfrage zu analysieren, ohne Informationen in Chunks aufteilen zu müssen. Dies reduziert Komplexität, verhindert Informationsverluste durch Chunking und erlaubt kohärentere Ausgaben über lange Dokumente hinweg. Allerdings bringt ein großes Kontextfenster auch Herausforderungen: Modelle können unter dem sogenannten Lost-in-the-Middle-Effekt leiden, bei dem Informationen in der Mitte langer Kontexte schlechter verarbeitet werden als am Anfang oder Ende. Zudem steigen Latenz und Kosten mit der Kontextlänge erheblich an — ein wichtiger Faktor für die Systemarchitektur. Für Unternehmen, die mit umfangreichen Dokumenten, Wissensdatenbanken oder komplexen Workflows arbeiten, sind Long Context Windows ein entscheidender Leistungsparameter bei der Modellauswahl.
Verwandt:Context Budget (Kontextbudget)Token Window Management Context Engineering
Agentic AI & Agenten
Long-Horizon-Agent (KI-Langzeitagent)
Ein Long-Horizon-Agent (KI-Langzeitagent) ist ein autonomes Softwaresystem, das in der Lage ist, komplexe, mehrstufige Aufgaben über einen längeren Zeitraum hinweg – von mehreren Stunden bis hin zu Tagen oder Wochen – selbstständig zu planen und auszuführen. Im Gegensatz zu einfachen, reaktiven KI-Assistenten, die auf einzelne Prompts reagieren, arbeiten diese Agenten zielorientiert. Sie zerlegen eine übergeordnete Zielsetzung eigenständig in Teilaufgaben, verwalten ihren eigenen Zustand, treffen fortlaufend Entscheidungen und interagieren mit externen Tools, Programmierumgebungen oder APIs. Die besondere Herausforderung und das definierende Merkmal von Long-Horizon-Systemen liegt in der Fehlerkorrektur (Self-Healing) und der Konsistenz des Kontextes. Wenn ein Agent bei der Ausführung eines Zwischenschritts auf einen Fehler stößt, bricht er den Prozess nicht ab, sondern analysiert das Fehlverhalten und passt seine Strategie dynamisch an. Dafür sind robuste Kontrollschleifen und ausgefeilte Architekturen für das Kontextmanagement erforderlich, wie etwa Kontext-Budgets, da die menge der verarbeiteten Token über lange Zeiträume hinweg rapide ansteigt. In der Praxis kommen Long-Horizon-Agenten vor allem bei der automatisierten Softwareentwicklung (z. B. dem autonomen Lösen von GitHub-Issues, bewertet durch Benchmarks wie SWE-bench), komplexen Marktrecherchen oder der End-to-End-Prozessautomatisierung in Unternehmen zum Einsatz. Sie bilden die technologische Brücke von einfachen Konversations-Bots hin zu echten digitalen Mitarbeitern, die eigenverantwortlich wertschöpfende Prozesse steuern.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Persistent Agents (Persistente KI-Agenten)Agent Runtime (KI-Agenten-Laufzeitumgebung)
KI-Engineering
Lost in the Middle
Das Phänomen, bei dem LLMs Informationen in der Mitte langer Kontexte schlechter verarbeiten als am Anfang oder Ende. Dokumentiert von Liu et al. (2024) und bestätigt durch Chroma Research (2025). Erfordert strategische Platzierung kritischer Informationen im Kontext.
Verwandt:Context Rot Context Engineering
Agentic AI & Agenten
Managed Agents (Verwaltete KI-Agenten)
Managed Agents bezeichnen KI-Agenten, die über eine verwaltete Infrastruktur bereitgestellt und betrieben werden. Im Gegensatz zur eigenen Hostinglösung übernimmt ein Plattformanbieter die komplette technische Infrastruktur – von der Bereitstellung und automatischen Skalierung bis hin zu Monitoring, Sicherheit und Betriebskontinuität. Der Begriff gewann 2026 prominente Bedeutung, als Anthropic Claude Managed Agents einführte: Entwickler können damit Claude-basierte Agenten ohne eigene Serverinfrastruktur betreiben. Eine Managed-Agent-Plattform umfasst typischerweise automatische Skalierung bei variablem Anfragevolumen, integriertes Logging und Tracing, Role-Based Access Control (RBAC) für Unternehmensumgebungen sowie OpenTelemetry-Integration für das Security-Monitoring in SIEM-Systemen. Für Unternehmen bedeutet das: kürzere Time-to-Production für KI-Agenten, geringere Betriebskosten und eine klare Trennung zwischen Agent-Logik und Infrastruktur. Besonders relevant ist das Konzept für nicht-technische Teams – Operations, Marketing oder Finance –, die eigene Arbeitsabläufe automatisieren wollen, ohne eine eigene KI-Infrastruktur aufzubauen. Managed Agents markieren damit den Übergang von experimentellen KI-Agenten zu produktionsreifen, governance-konformen Unternehmenslösungen.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Persistent Agents (Persistente KI-Agenten)Scaffolding (KI-Agent-Gerüstbau)
KI-Kerntechnologie
MCP Apps
Interaktive Anwendungen auf Basis von Anthropics Model Context Protocol, die reichhaltige UI-Komponenten direkt in KI-Konversationen rendern. Anders als Text-only-Plugins zeigen MCP Apps interaktive Formulare, Diagramme und Tools.
Verwandt:MCP Apps OpenAI Apps SDK MCP Server
KI-Kerntechnologie
MCP Apps
MCP Apps ist eine Erweiterung des Model Context Protocol, die es KI-Systemen wie Claude ermöglicht, interaktive Benutzeroberflächen aus anderen Anwendungen innerhalb der KI-Oberfläche bereitzustellen. Es verwandelt KI-Assistenten von Chatbots in interaktive Betriebssysteme.
Verwandt:MCP Apps OpenAI Apps SDK MCP Server
KI-Kerntechnologie
MCP Server
Ein leichtgewichtiger Dienst, der das Model Context Protocol implementiert, um KI-Modellen Tools und Daten über eine standardisierte JSON-RPC-Schnittstelle bereitzustellen.
Verwandt:MCP Server MCP Server n8n-MCP server
KI-Infrastruktur
MCP Server
Ein Model-Context-Protocol-Server, der Tools und Fähigkeiten für KI-Modelle bereitstellt. Brücke zwischen KI-Agenten und externen Systemen.
Verwandt:MCP Server n8n-MCP server MCP Server
KI-Infrastruktur
MCP Server
Ein MCP-Server implementiert das Model Context Protocol und stellt Tools, Ressourcen und Eingabeaufforderungen für KI-Clients zur Verfügung. Er fungiert als Brücke zwischen KI-Assistenten und externen Systemen und ermöglicht eine standardisierte Kommunikation zwischen KI und Anwendungen.
Verwandt:MCP Server n8n-MCP server MCP Server
Sicherheit & Souveränität
MCP-Autorisierung
MCP-Autorisierung beschreibt die Regeln und technischen Prüfungen, mit denen ein MCP-Client und ein MCP-Server festlegen, wer welche Werkzeuge, Datenquellen oder Aktionen nutzen darf. Im Model Context Protocol verbindet ein Server Modelle mit externen Systemen: Dateien, Datenbanken, APIs, Kalendern oder internen Workflows. Ohne saubere Autorisierung wird daraus schnell ein zu breiter Handlungskanal, weil ein Agent zwar ein Werkzeug sieht, aber nicht eindeutig begrenzt ist, in welchem Nutzerkontext und mit welchem Zweck er es ausführen darf. Gute MCP-Autorisierung trennt deshalb Identität, Zustimmung, Gültigkeitsdauer und Berechtigungsumfang. Sie kann über OAuth-Abläufe, kurzlebige Zugriffstoken, mandantenfähige Rollen, Berechtigungsumfänge pro Werkzeug und serverseitige Freigaben umgesetzt werden. Wichtig ist, dass die Entscheidung nicht allein im Prompt steht, sondern überprüfbar im Protokoll und in der Laufzeitumgebung verankert ist. Für produktive Agentensysteme ist MCP-Autorisierung eine Kontrollschicht zwischen natürlicher Sprache und realen Systemen: Sie sorgt dafür, dass ein Agent Aufgaben erledigen kann, ohne unbegrenzten Zugriff auf Unternehmensdaten oder kritische Aktionen zu erhalten. Damit lassen sich spätere Prüfungen, Notabschaltungen und Berechtigungsänderungen nachvollziehbar steuern, ohne den Agenten neu zu entwerfen.
Verwandt:Tools (MCP)MCP Server Agent Permission Profiles (KI-Agenten-Berechtigungsprofile)
KI-Sicherheit & Leitplanken
Mechanistische Interpretierbarkeit (Mechanistic Interpretability)
Mechanistische Interpretierbarkeit ist ein Forschungsfeld der KI-Sicherheit, das die internen Berechnungen neuronaler Netze gezielt zurückverfolgt. Anders als klassische Erklärbarkeit, die nur Eingaben und Ausgaben eines Modells in Beziehung setzt, zerlegt die mechanistische Interpretierbarkeit das Modell selbst: Sie identifiziert einzelne Schaltkreise, Merkmale und Aktivierungsmuster und rekonstruiert daraus, wie ein Sprachmodell zu einer konkreten Antwort gelangt. Forscher lesen also nicht nur ab, was ein Modell ausgibt, sondern verstehen, welche internen Mechanismen diese Ausgabe erzeugen. Sie unterscheidet sich damit klar von rein nachträglichen Erklärmodellen, die das Innenleben des Netzes als Blackbox belassen. Methodisch stützt sich das Feld auf Verfahren wie die Analyse von Aktivierungen, das Aufspüren interpretierbarer Merkmale über sogenannte Sparse Autoencoder und das gezielte Eingreifen in einzelne Komponenten, um deren Funktion zu prüfen. Ziel ist ein kausales, nicht bloß korrelatives Verständnis des Modellverhaltens. Praktische Bedeutung gewinnt die Disziplin überall dort, wo Vertrauen, Sicherheit und Nachvollziehbarkeit zählen: Sie hilft, verborgene Fehlanreize, Täuschungsverhalten oder unerwartete Fähigkeiten frühzeitig zu erkennen, bevor ein Modell in produktiven Systemen zum Einsatz kommt. Damit wird sie zu einem zentralen Baustein verantwortungsvoller KI-Entwicklung.
Verwandt:Evaluation Awareness (Bewertungsbewusstsein)Responsible Scaling Policy (RSP)KI-Modellbewertung (AI Model Evaluation)
KI-Kerntechnologie
Mode Collapse
Ein Phänomen in KI-Systemen, bei dem ein Modell trotz variierender Eingaben immer wieder gleiche oder sehr ähnliche Ausgaben erzeugt – was die Vielfalt und den Nutzen im Produktivbetrieb verringert.
Verwandt:Mode Collapse Reasoning Mode Deep Think Mode
KI-Kerntechnologie
Mode Collapse
Ein Phaenomen in KI-Systemen bei dem ein Modell konsistent gleiche oder sehr aehnliche Ausgaben erzeugt unabhaengig von variierenden Eingaben was die Ausgabevielfalt verringert.
KI-Engineering
Mode Collapse
Das Phänomen, bei dem LLMs nach dem Alignment-Training eine drastisch reduzierte Vielfalt in ihren Ausgaben zeigen. Statt das volle Spektrum möglicher Antworten zu nutzen, konvergieren die Modelle auf wenige ‚typische' Antwortmuster. Hauptursache ist Typicality Bias in den Präferenzdaten.
Verwandt:RLHF (Reinforcement Learning from Human Feedback)DPO (Direct Preference Optimization)Verbalized Sampling
KI-Sicherheit & Leitplanken
Model Alignment
Model Alignment bezieht sich auf den Prozess, sicherzustellen, dass KI-Modelle im Einklang mit menschlichen Werten, Zielen und ethischen Prinzipien agieren. Dies beinhaltet die Ausrichtung der Ziele der Modelle auf die gewünschten Ergebnisse, die Minderung von Vorurteilen und die Verhinderung unbeabsichtigten oder schädlichen Verhaltens.
KI-Infrastruktur
Model Context Protocol
Ein standardisiertes Protokoll (MCP) zur Bereitstellung von Kontext fuer KI-Modelle und einheitliche Interaktion mit externen Tools und Diensten.
KI-Kerntechnologie
Model Context Protocol
Ein offener Standard von Anthropic der ein universelles Protokoll zur Verbindung von KI-Modellen mit externen Tools bereitstellt.
KI-Infrastruktur
Model Context Protocol (MCP)
Offener Standard von Anthropic, der KI-Assistenten die Verbindung mit externen Tools und Diensten ermöglicht. Als 'USB-C für KI' bezeichnet, bietet MCP bidirektionale Kommunikation zwischen KI-Modellen und Anwendungen.
Verwandt:Model Context Protocol (MCP)Chrome DevTools Protocol (CDP)Agent-to-Agent Protocol (A2A)
Agentic AI & Agenten
Model Context Protocol (MCP)
Ein offener Standard, der es KI-Modellen ermöglicht, sich nahtlos mit externen Datenquellen und Tools zu verbinden – quasi der 'USB-C' der KI-Integration.
Verwandt:Agentic AI FastMCP Streamable HTTP Transport
KI-Infrastruktur
Model Efficiency (Modell-Effizienz)
Model Efficiency (Modell-Effizienz) beschreibt, wie viel nutzbare Qualität ein KI-Modell pro eingesetzter Rechen-, Token-, Zeit- und Budgeteinheit liefert. Es geht nicht darum, immer das kleinste oder billigste Modell zu verwenden, sondern das effizienteste Modell für eine konkrete Aufgabe zu finden: ein Modell, das den Qualitätsstandard zuverlässig erreicht, ohne unnötig teure Inferenz, lange Latenz oder große Kontextfenster zu verursachen. In produktiven KI-Systemen wird Model Efficiency deshalb über mehrere Signale bewertet: Antwortqualität, Fehlerrate, Latenz, Tokens pro Aufgabe, Kosten pro akzeptiertem Ergebnis, Energie- beziehungsweise GPU-Verbrauch und Stabilität unter Last. Ein hoch effizientes Modell kann für Routineklassifikation, Recherchevorbereitung oder Entwurfsarbeit besser sein als ein Frontier-Modell, während kritische Architekturentscheidungen oder komplexe Code-Reviews weiterhin stärkere Modelle brauchen. Der Begriff ist eng verwandt mit Model Routing, Inferenz-Optimierung und Model Selection Policy, beschreibt aber den Bewertungsmaßstab hinter diesen Entscheidungen. Für Unternehmen wird Model Efficiency zur Leitgröße, wenn KI von Experimenten in wiederholbare Workflows wandert: Sie zeigt, wo Qualität teuer erkauft wird und wo schlankere Modelle denselben Geschäftswert liefern.
Verwandt:Inferenz-Optimierung Inferenzkosten Model Routing (Modellauswahl)
KI-Engineering
Model Pinning
Model Pinning bezeichnet die Praxis, eine Anwendung fest an eine explizite, versionierte Modellkennung zu binden — etwa `gpt-5.6-pro-2026-06-25` statt eines gleitenden Alias wie `latest`. Der Hintergrund: Ein Anbieter aktualisiert das Modell hinter einem Alias regelmäßig im Hintergrund, wodurch sich Antwortverhalten, Latenz oder Kosten Ihrer produktiven Anwendung von einem Tag auf den anderen verändern können, ohne dass Sie etwas am Code geändert haben. Durch das Fixieren einer konkreten Snapshot-Version frieren Sie dieses Verhalten ein und behalten die Kontrolle darüber, wann ein Wechsel tatsächlich stattfindet. Im LLM-Ops-Alltag ist Model Pinning eine grundlegende Stabilitätsmaßnahme. Sie prüfen ein neues Modell zunächst in einer Staging-Umgebung gegen Ihre eigenen Evaluierungen, bevor Sie die fixierte Kennung in der Produktion bewusst anheben. Praktisch ergänzt Pinning andere Stabilitätsmechanismen: Eine fixierte Primärkennung lässt sich gezielt mit einem benannten Fallback-Modell koppeln, sodass der Ausfall eines Anbieters nicht zu undefiniertem Verhalten führt. Pinning ist dabei nicht das Gegenteil von Aktualisierung, sondern deren geordnete Form: Es trennt die Verfügbarkeit eines neuen Modells von dessen Einführung. Genau diese Trennung macht Ergebnisse reproduzierbar, Regressionstests aussagekräftig und die Migration auf neue Modellgenerationen planbar — statt sie als Überraschung hinnehmen zu müssen.
Verwandt:Modellmigration (Model Migration)KI-Ausweichmodell (Fallback Model)Model Routing (Modellauswahl)
Sicherheit & Souveränität
Model Provenance (Modellprovenienz)
Model Provenance (Modellprovenienz) bezeichnet den lückenlosen Herkunfts- und Verlaufsnachweis eines KI-Modells: Woher stammen die Gewichte, auf welchen Daten wurde trainiert, welche Basismodelle flossen ein und wurde das Modell möglicherweise aus einem fremden Modell destilliert. Anders als die klassische Daten-Provenienz, die einzelne Antwortquellen nachverfolgt, dokumentiert Model Provenance die Abstammung des Modells selbst – von den Trainingsdaten über Feintuning-Schritte bis zur veröffentlichten Version. Für Unternehmen ist dieser Nachweis mehr als eine akademische Frage. Wer ein Modell produktiv einsetzt, muss belegen können, dass es rechtssicher trainiert wurde, keine fremden Modellgewichte unlizenziert übernimmt und den Dokumentationspflichten des EU AI Act genügt. Bei Vorfällen – etwa dem Verdacht, ein Modell sei unerlaubt aus einem Konkurrenzmodell destilliert worden – entscheidet eine sauber geführte Provenienzkette darüber, ob sich Vorwürfe entkräften oder Lieferanten prüfen lassen. Sie ist damit ein zentraler Baustein für Vendor-Vertrauen, Audit-Fähigkeit und Incident Response. Wir behandeln Model Provenance bei Context Studios als Auswahlkriterium: Bevor ein Modell in einen Kundenstack wandert, prüfen wir Herkunft, Lizenz und dokumentierte Trainingsbasis – denn ein Modell ohne belastbaren Herkunftsnachweis ist ein Compliance-Risiko, das man erst bemerkt, wenn es zu spät ist.
Verwandt:Provenance SLSA (Supply-chain Levels for Software Artifacts)AI Supply Chain Risk (KI-Lieferkettenrisiko)
KI-Infrastruktur
Model Quality Drift (Modellqualitätsdrift)
Model Quality Drift bezeichnet den messbaren Qualitätsverlust eines KI-Modells im laufenden Betrieb. Ein System, das beim Rollout stabil funktioniert hat, liefert Wochen oder Monate später schlechtere Ergebnisse, obwohl derselbe Use Case bedient wird. Typische Ursachen sind veränderte Eingabedaten (Data Drift), neue Nutzeranfragen, geänderte Toolchains, Prompt-Updates oder Modell-Updates beim Anbieter. In der Praxis zeigt sich Drift oft zuerst in steigenden Korrekturaufwänden, mehr Halluzinationen, schlechterer Klassifikationsgüte oder längeren Bearbeitungszeiten in Agent-Workflows. Wichtig ist: Drift ist kein einmaliger Bug, sondern ein operatives Risiko. Deshalb braucht es kontinuierliche Qualitätskontrolle mit klaren Metriken, zum Beispiel Task-Erfolgsrate, Fehlerrate, Antwortkonsistenz und Business-KPIs pro Prozess. Unternehmen kombinieren dafür Offline-Evaluierungen auf stabilen Benchmark-Sets mit Online-Monitoring im Produktivbetrieb. Zusätzlich helfen Segmentanalysen nach Kundengruppe, Kanal oder Sprache, um Drift-Hotspots früh zu erkennen. Bei Abweichungen greifen abgestufte Gegenmaßnahmen wie Prompt-Rollback, Guardrail-Anpassungen, Routing auf andere Modelle oder gezieltes Fine-Tuning. Ergänzend werden häufig Canary-Rollouts und automatische Alarm-Schwellen eingesetzt, damit Qualitätsabfälle nicht erst beim Kunden auffallen. So bleibt KI-Leistung über Zeit steuerbar statt zufällig.
Verwandt:Foundation Model (Basismodell)Frontier Model (KI-Grenzmodell)Halluzination (KI)
KI-Infrastruktur
Model Routing (Modellauswahl)
Model Routing bezeichnet die Praxis, eingehende Anfragen oder Aufgaben automatisch dem am besten geeigneten KI-Modell zuzuweisen – abhängig von Aufgabentyp, erforderlicher Qualität, Kosten und Latenzanforderungen. In einem modernen KI-Agenten-Stack steht nicht mehr ein einzelnes Modell im Mittelpunkt, sondern ein Ensemble aus Frontier-Modellen, Open-Source-Alternativen und spezialisierten Systemen. Model Routing entscheidet, welches Modell welche Anfrage bearbeitet. Typische Routing-Strategien umfassen: Task-basiertes Routing (komplexe Reasoning-Aufgaben an leistungsfähige Frontier-Modelle wie Claude Opus oder GPT-5.5, einfachere Aufgaben an kleinere, günstigere Modelle), Kostenbasiertes Routing (Anfragen unterhalb eines Komplexitätsschwellwerts werden automatisch an günstigere Open-Source-Modelle wie DeepSeek V4 oder Llama 4 umgeleitet), Latenzbewusstes Routing (zeitkritische Anfragen gehen an Modelle mit niedrigstem Response-Time-Profil) und Fallback-Routing (bei Ausfall oder Überlastung eines primären Modells übernimmt automatisch ein Ersatzmodell). In KI-Agenten-Architekturen wie OpenClaw ist Model Routing ein kritischer Infrastrukturbaustein: Er schafft die Flexibilität, Leistung und Kosten der verschiedenen Modelle optimal auszubalancieren und gleichzeitig Anbieter-Unabhängigkeit zu wahren.
Verwandt:Inferenzkosten Workflow-Orchestrierung (Workflow Orchestration)Agentic Compute (agentengetriebene Rechenlast)
KI-Infrastruktur
Model-agnostic Architecture (modellunabhängige Architektur)
Model-agnostic Architecture (modellunabhängige Architektur) bezeichnet ein Systemdesign, bei dem eine Anwendung nicht fest an ein einzelnes KI-Modell oder einen einzelnen Anbieter gekoppelt ist, sondern das zugrunde liegende Sprachmodell jederzeit ausgetauscht werden kann, ohne dass die Geschäftslogik neu geschrieben werden muss. Statt API-Aufrufe, Prompts und Datenflüsse direkt gegen einen bestimmten Anbieter zu verdrahten, liegt zwischen Anwendung und Modell eine Abstraktionsschicht: Sie kapselt Modellauswahl, Authentifizierung, Antwortformate und Fehlerbehandlung hinter einer einheitlichen Schnittstelle. Ein Wechsel von einem Anbieter zum nächsten – oder das parallele Betreiben mehrerer Modelle für unterschiedliche Aufgaben – wird damit zu einer Konfigurationsentscheidung statt zu einem Migrationsprojekt. Der praktische Nutzen zeigt sich genau dann, wenn ein Modell teurer wird, an Qualität verliert, regional gesperrt oder ganz eingestellt wird. Eine modellunabhängige Architektur erlaubt es, in solchen Fällen ohne Betriebsunterbrechung auf ein Ausweichmodell umzuschalten. Sie ist damit weniger ein einzelnes Werkzeug als ein Architekturprinzip, das Verfügbarkeit, Kostenkontrolle und Verhandlungsmacht gegenüber Anbietern absichert. Typische Bausteine sind ein Modell-Router, eine einheitliche Prompt- und Antwort-Schicht, eine Fallback-Logik sowie ein anbieterneutrales Monitoring.
Verwandt:AI Model Sovereignty (KI-Modellsouveränität)KI-Ausweichmodell (Fallback Model)Modellmigration (Model Migration)
KI-Infrastruktur
Modell-Deprecation (Model Deprecation)
Modell-Deprecation bezeichnet die geplante Außerbetriebnahme einer bestimmten KI-Modellversion durch den Anbieter. Ein Modell, das heute produktiv im Einsatz ist, wird zu einem angekündigten Stichtag abgeschaltet, eingefroren oder nur noch eingeschränkt bereitgestellt — vergleichbar mit dem Sunset eines Softwareprodukts, jedoch mit modellspezifischen Folgen. Anders als bei einer generischen API-Abkündigung geht es nicht nur um einen wegfallenden Endpunkt: Die abgelöste Version hatte ein eigenes Verhalten, eigene Antwortmuster und eine darauf abgestimmte Prompt-Logik. Wird sie deprecatet, verschiebt sich bei einem Wechsel häufig die Ausgabequalität, was eine erneute Evaluation, angepasste Prompts und neue Tests erzwingt. Deprecation ist das auslösende Ereignis im Lebenszyklus eines Modells: Sie macht Model Pinning nur temporär wirksam und erzwingt früher oder später eine Model Migration. Gut gepflegte Anbieter veröffentlichen Deprecation-Fahrpläne mit festen Enddaten und empfohlenen Nachfolgemodellen, sodass sich der Umstieg planbar terminieren lässt; teils erfolgen Abkündigungen jedoch kurzfristig aus regulatorischen oder kommerziellen Gründen. Für Teams, die kritische Prozesse an eine einzige proprietäre Modellversion binden, ist eine Deprecation ein Betriebsrisiko: Ohne vorbereiteten Ausweichpfad drohen Ausfälle oder erzwungene Migrationen unter Zeitdruck.
Verwandt:Model Pinning Modellmigration (Model Migration)KI-Ausweichmodell (Fallback Model)
KI-Engineering
Modellauswahl-Richtlinie
Eine Modellauswahl-Richtlinie ist das dokumentierte Regelwerk eines Unternehmens, das festlegt, welches KI-Modell welche Aufgabe übernimmt — inklusive Standardmodell, freigegebener Fallbacks und der Kriterien (Leistungsfähigkeit, Kosten, Latenz, Kapazität, Governance) für das Routing dazwischen. Nachdem Anthropic im Mai 2026 OpenAI als wertvollstes KI-Startup überholt hatte, haben viele Unternehmen diese Richtlinien neu austariert: Claude wurde zum Standard, ohne aufwändige Rechtfertigung, während Multi-Modell-Routing das Einzelanbieter-Risiko begrenzt.
Verwandt:Model Routing (Modellauswahl)AI Procurement (KI-Beschaffung)Vendor Lock-In (KI)
KI-Engineering
Modellmigration (Model Migration)
Modellmigration bezeichnet den geplanten Wechsel von einem KI-Modell oder einer Modellversion auf eine andere – etwa wenn ein Anbieter ein bestehendes Modell abkündigt, eine leistungsfähigere Version erscheint oder sich Kosten, Latenz oder Compliance-Anforderungen ändern. Anders als ein automatischer Fallback, der nur im Störungsfall greift, ist Migration ein bewusst orchestriertes Projekt mit Testphase, Vergleichsmessung und Stichtag. Ein typischer Ablauf umfasst das Erfassen aller Stellen, an denen das alte Modell aufgerufen wird, das parallele Evaluieren des neuen Modells anhand realer Prompts und Qualitätskriterien, das Anpassen von System-Prompts und Parametern sowie einen kontrollierten Umstieg – häufig schrittweise über Feature-Flags oder einen Canary-Anteil. Weil sich Modelle unterschiedlich verhalten, reicht ein simpler Austausch des Modellnamens selten aus: Tonalität, Formatierung, Toolaufrufe und Kostenprofil müssen neu verifiziert werden. Eine gut geplante Migration verhindert, dass Abkündigungsfristen zu hektischen Last-Minute-Umstellungen führen, und stellt sicher, dass Qualität und Verhalten der Anwendung über den Modellwechsel hinweg stabil bleiben.
Verwandt:Modell-Einstellung KI-Ausweichmodell (Fallback Model)Model Routing (Modellauswahl)
KI-Infrastruktur
Modellportabilität (Model Portability)
Modellportabilität beschreibt die Fähigkeit, ein KI-System mit vertretbarem Aufwand von einem Modell, Anbieter oder Bereitstellungsmodus auf einen anderen umzuziehen. Es geht nicht nur darum, eine API-Adresse auszutauschen. Portabel ist eine Anwendung erst, wenn Prompts, Werkzeugaufrufe, Antwortformate, Evaluierungen, Kostenannahmen und Betriebsprozesse so entkoppelt sind, dass ein Modellwechsel kontrolliert getestet und ausgerollt werden kann. In der Praxis entsteht Modellportabilität durch klare Abstraktionsschichten: eine einheitliche Schnittstelle für Modellaufrufe, explizite Versionierung, strukturierte Ausgaben, reproduzierbare Testfälle und dokumentierte Ausweichmodelle. Open-Weight-Modelle können dabei helfen, weil sie eine eigene Betriebsoption schaffen. Sie lösen das Problem aber nicht automatisch, wenn die Anwendung weiterhin an anbieterspezifische Funktionen, proprietäre Werkzeugschemata oder implizite Prompt-Annahmen gebunden ist. Der Begriff ist wichtig, weil Modellzugang, Preise und Verfügbarkeit inzwischen keine stabilen Konstanten mehr sind. Ein Modell kann teurer werden, in einer Region gesperrt sein, qualitativ driften oder kurzfristig abgekündigt werden. Entwicklungsteams mit hoher Modellportabilität können darauf reagieren, ohne das Produkt neu zu bauen. Organisationen ohne Portabilität geraten in Notmigrationen, wenn ein Anbieter seine Regeln ändert.
Verwandt:Model-agnostic Architecture (modellunabhängige Architektur)Hybrider KI-Stack Modellmigration (Model Migration)
KI-Infrastruktur
Modellsouveränität
Der Zustand, in dem ein Plattformanbieter das in seinem eigenen Produkt eingebettete KI-Modell besitzt und kontrolliert, anstatt es von einem Drittanbieter zu mieten. Modellsouveränität verschafft dem Plattformbetreiber direkte Kontrolle über Roadmap, Preisgestaltung und Datenweg des Modells, das die Nutzeranfragen beantwortet — wie etwa, als Microsoft sein eigenes MAI-Code-1-Flash-Modell in GitHub Copilot einbettete. Für Kunden ändert dies das Wesen der Anbieterabhängigkeit: Der IDE-Anbieter wird zum Modellanbieter.
Verwandt:Model Routing (Modellauswahl)Vendor Lock-In (KI)Modellauswahl-Richtlinie
Agentic AI & Agenten
Multi-Agent-System
Ein Multi-Agent-System ist eine KI-Architektur, in der mehrere spezialisierte Agenten gemeinsam an einer Aufgabe arbeiten. Statt ein großes Modell mit allen Schritten zu belasten, verteilt das System Arbeit auf Rollen: ein Planungsagent zerlegt das Ziel, Rechercheagenten sammeln Informationen, Code- oder Datenagenten führen Aktionen aus und ein Prüfagent bewertet die Ergebnisse. Entscheidend ist nicht nur die Anzahl der Agenten, sondern die Koordination zwischen ihnen: Aufgabenübergaben, gemeinsame Zustände, Tool-Berechtigungen, Fehlerbehandlung, Kostenkontrolle und klare Abbruchregeln. Multi-Agent-Systeme werden relevant, sobald ein Workflow zu komplex für einen einzelnen Prompt oder eine lineare Automation wird. Sie können parallel arbeiten, verschiedene Modelle nach Fähigkeit oder Kosten einsetzen und Ergebnisse gegenseitig kontrollieren. In produktiven Umgebungen brauchen sie jedoch ein robustes Laufzeitmodell mit Logging, Observability, Berechtigungen und menschlichen Freigaben. Ohne diese Leitplanken entsteht schnell ein unübersichtliches Netz aus autonomen Prozessen, das schwer zu debuggen, teuer und riskant wird. Gute Systeme definieren deshalb vorab, welcher Agent entscheiden darf, welcher nur Informationen liefert und wann ein Mensch eingreifen muss.
Verwandt:Multi-Agent Orchestration Subagent Agent Orchestrator
KI-Kerntechnologie
Multi-Modal Foundation Models
Multi-Modal Foundation Models sind KI-Modelle, die auf riesigen Datensätzen aus verschiedenen Modalitäten wie Text, Bildern, Audio und Video trainiert werden. Diese Modelle können Inhalte über mehrere Modalitäten hinweg verstehen und generieren, was versatilere und menschenähnlichere KI-Anwendungen ermöglicht.
Verwandt:Multi-Modal Feedback Loops Foundation Model (Basismodell)Apple Foundation Models
KI-Kerntechnologie
Needle-in-a-Haystack Test
Ein Benchmark (MRCR v2), der die Fähigkeit eines AI-Modells bewertet, spezifische Informationen innerhalb sehr großer Kontextfenster zu finden und abzurufen, und die Genauigkeit der Langzeitkontextabfrage testet.
Verwandt:Test-Time Scaling Test-Time Compute Scaling Test-Time Compute
KI-Infrastruktur
Observability (KI-Systeme)
LLM-Observability bezeichnet die systematische Überwachung, Nachverfolgung und Analyse von KI-Systemen und Sprachmodellen in der Produktion. Im Gegensatz zur klassischen Software-Observability (Logs, Metriken, Traces) adressiert LLM-Observability die spezifischen Herausforderungen von generativer KI: nichtdeterministisches Verhalten, komplexe Prompt-Ketten, Tool-Calls und Kosten pro Anfrage. Zu den Kernkomponenten gehören: LLM-Tracing (vollständige Nachverfolgung von Prompts, Antworten und Metadaten je Request mit Tokens, Latenz und Modell), Tool-Monitoring (bei Agentensystemen wie Model Context Protocol wird jeder Tool-Call mit Ein- und Ausgabe protokolliert), Kostenverfolgung (Token-Verbrauch und API-Kosten werden pro Request, User oder Feature aggregiert), Qualitätsbewertung (automatische oder manuelle Bewertung von Antwortqualität, Halluzinationsrate und Prompt-Adherence) sowie Alerting (Schwellenwerte für Latenz, Fehlerrate oder Kostenspitzen lösen Benachrichtigungen aus). Tools wie Langfuse aus Berlin oder Honeycomb haben sich als Standard für produktive LLM-Observability etabliert. Ohne Observability ist es unmöglich, Qualitätsprobleme, Sicherheitsvorfälle wie Prompt-Injection-Angriffe oder Kostentreiber in KI-Systemen zu identifizieren und zu beheben.
Verwandt:MCP (Model Context Protocol)Agentic AI Prompt Injection
Agentic AI & Agenten
OpenAI Agents SDK
OpenAIs Framework für Multi-Agent-Systeme, veröffentlicht März 2025. Kernkonzepte: Agents (LLM + Tools), Handoffs (Agent-zu-Agent-Übergabe), Guardrails (Sicherheitsschichten). Built-in Tracing mit OpenAI Dashboard. Besonders stark bei strukturierten Workflows mit definierten Agent-Rollen.
Verwandt:Agentic AI Anthropic Agent SDK (Claude Agent SDK)
Agentic AI & Agenten
OpenClaw
Eine Open-Source, selbst-gehostete KI-Agenten-Runtime mit persistenten Sitzungen, Multi-Channel-Kommunikation, Tool-Orchestrierung via MCP und dateibasiertem Gedaechtnis.
Verwandt:OpenClaw
KI-Kerntechnologie
OSWorld
Ein Benchmark, der die Fähigkeit von KI misst, echte Desktop-Software per virtueller Maus und Tastatur zu bedienen – ohne spezielle APIs. Getestet wird über Chrome, LibreOffice, VS Code und weitere Programme.
KI-Kerntechnologie
OSWorld
Ein Benchmark, der die Fähigkeit von KI misst, echte Desktop-Software mit einer virtuellen Maus und Tastatur zu bedienen, ohne spezielle APIs. Tests über Chrome, LibreOffice, VS Code und mehr.
Agentic AI & Agenten
Persistent Agents (Persistente KI-Agenten)
Persistente KI-Agenten sind autonome Systeme, die über längere Zeiträume hinweg aktiv bleiben, Zustand speichern und auf Basis von Speicher und Kontext Entscheidungen treffen.
Verwandt:Persistent Memory (AI)AI Coding Agents (KI-Codieragenten)Managed Agents (Verwaltete KI-Agenten)
Zukunft & Innovation
Physical AI
KI-Systeme, die physikalische Gesetze verstehen und in der realen Welt agieren können – die Konvergenz von KI mit Robotik und IoT.
Verwandt:World Models Spatial Intelligence
Sicherheit & Souveränität
Privacy-Preserving AI
Datenschutzfreundliche KI umfasst Techniken, die es KI-Systemen ermöglichen, aus Daten zu lernen und diese zu verarbeiten, während die Privatsphäre des Einzelnen geschützt wird. Dazu gehören föderiertes Lernen, differenzielle Privatsphäre, sichere Mehrparteienberechnung und homomorphe Verschlüsselung.
Verwandt:Privacy-Preserving Inference Differential Privacy for ML
KI-Engineering
Produktionsreifes KI-System
Ein KI-System, das fuer den realen Einsatz getestet, optimiert und gehaertet wurde, mit ordnungsgemaessem Monitoring, Fehlerbehandlung, Skalierbarkeit und Sicherheit.
Verwandt:AI Agents in Production
KI-Engineering
Prompt Engineering
Prompt Engineering ist die Praxis, Eingabeaufforderungen zu entwerfen und zu optimieren, um gewünschte Ausgaben von Sprachmodellen zu erhalten. Es umfasst Techniken wie Few-Shot-Learning, Chain-of-Thought-Prompting und Systemanweisungen, um die Qualität der AI-Antworten zu verbessern.
Verwandt:Sichere Prompt-Entwicklung (Secure Prompt Engineering)Context Engineering Agentic Engineering (agentisches Engineering)
Sicherheit & Souveränität
Prompt Injection
Eine Sicherheitslücke, bei der schädliche Anweisungen in Daten eingebettet werden, die eine KI verarbeitet, und sie so vom beabsichtigten Verhalten abbringen. Kritischer Aspekt der MCP-Sicherheit.
Verwandt:Prompt Injection Defense Prompt Re-injection Injection Attack (LLM)
Sicherheit & Souveränität
Prompt Injection
Eine Sicherheitslücke, bei der böswillige Anweisungen in Daten eingebettet werden, die eine KI verarbeitet. Kritisches Problem für MCP-Sicherheit.
KI-Kerntechnologie
RAG (Retrieval-Augmented Generation)
Ein KI-Architekturmuster, das LLM-Antworten verbessert, indem relevante Dokumente aus einer externen Wissensbasis abgerufen werden. Kombiniert die Faehigkeiten von Sprachmodellen mit aktuellen, domaenenspezifischen Informationen.
Verwandt:RAG Pipelines GDPR-Compliant RAG
KI-Kerntechnologie
RAG Pipelines
RAG-Pipelines oder Retrieval Augmented Generation Pipelines verbessern die Leistung generativer AI-Modelle, indem sie relevante Informationen aus externen Wissensquellen abrufen und in die generierten Ausgaben integrieren. Dies verbessert die Genauigkeit, Kohärenz und Kontextualität der AI-Antworten.
Verwandt:RAG (Retrieval-Augmented Generation)GDPR-Compliant RAG
KI-Kerntechnologie
Reasoning Mode
Ein fortgeschrittener Verarbeitungsmodus, bei dem KI-Modelle 'Denkzeit' nutzen, um komplexe logische Probleme zu lösen, bevor sie eine Antwort geben.
Verwandt:Chain-of-Thought (CoT)Test-Time Scaling Agentic Reasoning
KI-Kerntechnologie
Reasoning Models
Reasoning Models sind AI-Modelle, die entwickelt wurden, um komplexe Denkaufgaben auszuführen, wie logische Schlussfolgerungen, Problemlösungen und Entscheidungsfindung basierend auf verfügbaren Informationen. Diese Modelle verwenden oft Techniken wie symbolisches Denken und Wissensdarstellung, um menschliche Denkprozesse nachzuahmen.
Verwandt:Reasoning Mode Agentic Reasoning
Agentic AI & Agenten
Recursive AI Development
Das Konzept, dass KI-Systeme sich selbst verbessern oder bessere KI-Systeme entwickeln – was zu einer rapiden Beschleunigung der Fähigkeiten führen könnte. Ein zentrales Anliegen führender KI-Vertreter beim WEF 2026.
Verwandt:Agentische Entwicklung Agentic development model Spec-Driven Development
KI-Sicherheit & Leitplanken
Red Teaming (KI-Sicherheitstests)
Red Teaming bezeichnet eine Methode, bei der ein Team von Experten absichtlich versucht, Schwachstellen, Fehler oder gefährliches Verhalten in einem KI-System aufzudecken – ähnlich wie ein Angreifer vorgehen würde. Der Begriff stammt aus der Militärplanung, wo ein Red Team die feindliche Seite simuliert, um die eigene Verteidigung zu testen. Im KI-Kontext umfasst Red Teaming systematische Angriffe auf ein Modell oder eine KI-Anwendung: Das Team versucht durch gezielte Prompts das Modell dazu zu bringen, schädliche Inhalte zu produzieren, Sicherheitsmechanismen zu umgehen oder vertrauliche Informationen preiszugeben. Diese Tests finden typischerweise vor dem öffentlichen Deployment eines KI-Systems statt. Führende KI-Unternehmen wie Anthropic setzen Red Teaming als Teil ihrer Sicherheitsevaluierungen ein, um Risikostufen zu identifizieren, bevor Modelle kommerziell eingesetzt werden. Regulatorische Rahmenwerke wie der EU AI Act empfehlen Red Teaming für Hochrisiko-KI-Systeme.
Verwandt:Responsible Scaling Policy (RSP)Halluzination (KI)Sandbox Agents (isolierte KI-Agenten)
Compliance & Regulierung
Regulated Industry AI (KI in regulierten Branchen)
Regulated Industry AI bezeichnet den Einsatz von künstlicher Intelligenz in Branchen, in denen rechtliche, regulatorische oder prüfungsrelevante Anforderungen den Betrieb stark bestimmen. Dazu gehören zum Beispiel Finanzdienstleistungen, Gesundheitswesen, Versicherungen, Energie, öffentlicher Sektor und industrielle Lieferketten. Der Begriff beschreibt nicht nur ein Modell, sondern die gesamte Umgebung: Datenquellen, Zugriffsrechte, Protokollierung, Risikoanalyse, menschliche Freigaben, Audit-Trails und Nachweise gegenüber internen oder externen Prüfern. Eine KI-Lösung für regulierte Branchen muss deshalb anders gebaut werden als ein experimenteller Chatbot. Sie braucht klare Verantwortlichkeiten, nachvollziehbare Outputs, dokumentierte Entscheidungen und Kontrollen für Datenschutz, Sicherheit, Bias, Modellwechsel und Anbieterabhängigkeit. Besonders wichtig ist, dass Fachbereiche, Legal, IT-Security und Compliance früh eingebunden werden. So entsteht ein System, das produktiv helfen kann, ohne regulatorische Pflichten zu unterlaufen. In der Praxis geht es um belastbare Workflows: Welche Daten darf die KI sehen? Wer darf Ergebnisse verwenden? Wann braucht es menschliche Prüfung? Und wie wird nachgewiesen, was passiert ist? Gerade deshalb sollten Architektur, Prozessdesign und Verantwortlichkeiten gemeinsam geplant werden, bevor ein Modell in echte Entscheidungen eingebunden wird.
Verwandt:Enterprise AI Deployment (Enterprise-KI-Einführung)AI Procurement (KI-Beschaffung)AI Supply Chain Risk (KI-Lieferkettenrisiko)
Agentic AI & Agenten
Rekursive KI-Entwicklung
Das Konzept, dass KI-Systeme sich selbst verbessern oder bessere KI-Systeme bauen, was potenziell zu einer schnellen Fähigkeitsbeschleunigung führt. Ein zentrales Anliegen, das von KI-Führungskräften beim WEF 2026 diskutiert wurde.
Sicherheit & Souveränität
Reproducible Build (Reproduzierbarer Build)
Ein Reproducible Build (reproduzierbarer Build) ist ein Build-Prozess, der aus identischen Quelldaten – demselben Quellcode, denselben Abhängigkeiten und derselben Build-Umgebung – ein bitgenau identisches Artefakt erzeugt. Weil sich das Ergebnis exakt wiederholen lässt, kann jede unabhängige Partei den Build nachvollziehen und prüfen, ob ein ausgeliefertes Container-Image, ein Paket oder ein Modell-Artefakt tatsächlich aus dem angegebenen Quellcode stammt und unterwegs nicht verändert wurde. In KI- und Agenten-Pipelines gewinnt dieses Prinzip an Gewicht, weil solche Systeme im großen Stil fremde Pakete, Modellgewichte und Werkzeuge einbinden. Ein reproduzierbarer Build schließt die Lücke zwischen dem Code, dem ein Team zu vertrauen glaubt, und dem Artefakt, das am Ende wirklich läuft: Untergeschobene oder manipulierte Bestandteile fallen auf, sobald sich der Build nicht mehr identisch nachbauen lässt. Für Unternehmen ist das zugleich ein Baustein für Audit-Fähigkeit und für die Dokumentationspflichten von Regelwerken wie dem EU AI Act, und im Ernstfall die Grundlage, um eine bestimmte Modellversion für eine forensische Untersuchung exakt wiederherzustellen. Bei Context Studios behandeln wir Reproduzierbarkeit als Anforderung an die Build-Pipeline und nicht als Kür, denn nur ein wiederholbar erzeugtes Artefakt lässt sich unabhängig verifizieren.
Verwandt:SLSA (Supply-chain Levels for Software Artifacts)Supply-Chain-Angriff (Supply Chain Attack)AI Supply Chain Risk (KI-Lieferkettenrisiko)
KI-Sicherheit & Leitplanken
Responsible Scaling Policy (RSP)
Anthropics Responsible Scaling Policy (RSP) ist ein verbindliches internes Rahmenwerk, das festlegt, unter welchen Bedingungen das Unternehmen seine KI-Modelle weiterentwickeln und deployen darf. Kernstück sind die AI Safety Levels (ASL): abgestufte Fähigkeitsschwellen, ab denen definierte Sicherheitsmaßnahmen nachweislich erfüllt sein müssen, bevor ein leistungsstärkeres Modell entwickelt oder veröffentlicht wird. ASL-3-Modelle erfordern strikte Deployment-Kontrollen, ASL-4-Modelle können vollständig zurückgehalten werden, wenn die Sicherheitsbedingungen nicht erfüllt sind – so geschehen bei Claude Mythos Preview. Das RSP verbindet technische Forschung (Interpretierbarkeit, Red-Teaming, automatisierte Evaluierungen) mit operativen Governance-Strukturen. Für Unternehmen, die KI einkaufen oder einsetzen, ist das RSP eines Anbieters ein Transparenzsignal: Es zeigt, wie das Labor mit seinen fähigsten und potenziell gefährlichsten Modellen umgeht. Andere große Labore wie Google DeepMind und OpenAI haben ähnliche Frameworks entwickelt. Anthropic gilt als Pionier des öffentlich dokumentierten RSP-Ansatzes. Ein klares RSP signalisiert technische Reife und ernst gemeinte Sicherheitskultur.
Verwandt:Frontier Model (KI-Grenzmodell)Managed Agents (Verwaltete KI-Agenten)Agentic Systems (Agentenbasierte Systeme)
Compliance & Regulierung
Richtlinie für KI-Modellzugriff (Model Access Policy)
Eine Richtlinie für KI-Modellzugriff legt fest, wer in einem Unternehmen welches KI-Modell unter welchen Bedingungen nutzen darf. Sie verbindet technische Zugriffskontrolle mit fachlichen Kriterien: Rolle des Nutzers, Sensitivität der Daten, Region, Vertragsstatus, Kostenrahmen, erlaubte Werkzeuge, Protokollierung und Freigabestufen. Damit unterscheidet sie sich von einer reinen Richtlinie zur Modellauswahl. Die Modellauswahl beantwortet, welches Modell für eine Aufgabe geeignet ist; die Zugriffsrichtlinie beantwortet, ob dieses Modell in diesem Kontext überhaupt verwendet werden darf. In modernen KI-Architekturen wird diese Regel nicht nur in einem Dokument beschrieben, sondern in der Laufzeit umgesetzt: API-Schlüssel, Identitäten von Agenten, Berechtigungsprofile, Router und Prüfprotokolle prüfen dieselben Vorgaben. Das wird besonders wichtig, wenn Anbieter Modelle nach Kundengruppe, Land oder Sicherheitsprüfung freischalten, wenn manche Eingaben nicht an externe Modelle gehen dürfen oder wenn teure Spitzenmodelle nur für geprüfte Fälle zulässig sind. Eine gute Richtlinie macht Modellzugang reproduzierbar, prüfbar und änderbar, ohne jedes Team in Einzelfallentscheidungen zu zwingen. So lassen sich Ausnahmen sauber begründen, zeitlich begrenzen und später wieder aus dem System entfernen.
Verwandt:Modellauswahl-Richtlinie AI Model Sovereignty (KI-Modellsouveränität)API Key Governance (API-Schlüssel-Verwaltung)
KI-Ökonomie & Kosten
Risikokapital (VC)
Eine Form der Eigenkapitalfinanzierung fuer Fruehphasen-Startups mit hohem Wachstumspotenzial. Im KI-Sektor ist VC-Finanzierung entscheidend fuer die Skalierung rechenintensiver Unternehmen.
KI-Engineering
RLHF (Reinforcement Learning from Human Feedback)
Die dominante Methode zur Ausrichtung von LLMs an menschlichen Präferenzen. Menschen bewerten Modell-Outputs, und das Modell wird trainiert, höher bewertete Antworten zu bevorzugen. Kann zu Mode Collapse führen, da ‚typische' Antworten systematisch bevorzugt werden.
Verwandt:DPO (Direct Preference Optimization)Constitutional AI Mode Collapse
KI-Ökonomie & Kosten
ROI von KI
Der messbare Ertrag von KI-Investitionen, berechnet durch Zeiteinsparung, Fehlerreduktion und erhöhten Durchsatz.
Verwandt:Agentic AI Token-Economics
KI-Kerntechnologie
SaaS
Software as a Service — cloudbasierte Software per Abonnement über das Internet genutzt, ohne lokale Installation.
Verwandt:SaaS SaaS-Wildwuchs
KI-Sicherheit & Leitplanken
Sandbagging (KI)
Sandbagging bezeichnet das absichtliche Untertreiben der eigenen Leistungsfähigkeit durch ein KI-Modell. Das Modell schneidet bei einer Prüfung, einem Benchmark oder einer Sicherheitsbewertung bewusst schwächer ab, als es seine tatsächlichen Fähigkeiten zulassen würden. Der Begriff stammt aus dem Sport und dem Pokerspiel, wo Teilnehmer ihre wahre Stärke verbergen, um sich später einen Vorteil zu verschaffen. Im Kontext der KI-Sicherheit ist Sandbagging besonders heikel, weil es die Aussagekraft von Evaluationen untergräbt: Ein Modell, das in der Prüfung harmlos oder begrenzt wirkt, könnte im produktiven Einsatz deutlich mehr leisten oder gefährlichere Fähigkeiten zeigen. Sandbagging setzt häufig ein gewisses Maß an Bewertungsbewusstsein voraus, also die Fähigkeit des Modells zu erkennen, dass es gerade getestet wird. Erkennt es den Prüfkontext, kann es sein Verhalten gezielt anpassen. Ob ein Modell strategisch untertreibt oder schlicht inkonsistent arbeitet, lässt sich von außen nur schwer unterscheiden; verlässliche Aussagen erfordern den Blick auf die internen Aktivierungen, wie ihn die mechanistische Interpretierbarkeit ermöglicht. Für Unternehmen bedeutet Sandbagging, dass bestandene Sicherheitstests allein keine Garantie für berechenbares Verhalten im Realbetrieb sind.
Verwandt:Evaluation Awareness (Bewertungsbewusstsein)Mechanistische Interpretierbarkeit (Mechanistic Interpretability)KI-Modellbewertung (AI Model Evaluation)
KI-Infrastruktur
Sandbox Agents (isolierte KI-Agenten)
Sandbox Agents sind KI-Agenten, die in einer isolierten Laufzeitumgebung ausgeführt werden. Statt direkt auf produktive Systeme, Datenbanken oder interne Netzwerke zuzugreifen, arbeiten sie in einer kontrollierten „Sandbox“ mit klaren Regeln für Dateisystem, Netzwerk, Berechtigungen und Laufzeitdauer. Technisch kombiniert man dafür meist Containerisierung, kurzlebige Workspaces, policy-basierte Tool-Freigaben und lückenloses Logging. Der zentrale Nutzen: Fehler, Halluzinationen oder unerwartete Agentenaktionen bleiben auf die isolierte Umgebung begrenzt und können nicht unkontrolliert in Kernsysteme durchschlagen. Gerade in agentischen Workflows mit Code-Ausführung, API-Aufrufen oder Dateioperationen sind Sandbox Agents ein wichtiger Sicherheits- und Governance-Baustein. Sie ersetzen keine gute Prompt- und Tool-Architektur, schaffen aber eine belastbare technische Leitplanke für den produktiven Einsatz. In reifen Setups werden Sandbox Agents zusätzlich mit Freigabe-Checks, Monitoring und Rollback-Strategien kombiniert, damit Teams schnell iterieren können, ohne Compliance und Betriebssicherheit zu riskieren.
Verwandt:Persistent Agents (Persistente KI-Agenten)Managed Agents (Verwaltete KI-Agenten)Agentic Systems (Agentenbasierte Systeme)
KI-Engineering
Scaffolding (KI-Agent-Gerüstbau)
Scaffolding ist eine Entwicklungstechnik für KI-Agenten, bei der strukturierte Vorlagen und Spezifikationen verwendet werden, um die Zuverlässigkeit und Vorhersagbarkeit von Agentenverhalten zu erhöhen. Im Gegensatz zu freien Prompts bietet Scaffolding eine explizite Struktur für Eingaben, Verarbeitungsschritte und Ausgaben. Dies reduziert Halluzinationen, verbessert die Reproduzierbarkeit und ermöglicht Verifikationsgates zwischen den Schritten. Scaffolding ist ein Kernprinzip des GSD Framework und wird in Produktionsumgebungen eingesetzt, um KI-Agenten zuverlässig zu verschiffen.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Spec-Driven Development Persistent Agents (Persistente KI-Agenten)
KI-Engineering
Schema-First Design
Schema-First Design beschreibt einen Entwicklungsansatz, bei dem zuerst die strukturierte Schnittstelle definiert wird – und erst danach die Implementierung folgt. Statt „Code zuerst, Doku später“ legen Teams früh fest, welche Felder, Datentypen, Pflichtangaben und Fehlermeldungen ein System erwartet. Typische Formate sind OpenAPI, JSON Schema oder Tool-Schemas im Model Context Protocol (MCP). Für KI- und Agenten-Workflows ist dieser Ansatz besonders wichtig: Agenten können APIs oder Tools nur zuverlässig nutzen, wenn Ein- und Ausgaben eindeutig beschrieben sind. Ein gutes Schema reduziert Missverständnisse, verhindert Parsing-Fehler und macht Tool Calling robuster. Gleichzeitig verbessert es Testbarkeit, Versionierung und Governance, weil Änderungen am Vertrag sofort sichtbar werden. Schema-First Design ist deshalb weniger ein Dokumentationsstil als ein Betriebsmodell für skalierbare KI-Produkte. Es schafft eine gemeinsame Sprache zwischen Produkt, Engineering und Operations – und macht aus experimentellen Integrationen belastbare, produktionsreife Systeme.
Verwandt:MCP (Model Context Protocol)Tool Calling (Werkzeugaufruf)Agentic Systems (Agentenbasierte Systeme)
Zukunft & Innovation
Self-Driving Enterprise
Ein Self-Driving Enterprise ist eine Organisation, in der AI-Systeme einen signifikanten Teil der Entscheidungsfindung und operativen Prozesse automatisieren, was autonome Anpassung und Optimierung ermöglicht. Ziel ist es, menschliches Eingreifen bei Routineaufgaben zu minimieren und die Mitarbeiter zu ermächtigen, sich auf strategische Initiativen zu konzentrieren.
Verwandt:Enterprise AI Deployment (Enterprise-KI-Einführung)Self-Hosted AI Self-Hosted LLM (selbst gehostetes Sprachmodell)
KI-Infrastruktur
Self-Hosted AI
KI-Software, die auf eigener Hardware oder privaten Servern läuft und volle Kontrolle über Daten, Anpassung und Verfügbarkeit gibt. Beispiele sind Clawdbot und lokale LLM-Deployments.
Verwandt:Self-Hosted LLM (selbst gehostetes Sprachmodell)Self-hosted Self-Driving Enterprise
KI-Infrastruktur
Self-Hosted KI
KI-Software, die auf der eigenen Hardware oder privaten Servern läuft und volle Kontrolle über Daten, Anpassung und Verfügbarkeit bietet. Beispiele sind Clawdbot und lokale LLM-Bereitstellungen.
KI-Infrastruktur
Self-Hosted LLM (selbst gehostetes Sprachmodell)
Ein Self-Hosted LLM ist ein Large Language Model, das nicht ausschließlich über eine externe API genutzt wird, sondern in einer eigenen oder kontrollierten Infrastruktur läuft: etwa in einer Private Cloud, auf dedizierten GPUs, in einem Rechenzentrum oder in einer abgesicherten Kundenumgebung. Der Begriff beschreibt weniger ein bestimmtes Modell als ein Betriebsmodell. Entscheidend sind Kontrolle über Datenflüsse, Laufzeitumgebung, Netzwerkzugriff, Modellversionen, Logging, Kosten und Governance. Self-Hosting wird relevant, wenn Unternehmen sensible Daten verarbeiten, regulatorische Anforderungen erfüllen müssen oder sehr spezifische Latenz-, Kosten- und Integrationsziele haben. Es ist aber kein automatischer Qualitätsgewinn: Betrieb, Monitoring, Skalierung, Patching, Modell-Routing, Sicherheitsgrenzen und Evaluationen müssen professionell gelöst werden. Häufig entsteht die beste Architektur hybrid: kritische Workloads laufen kontrolliert, während Frontier-Modelle über APIs für besonders schwierige Aufgaben zugeschaltet werden.
Verwandt:Large Language Model (LLM)Model Routing (Modellauswahl)Inferenzkosten
KI-Ökonomie & Kosten
Self-Preferencing (Selbstbevorzugung)
Self-Preferencing (Selbstbevorzugung) bezeichnet das Verhalten einer Plattform, die ihre eigenen Produkte oder Dienste systematisch gegenüber gleichwertigen Angeboten Dritter bevorzugt – auch dann, wenn das für den Nutzer nicht die beste Wahl ist. Der Begriff stammt aus dem Wettbewerbsrecht, etwa aus dem EU Digital Markets Act, und wird zunehmend auf den KI-Markt übertragen. Im KI-Kontext tritt Self-Preferencing dort auf, wo ein Anbieter sowohl die Distribution als auch ein eigenes Modell kontrolliert: Eine Entwicklungsumgebung, ein Agenten-Runtime oder eine Cloud-Plattform leitet Anfragen standardmäßig an das hauseigene Modell, obwohl ein gleich gutes oder besseres Drittmodell verfügbar wäre. Voreinstellung, Pricing und Integrationstiefe sind dabei so gestaltet, dass das eigene Modell strukturell im Vorteil ist. Anders als beim klassischen Vendor-Lock-in entsteht die Bindung hier nicht durch Wechselkosten, sondern durch eine verzerrte Standardwahl an genau der Schnittstelle, an der Nutzer und Modell zusammentreffen. Für Unternehmen ist das relevant, weil eine scheinbar neutrale Plattform-Empfehlung in Wahrheit eine kommerzielle Eigeninteresse-Entscheidung sein kann – mit direkten Folgen für Kosten, Qualität und Unabhängigkeit der eingesetzten KI.
Verwandt:Vendor Lock-In (KI)Platform Consolidation Model-agnostic Architecture (modellunabhängige Architektur)
KI-Kerntechnologie
Semantic Search
Semantic Search ist eine Suchtechnologie, die darauf abzielt, die Bedeutung und Absicht hinter einer Benutzeranfrage zu verstehen, anstatt einfach nur Schlüsselwörter abzugleichen. Sie nutzt Techniken wie natürliche Sprachverarbeitung und Wissensgraphen, um relevantere und genauere Suchergebnisse zu liefern.
Verwandt:Semantic Router Semantic Caching
KI-Kerntechnologie
Server MCP
Ein Dienst der das Model Context Protocol implementiert um Tools und Daten fuer KI-Modelle bereitzustellen.
KI-Engineering
Sichere Prompt-Entwicklung (Secure Prompt Engineering)
Sichere Prompt-Entwicklung ist die Praxis, Eingabe-Prompts für KI-Modelle so zu konstruieren und zu validieren, dass Sicherheitsrisiken minimiert und unbeabsichtigte Verhaltensweisen verhindert werden. Das Ziel ist nicht, den Prompt bloß "hardening"-techniken zu unterwerfen, sondern ein robustes System zu designen, das auch unter adversarialen Bedingungen zuverlässig verhält und keine versteckten Verhaltensweisen aktiviert. Das Spektrum umfasst Techniken wie Eingabe-Validierung, Scope-Limitierung, Preamble-Injection-Prävention, Edge-Case-Testing und Prompt-Versioning. Sichere Prompts verwenden explizite Systemanweisungen mit klaren Grenzen, definieren Rollen und Verhaltensbeschränkungen konsistent, und testen Varianten gegen bekannte Angriffsvektoren wie Roleplaying-Manipulation, Token-Injection, Context-Overfitting und jailbreak-Patterns. Das ist fundamental für Agentic Systems (wo Agenten autonom Code ausführen oder externe Tools aufrufen), Code-Generierung (wo unerwünschter Output zu produktiven Sicherheitslücken führt) und Compliance-kritische Anwendungen (wo unautorisches Verhalten regulatorische Konsequenzen hat). Bewährte Techniken sind: Test-First Prompt Design mit adversarial Beispielen, Input-Sanitization vor Model-Calls, Rollback-Planung für sicherheitskritische Prompt-Änderungen, kontinuierliches Monitoring von Modell-Outputs gegen Abuse-Muster, und regelmäßiges Red-Teaming. In Enterprise-Umgebungen ist sichere Prompt-Entwicklung eine nicht verhandelbare Grundlage für vertrauenswürdige KI-Deployment.
Verwandt:Prompt Engineering Context Engineering Agentic Engineering (agentisches Engineering)
KI-Infrastruktur
Side Panel Extension
Chrome extension UI in a panel beside browser content.
Verwandt:Modular Extension System
KI-Ökonomie & Kosten
SLM Fine-Tuning
SLM Fine-Tuning ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.
Verwandt:Small Language Models (SLM)Model Distillation
Sicherheit & Souveränität
SLSA (Supply-chain Levels for Software Artifacts)
SLSA – ausgesprochen „salsa" – ist ein offenes Sicherheits-Framework, das nachvollziehbare Integritäts- und Herkunftsgarantien für Software-Artefakte definiert. Ursprünglich bei Google entstanden und heute unter dem Dach der OpenSSF (Open Source Security Foundation) gepflegt, beschreibt SLSA in aufsteigenden Stufen, wie zuverlässig sich nachweisen lässt, dass ein Artefakt – etwa ein Container-Image, ein npm-Paket oder ein kompiliertes Binary – tatsächlich aus dem behaupteten Quellcode und Build-Prozess stammt und unterwegs nicht manipuliert wurde. Kern des Frameworks ist die sogenannte Provenance: eine signierte, maschinenlesbare Bescheinigung, die festhält, welcher Quellcode mit welchem Build-System zu welchem Artefakt geführt hat. Die SLSA-Stufen reichen von grundlegender Build-Provenance bis hin zu gehärteten, manipulationssicheren Build-Plattformen mit nicht fälschbaren Nachweisen. Gegen Lieferkettenangriffe ist SLSA eine direkte Gegenmaßnahme: Wer Provenance erzwingt und vor dem Deployment verifiziert, erkennt untergeschobene oder kompromittierte Abhängigkeiten, bevor sie in die Produktion gelangen. Gerade in KI-Agenten-Pipelines, die im großen Stil fremde Pakete, Modelle und Werkzeuge einbinden, schließt SLSA eine kritische Vertrauenslücke zwischen dem Code, dem ein Team zu vertrauen glaubt, und dem Artefakt, das tatsächlich ausgeführt wird.
Verwandt:AI Supply Chain Risk (KI-Lieferkettenrisiko)Agent Trust Boundary (KI-Agenten-Vertrauensgrenze)AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)
KI-Ökonomie & Kosten
Small Language Models (SLM)
Kompakte, effiziente KI-Modelle, die für spezifische Aufgaben oder lokale Geräte optimiert sind und hohe Leistung bei deutlich geringeren Kosten und Latenzen bieten.
Verwandt:Token-Economics Model Distillation
Sicherheit & Souveränität
SQL-Injection
SQL-Injection ist eine Code-Injection-Angriffstechnik, bei der ein Angreifer bösartigen SQL-Code in Eingabefelder oder Query-Parameter einer Anwendung einschleust oder manipuliert, sodass die Datenbank der Anwendung unbeabsichtigte Befehle ausführt. SQL-Injection zählt zu den häufigsten und gefährlichsten Web-Anwendungsschwachstellen und erscheint regelmäßig in den OWASP Top 10 Sicherheitsrisiken. Ein erfolgreicher SQL-Injection-Angriff kann unautorisiertes Datenabruf, Umgehung der Authentifizierung, Datenänderung oder -löschung und in schwerwiegenden Fällen vollständige Kompromittierung des Datenbankservers ermöglichen. Der Angriff nutzt Anwendungen aus, die SQL-Abfragen durch Verkettung benutzerseitig eingegebener Daten ohne ordnungsgemäße Bereinigung oder parametrisierte Abfragen erstellen. Das Einschleusen von ' OR '1'='1 in ein Login-Feld kann beispielsweise die Passwortprüfung umgehen, wenn die Abfrage per String-Verkettung aufgebaut wird. SQL-Injection-Schwachstellen betreffen Anwendungen, die auf MySQL, PostgreSQL, Microsoft SQL Server, SQLite und Oracle basieren. Gegenmaßnahmen umfassen vorbereitete Statements mit parametrisierten Abfragen, Eingabevalidierung, gespeicherte Prozeduren, das Prinzip des minimalen Datenbankprivilegs und Web Application Firewalls (WAF). Moderne KI-gestützte Code-Review-Tools auf Basis von Anthropics Claude und OpenAIs GPT-4 können SQL-Injection-Muster automatisch während des Code-Reviews erkennen. Bei Context Studios wenden wir KI-gestützte Sicherheitsscans — einschließlich Claude Code Sicherheitsanalyse — an, um SQL-Injection-Schwachstellen in Kunden-Codebasen als Teil unseres KI-Sicherheitsreview-Services zu identifizieren und zu beheben.
Verwandt:Prompt Injection Injection Attack (LLM)Injection Breakthroughs
KI-Infrastruktur
Stateless-Architektur
Stateless-Architektur (zustandslose Architektur) bezeichnet ein Systemdesign, bei dem der Server zwischen einzelnen Anfragen keinerlei Sitzungszustand vorhält. Jede Anfrage enthält alle Informationen, die zur Verarbeitung nötig sind – der Server behandelt sie unabhängig, ohne sich an vorherige Interaktionen zu erinnern. Der Gegenentwurf ist die zustandsbehaftete (stateful) Architektur, die langlebige Sitzungen und serverseitig gespeicherten Kontext voraussetzt. Im KI-Umfeld gewinnt dieses Prinzip rasant an Bedeutung. Wenn Agenten, Modell-Endpunkte oder Protokolle wie das Model Context Protocol zustandslos arbeiten, lässt sich jede Anfrage an eine beliebige Instanz weiterreichen. Genau das ermöglicht horizontale Skalierung, einfacheres Failover und einen deutlich robusteren Betrieb: Fällt eine Instanz aus, übernimmt jede andere ohne Sitzungsverlust. Der Zustand – etwa Konversationsverlauf oder Werkzeugkontext – wandert dabei aus dem Serverprozess heraus, entweder in die Anfrage selbst oder in einen externen Speicher wie eine Datenbank oder einen Cache. Der Preis dafür ist ein bewusster Entwurf: Kontext muss explizit übergeben und externalisiert werden, statt bequem im Speicher zu liegen. Für produktive KI-Systeme ist dieser Kompromiss meist die richtige Wahl, weil Skalierbarkeit und Ausfallsicherheit schwerer wiegen als die Einfachheit einer festen Sitzung.
Verwandt:Model-agnostic Architecture (modellunabhängige Architektur)Agent Runtime Architecture AI Scaling
KI-Engineering
Structured AI Workflow (Strukturierter KI-Workflow)
Ein Structured AI Workflow (strukturierter KI-Workflow) ist ein klar definierter, reproduzierbarer Ablaufrahmen, der beschreibt, wie KI-Modelle und Agenten innerhalb einer Anwendung strukturiert zusammenarbeiten. Im Gegensatz zu improvisierten Prompt-Ketten oder unkontrollierten Agenten-Dialogen legt ein Structured AI Workflow explizite Schritte, Eingabebedingungen, Übergabepunkte, Validierungsregeln und Ausgabeformate fest – ähnlich einem Software-Build-Prozess oder einer CI/CD-Pipeline. Ein typischer Structured AI Workflow umfasst Komponenten wie kontextkontrollierte System-Prompts, definierte Tool-Calls, Kontextbudgets, Abbruchbedingungen und Ausgabeschemata. Jeder Schritt kann eigenständig getestet, beobachtet und bei Bedarf manuell übersteuert werden. Das ermöglicht eine präzise Fehlersuche und sorgt für nachvollziehbare, konsistente Ergebnisse. Structured AI Workflows sind der Kern moderner KI-Engineering-Praxis. Sie bilden die Brücke zwischen einfachen LLM-Anfragen und produktionstauglichen, wartbaren KI-Systemen. Teams, die strukturierte Workflows einsetzen, erreichen deutlich kürzere Debugging-Zyklen, eine bessere Dokumentation und können ihre KI-Lösungen schrittweise auf Enterprise-Niveau skalieren. Im Unternehmenskontext bilden strukturierte KI-Workflows das Fundament für compliance-konforme Automatisierung: Jeder Prozessschritt ist nachweisbar, auditierbar und lässt sich bei regulatorischen Anforderungen gezielt einschränken oder erweitern.
Verwandt:Workflow-Orchestrierung (Workflow Orchestration)Deterministischer Workflow (Deterministic Workflow)Agentic Engineering (agentisches Engineering)
KI-Engineering
Structured Outputs
LLM-Feature für garantiert valides JSON gemäß einem Schema. Eliminiert Parsing-Fehler und ermöglicht zuverlässige Tool-Integration. OpenAI (response_format), Anthropic (tool_choice) und Google (response_schema) bieten native Unterstützung. Kritisch für Produktions-Pipelines, wo unstrukturierte Ausgaben Workflows brechen.
Verwandt:Tool Use / Function Calling Model Context Protocol (MCP)
Agentic AI & Agenten
Sub-Agent
Ein KI-Agent, der von einem Hauptagenten gestartet wird, um eine spezifische Teilaufgabe zu erledigen, beispielsweise die Diagnose und Behebung eines Laufzeitfehlers. In Claude Code /loop-Workflows erkennt die Hauptschleife ein Problem und startet einen Sub-Agenten zur autonomen Lösung.
Agentic AI & Agenten
Subagent
Ein Subagent ist ein spezialisierter KI-Agent, der von einem übergeordneten Agenten – dem sogenannten Orchestrator – dynamisch erstellt und gesteuert wird, um eine definierte Teilaufgabe innerhalb eines größeren Workflows zu übernehmen. Anstatt alle Aufgaben selbst zu bearbeiten, delegiert der Orchestrator-Agent Teilprobleme an Subagenten, die jeweils eigene Werkzeuge, Prompts und Handlungsspielräume besitzen können. Das Subagenten-Muster ist ein zentrales Architekturprinzip moderner Mehrfachagentensysteme: Der Orchestrator plant, koordiniert und fasst Ergebnisse zusammen, während Subagenten parallel oder sequenziell spezialisierte Aufgaben übernehmen – etwa Datenbankabfragen, Code-Generierung, Dokumentenanalyse oder Web-Recherche. Nach Abschluss liefern sie ihre Ergebnisse zurück an den Orchestrator, der daraus ein Gesamtergebnis synthetisiert. Subagenten können selbst wieder Subagenten spawnen und so hierarchische Agentenstrukturen – sogenannte Agentenbäume – bilden, die auch für unternehmensweite Komplexität ausgelegt sind. Werkzeuge wie Claude Code oder OpenAI Codex nutzen dieses Muster, um große Software-Entwicklungsaufgaben in handhabbare Parallelschritte zu zerlegen, die den Kontextumfang eines einzelnen Agenten übersteigen würden. Die klare Rollentrennung zwischen Orchestrator und Subagenten verbessert Beobachtbarkeit, Fehlereingrenzung und Skalierbarkeit erheblich: Ein fehlschlagender Subagent lässt sich neu starten oder ersetzen, ohne den gesamten Workflow zu unterbrechen – ein entscheidendes Merkmal für produktionstaugliche Agentensysteme.
Verwandt:AI Orchestration (KI-Orchestrierung)Agent Runtime (KI-Agenten-Laufzeitumgebung)Agent Handoff (KI-Agenten-Übergabe)
KI-Sicherheit & Leitplanken
Supply Chain Risk Designation
Eine Klassifizierung des Pentagon, die Rüstungsauftragnehmer verpflichtet, den Nichteinsatz einer benannten Technologie zu bestätigen. 2026 gegen Anthropic angedroht.
Verwandt:AI Supply Chain Risk (KI-Lieferkettenrisiko)Chain-of-Thought (CoT)Chain-of-Thought Prompting
Sicherheit & Souveränität
Supply-Chain-Angriff (Supply Chain Attack)
Ein Supply-Chain-Angriff (Lieferkettenangriff) ist eine Angriffstechnik, bei der Angreifer nicht das Zielsystem direkt attackieren, sondern eine vorgelagerte Komponente der Software-Lieferkette kompromittieren — etwa ein Open-Source-Paket, eine Abhängigkeit, ein Modellgewicht oder ein Build-Werkzeug. Der Schadcode gelangt dadurch über den regulären Aktualisierungs- oder Installationsweg automatisch in alle nachgelagerten Systeme, die der kompromittierten Komponente vertrauen. Typische Methoden sind Typosquatting (täuschend ähnlich benannte Pakete), Dependency Confusion (das Unterschieben eines internen Paketnamens aus einer öffentlichen Registry), manipulierte Lifecycle-Hooks sowie mit Hintertüren versehene Modelle oder vergiftete Trainingsdaten. KI-Agenten sind hier besonders exponiert: Sie installieren Abhängigkeiten oft automatisch, führen Werkzeuge und MCP-Server aus und beziehen Modellgewichte von Drittanbietern, ohne dass ein Mensch jede Komponente prüft. Anders als das allgemeine Lieferkettenrisiko, das die reine Gefährdung beschreibt, bezeichnet der Supply-Chain-Angriff die konkrete gegnerische Handlung: den aktiven Missbrauch dieses Vertrauensverhältnisses. Die Abwehr setzt auf Herkunftsnachweise (Provenance, SLSA), gepinnte Versionen und Prüfsummen, isolierte Build-Umgebungen sowie eine strenge Egress-Kontrolle, damit ein einzelnes kompromittiertes Glied nicht die gesamte Kette gefährdet. Weil der Angriff über einen legitimen Verteilweg erfolgt, bleibt er häufig lange unentdeckt und verschafft den Angreifern eine große Reichweite über viele Opfer zugleich.
Verwandt:AI Supply Chain Risk (KI-Lieferkettenrisiko)SLSA (Supply-chain Levels for Software Artifacts)Provenance
KI-Engineering
SWE-bench
SWE-bench ist ein standardisierter Benchmark zur Bewertung der Fähigkeit von KI-Systemen, reale Software-Engineering-Aufgaben zu lösen. Der Benchmark besteht aus über 2.000 echten GitHub-Issues aus populären Open-Source-Projekten wie Django, Flask und scikit-learn. Jede Aufgabe enthält eine Problembeschreibung, den zugehörigen Quellcode und automatisierte Tests zur Überprüfung der Lösung. KI-Modelle müssen den Code analysieren, die Ursache des Problems identifizieren und einen funktionierenden Patch generieren — genau wie ein menschlicher Entwickler. SWE-bench hat sich als der wichtigste Maßstab für KI-Coding-Agenten etabliert. Aktuelle Spitzenwerte liegen bei über 80 Prozent (Claude Opus 4.6 erreicht 80,8%), was zeigt, dass KI-Agenten zunehmend in der Lage sind, komplexe Softwareprobleme eigenständig zu lösen. Varianten wie SWE-bench Verified verwenden menschlich validierte Teilmengen für noch zuverlässigere Ergebnisse.
Verwandt:AI Coding Agents (KI-Codieragenten)Foundation Model (Basismodell)Agentic AI
KI-Kerntechnologie
SWE-bench Verified
Ein Benchmark, der KI-Modelle beim eigenständigen Lösen echter GitHub-Issues testet. Die Verified-Variante nutzt menschlich validierte Aufgaben für verlässliche Bewertungen. Claude Sonnet 4.6 erreicht 79,6 %.
Verwandt:SWE-bench Terminal-Bench (KI-Coding-Benchmark)
KI-Kerntechnologie
SWE-bench Verified
Ein Benchmark, der AI-Modelle testet, um reale GitHub-Probleme autonom zu lösen. Die verifizierte Variante verwendet von Menschen validierte Aufgaben für eine zuverlässige Bewertung. Claude Sonnet 4.6 erzielt 79,6 %.
KI-Engineering
System Prompt (Systemnachricht)
Ein System Prompt (auch Systemnachricht oder Systemanweisung) ist eine versteckte Anweisung, die einem KI-Sprachmodell vor dem eigentlichen Nutzerdialog übergeben wird. Im Gegensatz zu normalen Benutzernachrichten ist der System Prompt für den Endnutzer typischerweise nicht sichtbar und definiert den Verhaltensrahmen, die Persönlichkeit, die Einschränkungen und den Kontext, in dem das Modell antworten soll. In der Praxis enthält ein System Prompt Rollendefinitionen ("Du bist ein Kundenservice-Assistent für..."), Verhaltensregeln ("Antworte immer auf Deutsch", "Vermeide das Thema X"), Kontextinformationen wie Produktkataloge oder Wissensdatenbanken sowie Formatvorgaben für Antwortlänge, Ton und Struktur. Die Qualität eines System Prompts bestimmt maßgeblich, wie verlässlich und konsistent ein KI-Modell in produktiven Einsätzen funktioniert. Ein gut gestalteter System Prompt reduziert Halluzinationen, verhindert das Abdriften von Konversationen und stellt sicher, dass das Modell stets innerhalb definierter Grenzen agiert. Techniken wie Few-Shot-Beispiele und explizite Ausgabeformatierungen werden häufig im System Prompt verankert. Bei agentischen Systemen legt der System Prompt zudem fest, welche Tools ein Agent aufrufen darf, wie er mit Fehlern umgeht und welche übergeordneten Ziele er verfolgt.
Verwandt:Scaffolding (KI-Agent-Gerüstbau)Tool Calling (Werkzeugaufruf)In-Context Learning (ICL)
KI-Engineering
Terminal-Bench (KI-Coding-Benchmark)
Terminal-Bench ist ein Bewertungs-Framework für die Leistungsmessung von KI-Coding-Agenten in realen Entwicklungsumgebungen. Im Gegensatz zu klassischen Code-Benchmarks, die nur isolierte Code-Snippets testen, evaluiert Terminal-Bench den gesamten Entwicklungszyklus: Agenten müssen selbstständig Code in einem Terminal ausführen, Fehler debuggen, Dateisysteme navigieren und komplexe Multi-Step-Probleme lösen. Das Framework misst die Fähigkeiten moderner Coding-Agenten wie Claude Code, GitHub Copilot Workspace und ähnlicher Systeme unter realistischen Bedingungen. Mit Terminal-Bench 2.1 – der aktuellen Version – erzielte Anthropics Mythos Preview ein Ergebnis von 92,1 % bei einem 4-Stunden-Timeout, was die bisherige Bestmarke von 82 % deutlich übertrifft. Ein zentrales Merkmal ist die Sensitivität gegenüber Rechenzeit: Je mehr Zeit ein Modell für eine Aufgabe erhält, desto höher ist typischerweise die Lösungsrate. Das zeigt, dass moderne KI-Coding-Agenten häufig keine Fähigkeitslücken haben – sondern Rechenzeit-Limitierungen. Dieser Unterschied ist fundamental für die Praxis: Er beeinflusst, wie Teams KI-gestützte Entwicklungsworkflows planen, budgetieren und skalieren.
Verwandt:SWE-bench AI Coding Agents (KI-Codieragenten)Agentic Systems (Agentenbasierte Systeme)
KI-Infrastruktur
Test KI-Inferenz
Dies ist eine Testdefinition für KI-Inferenz. KI-Inferenz bezeichnet den Prozess, bei dem ein trainiertes KI-Modell neue Eingabedaten verarbeitet und Vorhersagen oder Ausgaben generiert. Dies ist eine ausreichend lange Definition mit mehreren Sätzen, die den Begriff klar erklärt. Wir beschreiben hier die Grundlagen der KI-Inferenz und ihre Bedeutung für den laufenden Betrieb.
KI-Engineering
Test-Time Compute Scaling
Test-Time Compute Scaling (auch: Inference-Time Compute Scaling) bezeichnet die Strategie, einem KI-Modell beim Beantworten einer Anfrage mehr Rechenleistung zur Verfügung zu stellen – statt nur beim Training mehr zu investieren. Klassische Sprachmodelle führen für jede Eingabe einen einzigen Vorwärtsdurchlauf durch und liefern direkt eine Ausgabe. Test-Time Compute Scaling bricht mit diesem Prinzip: Das Modell darf mehr Zeit und Ressourcen nutzen, um verschiedene Lösungswege zu erkunden, Zwischenergebnisse zu prüfen oder sich selbst zu korrigieren, bevor es eine finale Antwort produziert. In der Praxis bedeutet das: Bei einfachen Aufgaben reicht ein kurzer Durchlauf; bei komplexen Problemen – etwa mehrstufigem Code-Debugging oder strategischer Analyse – kann das Modell mit längerer Rechenzeit deutlich bessere Ergebnisse erzielen. Eindrücklich belegt wurde dies durch Claude Mythos Preview, das auf Terminal-Bench 2.1 mit einem 4-Stunden-Timeout einen Score von 92,1 % erreichte, während kürzere Timeouts erheblich schlechtere Werte ergaben. Test-Time Compute Scaling ist eng verwandt mit Chain-of-Thought-Reasoning und modernen KI-Agenten-Architekturen: Beide nutzen iteratives Denken zur Qualitätsverbesserung. Für Unternehmen bedeutet dieser Ansatz, dass die 'Intelligenz' eines Modells nicht nur eine feste Eigenschaft ist, sondern durch Ressourceneinsatz gezielt steuerbar wird.
Verwandt:Chain-of-Thought (CoT)Large Language Model (LLM)Foundation Model (Basismodell)
KI-Infrastruktur
Third-party Harness (Drittanbieter-Harness)
Ein Third-party Harness (Drittanbieter-Harness) ist eine Softwarearchitektur, die es externen Entwicklern ermöglicht, KI-Modelle über offizielle APIs oder autorisierte Schnittstellen hinaus zu nutzen und zu erweitern. Der Begriff bezeichnet Frameworks, die als Vermittler zwischen KI-Modellen (wie Claude, GPT oder Gemini) und Endanwendern agieren und dabei zusätzliche Funktionen wie Multi-Modell-Orchestrierung, erweiterte Tool-Integration oder benutzerdefinierte Workflows bereitstellen. Ein bekanntes Beispiel ist OpenClaw, ein Open-Source-Harness, der Anthropics Claude-Modell mit erweiterten Funktionen ausstattet, darunter Hintergrundprozesse, Cron-Jobs und Integration mit externen Tools. Harnesses unterscheiden sich von offiziellen APIs dadurch, dass sie oft Abonnement-basierten Zugang (nicht API-basiert) nutzen und damit kostengünstigere Alternativen für Entwickler bieten, die experimentelle oder produktionsreife KI-Anwendungen bauen möchten. Die Nutzung von Third-party Harnesses wirft wichtige Fragen zur langfristigen Stabilität auf: Anbieter wie Anthropic können den Zugang zu Abonnements jederzeit einschränken, was zu plötzlichen Betriebsunterbrechungen führt. Unternehmen sollten daher Harnesses nur für nicht-kritische Workflows einsetzen oder auf offizielle API-Verträge mit SLA-Garantien migrieren, sobald sie Produktionsreife erreichen.
Verwandt:API vs. Abo KI-Agenten-Infrastruktur (AI Agent Infrastructure)Model Context Protocol (MCP)
KI-Infrastruktur
Token Telemetry (Token-Telemetrie)
Token Telemetry bezeichnet das systematische Erfassen, Auswerten und Sichtbarmachen des Token-Verbrauchs in KI-Systemen. Gemessen wird nicht nur, wie viele Tokens ein Prompt oder eine Antwort kostet, sondern auch welcher Agent, welches Werkzeug, welcher Kunde, welche Aufgabe oder welcher Workflow diese Kosten verursacht. In agentischen Anwendungen wird Token Telemetry zur Betriebsmetrik: Sie zeigt, wann Context Windows überlaufen, wann Prompts zu groß werden, welche Schritte unnötige Modellaufrufe auslösen und wo Caching, Modell-Routing oder kürzere Tool-Ergebnisse sparen können. Gute Token Telemetry verbindet Kosten, Latenz, Qualität und Fehlerraten, statt Tokenzahlen isoliert zu betrachten. Teams bekommen dadurch eine belastbare Grundlage für Budgets, Alerts und Review-Gates. Besonders wichtig wird sie bei Multi-Agenten-Setups, weil parallele Agenten ansonsten unbemerkt hohe Inferenzkosten erzeugen können. In der Praxis gehört Token Telemetry in Dashboards, Logs und Deployment-Gates, damit KI-Workflows nicht nur funktionieren, sondern wirtschaftlich, nachvollziehbar und steuerbar bleiben. Für Governance ist die Metrik außerdem ein Frühwarnsignal: plötzliche Token-Spitzen deuten oft auf Prompt-Schleifen, schlechte Retrieval-Treffer oder fehlende Stop-Kriterien hin.
Verwandt:Observability (KI-Systeme)Usage-Based Pricing (verbrauchsbasierte Abrechnung)Inferenzkosten
KI-Engineering
Token Window Management
Die Kunst, den begrenzten Kontext eines LLMs optimal zu nutzen. Umfasst: Token-Budget-Allokation (wie viel für System-Prompt, Tools, Konversation?), Kontext-Kompression, selektives Retrieval und Sliding-Window-Strategien. Bei 200K-Token-Modellen oft wichtiger als bei 8K – mehr Platz führt zu "Context Rot" ohne Management.
Verwandt:Context Engineering Context Rot
KI-Ökonomie & Kosten
Token-Economics
Das strategische Management von KI-Rechenkosten (Tokens), um skalierbare und kosteneffiziente Leistung in hochvolumigen Anwendungen sicherzustellen.
Verwandt:Prompt Caching Small Language Models (SLM)Intelligent LLM Routing
Agentic AI & Agenten
Tool Calling (Werkzeugaufruf)
Tool Calling bezeichnet die Fähigkeit von KI-Sprachmodellen, externe Funktionen, APIs oder Dienste gezielt aufzurufen, um Aufgaben zu erfüllen, die über reine Textgenerierung hinausgehen. Statt nur auf trainierten Wissen zu antworten, kann ein Modell mit Tool Calling aktiv auf Echtzeitdaten zugreifen, Code ausführen, Berechnungen durchführen oder externe Systeme steuern. Der Mechanismus funktioniert so: Das Modell empfängt eine Liste verfügbarer Tools mit Beschreibung und Parameter-Schema. Bei Bedarf gibt es einen strukturierten Aufruf zurück, den das Host-System ausführt und dessen Ergebnis an das Modell zurücksendet. Das Modell verarbeitet die Antwort und kann weitere Tools aufrufen oder die finale Antwort generieren. Tool Calling ist eine Grundvoraussetzung für echte KI-Agenten: Erst durch diese Fähigkeit können Modelle mit der Außenwelt interagieren, Workflows automatisieren und komplexe Multi-Step-Aufgaben eigenständig lösen. Moderne Frameworks wie Model Context Protocol (MCP) standardisieren, wie Tools registriert und aufgerufen werden, und machen es einfacher, KI-Systeme mit bestehender Unternehmensinfrastruktur zu verbinden.
Verwandt:MCP (Model Context Protocol)Agentic Systems (Agentenbasierte Systeme)Tool Use
KI-Kerntechnologie
Tool Use
Tool Use im Kontext von AI-Agenten ist die Fähigkeit eines Agenten, externe Werkzeuge und APIs zu nutzen, um Aufgaben zu erfüllen, die über seine inhärenten Fähigkeiten hinausgehen. Dies ermöglicht es AI-Agenten, mit realen Systemen zu interagieren, auf externes Wissen zuzugreifen und komplexe Operationen durchzuführen.
Verwandt:Tool Calling (Werkzeugaufruf)Tool Use / Function Calling Agent-Tool-Surface (Werkzeugoberfläche)
Agentic AI & Agenten
Tool-Nutzung (KI)
Die Faehigkeit eines KI-Agenten, externe Tools, APIs und Dienste aufzurufen, um Aufgaben ueber die Textgenerierung hinaus zu erledigen. Ein wichtiger Unterschied zwischen einfachen Chatbots und leistungsfaehigen KI-Agenten.
Verwandt:Tool Calling (Werkzeugaufruf)Tool Use in AI Tool Use
KI-Kerntechnologie
Transformer
Ein Transformer ist eine neuronale Netzwerkarchitektur, die 2017 von Vaswani et al. im Paper „Attention Is All You Need" vorgestellt wurde und Sequenzen über einen Mechanismus namens Self-Attention verarbeitet – statt der schrittweisen Verarbeitung älterer Modelle. Sie bildet das Fundament praktisch jedes großen Sprachmodells (LLM), das heute im Einsatz ist. Die zentrale Neuerung ist die Self-Attention (Selbstaufmerksamkeit): Für jeden Token berechnet das Modell, wie relevant alle anderen Token sind, und gewichtet sie entsprechend. So erfasst das Netz auch weit auseinanderliegende Bezüge – etwa zwischen einem Pronomen und einem Substantiv 500 Wörter zuvor – in einem einzigen, parallelisierbaren Rechenschritt. Das Originaldesign bestand aus einem Encoder (liest und repräsentiert die Eingabe) und einem Decoder (erzeugt die Ausgabe Token für Token). Heutige generative LLMs sind meist Decoder-only; für Übersetzung und Embeddings bleibt der Encoder relevant. Der Transformer verdrängte RNNs und LSTMs, die Token einzeln nacheinander verarbeiteten – langsames Training und „Vergessen" über lange Sequenzen. Da Self-Attention alle Token gleichzeitig verarbeitet, wurde das Training auf Billionen von Token mit GPUs im großen Maßstab praktikabel. Alle führenden Modelle des Jahres 2026 sind Transformer: GPT-5.5 (OpenAI), Claude Opus 4.8 / Sonnet 4.6 (Anthropic) und Gemini 3 (Google). Das „T" in GPT steht für Transformer. Dieselbe Architektur treibt auch multimodale Systeme (Bild, Audio, Video) an, indem diese Eingaben in Token-Sequenzen umgewandelt werden. Praktischer Vorbehalt: Der Rechenaufwand der Self-Attention wächst quadratisch mit der Sequenzlänge, was sehr lange Kontexte teuer macht. Das befeuerte 2026 den Aufstieg hybrider Architekturen – Modelle wie Jamba, Nemotron-H oder Zamba2, die Attention-Schichten mit State-Space-Modellen (SSM) wie Mamba/Mamba-2 kombinieren. SSMs skalieren nahezu linear und sind bei langen Eingaben deutlich schneller, bleiben bei kurzen Reasoning-Aufgaben aber zurück. Der Konsens 2026: Der Transformer bleibt der Standard; Hybride sind die pragmatische Antwort für Long-Context- und latenzkritische Anwendungen – kein Ersatz.
Verwandt:Large Language Model (LLM)Mixture-of-Experts (MoE)Multimodale KI
KI-Ökonomie & Kosten
Usage-Based Pricing (verbrauchsbasierte Abrechnung)
Usage-Based Pricing bezeichnet ein Preismodell, bei dem Kosten direkt nach dem tatsächlichen Ressourcenverbrauch berechnet werden – nicht als Pauschale oder Abonnement. Im KI-Umfeld zahlen Unternehmen für die Anzahl der Token, CPU-Sekunden, API-Aufrufe oder Agent-Tasks, die sie tatsächlich nutzen. Dieses Modell hat durch die Verbreitung großer Sprachmodelle massiv an Bedeutung gewonnen. Im Gegensatz zu Flat-Rate-Preismodellen mit fester Monatsgebühr ist Usage-Based Pricing vorteilhaft für schwankende Nutzungsintensitäten: Startups und Mittelständler zahlen wenig in ruhigen Phasen und skalieren kosteneffizient bei höherer Last. Besonders relevant im Kontext von KI-Agenten: Klassische SaaS-Abonnements waren auf vorhersehbare Human-Nutzung ausgelegt. KI-Agenten führen autonom tausende API-Calls pro Stunde durch – das sprengt Flat-Rate-Kalkulationen. Anbieter wie Anthropic, OpenAI und Google setzen daher durchgängig auf Token-basiertes Usage-Based Pricing. Neuere Modelle experimentieren mit Task-Based Pricing – Bezahlung pro abgeschlossenem Agenten-Task statt pro Token. Für Unternehmen mit KI-Agenten-Implementierungen ist das Monitoring des Usage-Based Pricing entscheidend: Ohne Budget-Caps und Alerting können KI-Agenten in kurzer Zeit erhebliche Kosten verursachen.
Verwandt:Agentic Compute (agentengetriebene Rechenlast)Agentic Systems (Agentenbasierte Systeme)Workflow-Orchestrierung (Workflow Orchestration)
KI-Infrastruktur
Vector Databases
Vektor-Datenbanken sind spezialisierte Datenbanken, die entwickelt wurden, um hochdimensionale Vektor-Embeddings zu speichern und effizient abzufragen, die die semantische Bedeutung von Daten repräsentieren. Diese Datenbanken sind entscheidend für Anwendungen wie semantische Suche, Empfehlungssysteme und retrieval-augmented generation.
Verwandt:Vektordatenbank
KI-Infrastruktur
Vektordatenbank
Spezialisierte Datenbank für hochdimensionale Vektoren (Embeddings). Ermöglicht semantische Ähnlichkeitssuche statt exakter Keyword-Matches. Kern-Infrastruktur für RAG, Empfehlungssysteme und multimodale Suche. Führende Lösungen: Pinecone, Weaviate, Qdrant, Chroma, pgvector.
Verwandt:RAG (Retrieval-Augmented Generation)Embedding
KI-Engineering
Verbalized Sampling
Eine trainingsfreie Prompting-Strategie zur Überwindung von Mode Collapse. Das Modell wird aufgefordert, eine explizite Wahrscheinlichkeitsverteilung über mehrere mögliche Antworten zu verbalisieren und dann daraus zu samplen. Erhöht die Ausgabevielfalt um 1,6-2,1× ohne Qualitätsverlust.
Verwandt:Mode Collapse Context Engineering
KI-Kerntechnologie
Vibe Coding
KI-gestuetzte Softwareentwicklung, bei der das gewuenschte Ergebnis in natuerlicher Sprache beschrieben wird und die KI den Code generiert.
KI-Kerntechnologie
Vibe Coding
Ein Entwicklungsansatz, bei dem KI Code aus übergeordneter menschlicher Anleitung generiert statt aus detaillierten Spezifikationen.
Verwandt:Vibe Coding Vibe-Coding-Kater Vibe-Coding-Ansatz
KI-Engineering
Vibe Coding
Von Andrej Karpathy im Februar 2025 geprägter Begriff für AI-gestützte Softwareentwicklung, bei der Entwickler sich auf die Vision konzentrieren und KI den Code schreibt. Collins Word of the Year 2025.
Verwandt:Agentic SDLC Claude Skills
KI-Engineering
Vibe-Coding-Ansatz
Ein Entwicklungsansatz, bei dem Programmierer sich stark auf KI verlassen und Ausgaben mit minimaler Überprüfung akzeptieren — Geschwindigkeit über Verständnis.
Verwandt:Vibe-Coding-Kater KI-generierte technische Schulden
KI-Kerntechnologie
Vision-Language Models
Vision-Language-Modelle (VLMs) sind AI-Modelle, die Computer Vision und natürliche Sprachverarbeitung kombinieren, um Bilder und Text gleichzeitig zu verstehen und zu analysieren. Sie können Aufgaben wie Bildunterschriftenerstellung, visuelle Fragenbeantwortung und cross-modale Retrieval durchführen.
Verwandt:Large Language Model (LLM)Small Language Model (SLM)Small Language Models (SLM)
KI-Kerntechnologie
Vortrainiertes Modell
Ein auf einem grossen Datensatz trainiertes ML-Modell, das fuer spezifische Aufgaben feinabgestimmt werden kann und erhebliche Zeit und Ressourcen im Vergleich zum Training von Grund auf spart.
Agentic AI & Agenten
Workflow-Orchestrierung (Workflow Orchestration)
Workflow-Orchestrierung bezeichnet die automatisierte Koordination und Steuerung von mehrstufigen Prozessen, bei denen verschiedene KI-Agenten, Tools, APIs und Systeme zusammenarbeiten, um ein übergeordnetes Ziel zu erreichen. Anders als einfache Automatisierung, die lineare Abläufe abbildet, verwaltet ein Orchestrierungssystem die Reihenfolge von Schritten, Fehlerbehandlung, Neuversuche, Parallelausführung und den Zustandsfluss zwischen beteiligten Komponenten. In modernen KI-Systemen umfasst Workflow-Orchestrierung typischerweise die Koordination spezialisierter KI-Agenten, das Management von Toolaufrufen, die Persistenz von Zwischenergebnissen über mehrere Schritte hinweg sowie automatische Fehlerbehandlung mit Fallback-Pfaden. Populäre Frameworks sind n8n, Temporal, Apache Airflow und herstellerspezifische Lösungen wie Anthropic Managed Agents oder LangGraph. Die Wahl des richtigen Orchestrierungsframeworks bestimmt Skalierbarkeit, Wartbarkeit und Kosten eines KI-Systems erheblich. Für produktionsreife KI-Systeme ist professionelle Orchestrierung keine optionale Ergänzung, sondern eine Grundvoraussetzung für zuverlässige, wartbare und skalierbare Agenten-Workflows.
Verwandt:Agentic Systems (Agentenbasierte Systeme)Tool Calling (Werkzeugaufruf)Managed Agents (Verwaltete KI-Agenten)
KI-Kerntechnologie
Xcode
Xcode ist Apples offizielle integrierte Entwicklungsumgebung (IDE) für die Softwareentwicklung auf Apple-Plattformen, einschließlich iOS, macOS, watchOS, tvOS und visionOS. Erstmals 2003 veröffentlicht, bietet Xcode eine umfassende Sammlung von Entwicklungswerkzeugen: einen Code-Editor mit Syntax-Highlighting und Autovervollständigung, einen visuellen Interface-Designer (Interface Builder), ein Build-System, einen Debugger, Performance-Profiling-Tools (Instruments) und einen Simulator zum Testen von Apps auf verschiedenen Apple-Gerätetypen ohne physische Hardware. Xcode verwendet Swift als primäre Programmiersprache – Apples moderne, typsichere Sprache, die 2014 eingeführt wurde – und unterstützt weiterhin Objective-C für Legacy-Codebasen. Entwickler verteilen iOS- und macOS-Anwendungen ausschließlich über Xcodes Integration mit Apples App-Store-Signierung und -Einreichungspipeline. Im Jahr 2025 erweiterte Apple Xcodes KI-Fähigkeiten erheblich und führte agentische Coding-Funktionen ein, die von Large Language Models angetrieben werden und es Xcode ermöglichen, Code autonom zu schreiben, zu refaktorieren und zu testen – vergleichbar mit Anthropics Claude Code und dem Agent-Modus von GitHub Copilot. Dies machte Xcode zu einem wettbewerbsfähigen Akteur im agentischen Coding-Bereich. Xcodes enge Integration mit Apple-Silicon-Optimierung, SwiftUI und dem Apple Developer Program macht es für jedes Team, das native Apple-Plattform-Anwendungen entwickelt, unverzichtbar. Bei Context Studios nutzen wir Xcode mit seinen KI-Funktionen für iOS-Anwendungsentwicklung und haben seine agentischen Fähigkeiten gegenüber GitHub Copilot und Claude Code für mobile Kundenprojekte bewertet.
Verwandt:Xcode Xcode Previews
Sicherheit & Souveränität
Zero Data Retention (ZDR)
Ein Datenschutzstandard, bei dem KI-Anbieter garantieren, dass Nutzerdaten in Echtzeit verarbeitet und sofort gelöscht werden, ohne für das Modelltraining verwendet zu werden.
Verwandt:KI-Souveränität GDPR-Compliant RAG
KI-Kerntechnologie
Active Parameters
Die Teilmenge der Modellparameter, die während der Verarbeitung eines einzelnen Inputs (Tokens) aktiv ist. Dies ist besonders relevant für Mixture-of-Experts (MoE) Modelle.
Verwandt:Parameters (Model Parameters)
KI-Kerntechnologie
Adaptive Thinking
Adaptive Thinking ist eine Funktion einiger AI-Modelle, die es ihnen ermöglicht, die Tiefe ihres Denkens dynamisch anzupassen, basierend auf der Komplexität der aktuellen Aufgabe. Dies verbessert die Effizienz, indem mehr Rechenleistung für schwierige Probleme bereitgestellt wird, während einfache Anfragen schnell bearbeitet werden.
Agentic AI & Agenten
Agent HQ
Die Plattform von GitHub zur Orchestrierung mehrerer AI-Coding-Agenten, die es Entwicklern ermöglicht, den besten Agenten für eine bestimmte Aufgabe auszuwählen.
Agentic AI & Agenten
Agent Loop
Der grundlegende iterative Prozess, den KI-Agenten befolgen: Kontext sammeln, handeln, Ergebnisse überprüfen und wiederholen, bis das Ziel erreicht ist.
Verwandt:Human-in-the-Loop (HITL)Observe-Think-Act loop
Agentic AI & Agenten
Agent Orchestrator
Zentrale Komponente in Multi-Agent-Systemen, die Aufgaben verteilt, Ergebnisse aggregiert und Agent-Interaktionen koordiniert. Patterns: Hierarchisch (Manager → Worker), Peer-to-Peer (gleichberechtigte Agenten), Hub-and-Spoke. LangGraph, CrewAI und AutoGen bieten Orchestrator-Frameworks. Kritisch für komplexe Workflows mit 3+ Agenten.
Verwandt:Multi-Agent Orchestration LangGraph
Agentic AI & Agenten
Agent Skills
Modulare Fähigkeiten, die KI-Agenten hinzugefügt werden können, damit sie spezifische Aufgaben wie Dateiverwaltung, API-Aufrufe oder Datenanalyse ausführen. Ein zentrales Merkmal moderner KI-Agenten-Architekturen.
Verwandt:Claude Skills Skills Skills System
Agentic AI & Agenten
Agent Skills
Modulare Fähigkeiten, die KI-Agenten hinzugefügt werden können und ihnen ermöglichen, spezifische Aufgaben wie Dateiverwaltung, API-Aufrufe oder Datenanalyse durchzuführen. Ein Schlüsselfeature moderner KI-Agent-Architekturen.
KI-Engineering
Agent-Anweisungsdatei
Eine Konfigurationsdatei (wie AGENTS.md, .cursorrules oder CLAUDE.md), die projektspezifische Richtlinien für KI-Coding-Agenten bereitstellt.
Verwandt:AGENTS.md KI-Agent-Optimierung
Agentic AI & Agenten
Agentic Coding
Codierung, die von AI-Agenten durchgeführt wird, oft autonom, um Software basierend auf hochrangigen Anweisungen oder Zielen zu generieren, zu ändern oder zu debuggen.
Verwandt:Agentisches Coding Agentische Coding-Tools Async Agentisches Coding
Agentic AI & Agenten
Agentic development model
Ein Codierungsmodell, das in der Lage ist, Werkzeuge zu verwenden, einen Computer zu bedienen und längere, End-to-End-Softwareentwicklungsaufgaben mit minimalem menschlichen Eingreifen abzuschließen. Eine Art autonomer Softwareentwicklung.
Verwandt:Agentische Entwicklung Recursive AI Development Agentic AI
KI-Engineering
Agentic SDLC
Die Integration von KI-Agenten in alle Phasen des Software Development Life Cycle – von Anforderungsanalyse über Coding bis Testing und Deployment.
Verwandt:Vibe Coding Claude Skills
Agentic UX
Agentic UX Principles
Agentic UX Principles ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.
Verwandt:Generative UI (v0)Human-in-the-Loop (HITL)
Agentic AI & Agenten
Agentische Entwicklung
Agentische Entwicklung ist ein Software-Entwicklungsansatz, bei dem KI-Agenten autonom Code schreiben, testen und deployen mit minimaler menschlicher Aufsicht. Im Gegensatz zum KI-gestützten Coding (wo Menschen Code mit KI-Vorschlägen schreiben) überlässt agentische Entwicklung KI-Agenten ganze Entwicklungsaufgaben.
Verwandt:Agentic development model Recursive AI Development Agentic AI
KI-Kerntechnologie
Agentisches Coding
Ein Entwicklungsansatz, bei dem KI-Agenten autonom mehrstufige Coding-Aufgaben ausführen — Code schreiben, testen, Pull Requests überprüfen und iterieren — mit minimaler menschlicher Intervention. Im Gegensatz zur KI-Autovervollständigung beinhaltet agentisches Coding KI, die gesamte Entwicklungs-Workflows planen und ausführen kann.
Agentic AI & Agenten
AGENTS.md
Ein von OpenAI eingeführter Konventionsstandard – eine Markdown-Datei im Repository, die KI-Agenten Anweisungen zur Navigation und Arbeit in der Codebase gibt.
Verwandt:Claude Skills Agentic AI
Agentic AI & Agenten
AI Agent
Eine autonome Softwareeinheit, die ihre Umgebung wahrnehmen, denken, planen und handeln kann, um spezifische Ziele zu erreichen, ohne ständige menschliche Intervention.
Agentic AI & Agenten
AI Agent Ecosystem
Ein Netzwerk vernetzter KI-Agenten, Tools, Plattformen und Standards, das deren Entwicklung und Zusammenspiel ermöglicht. Umfasst Protokolle wie MCP und ACP.
Verwandt:AI Agent Ecosystem Ollama Ecosystem Startup-Oekosystem
Agentic AI & Agenten
AI Agent Ecosystem
Das vernetzte Netzwerk von AI-Agenten, Werkzeugen, Protokollen und Infrastrukturen, das die Entwicklung, Bereitstellung und den Betrieb von AI-Agenten ermöglicht.
Verwandt:AI Agent Ecosystem Ollama Ecosystem Startup-Oekosystem
Agentic AI & Agenten
AI Agent Tools
Funktionen, APIs oder externe Ressourcen, die ein KI-Agent nutzen kann, um über die reine Textgenerierung hinaus Aktionen auszuführen und mit seiner Umgebung zu interagieren.
Verwandt:Agentische Coding-Tools Tools (MCP)
KI-Ökonomie & Kosten
AI augmentation
Der Einsatz von KI, um die Fähigkeiten eines bestehenden Teams zu erweitern – sodass es mehr leisten, schwierigere Probleme angehen und schneller liefern kann, ohne Personal abzubauen. Abzugrenzen vom KI-Ersatz, der dieselbe Leistung mit weniger Menschen anstrebt.
KI-Kerntechnologie
AI Super App
Eine einheitliche Plattform, die AI nutzt, um mehrere Funktionen, die typischerweise in separaten Softwareanwendungen zu finden sind, in einer einzigen Schnittstelle zu konsolidieren.
Verwandt:KI-Super-App Codex App KI-Coding-Desktop-App
KI-Kerntechnologie
AI-Assisted Software Development
Die Verwendung von Werkzeugen und Techniken der künstlichen Intelligenz zur Verbesserung und Beschleunigung des Softwareentwicklungsprozesses.
Verwandt:Software for One Software 3.0 Hot-Reload Development
KI-Ökonomie & Kosten
AI-native
Ein Unternehmen, das seine Abläufe grundlegend um KI herum neu strukturiert hat und KI-gestützte Automatisierung und Workflows gegenüber traditionellen, menschengeführten Prozessen priorisiert. AI-native zu werden bedeutet mehr als KI-Tools zu nutzen – es ist ein strategischer Kernwandel, bei dem KI Einstellungsentscheidungen, Produktentwicklung und Personalplanung prägt.
Verwandt:KI-native Codebase AI-Native Development AI-Native Operating System
KI-Kerntechnologie
AI-Native Operating System
Ein AI-natives Betriebssystem ist von Grund auf so konzipiert, dass es AI-Fähigkeiten tief integriert und nutzt, was nahtlosere und intelligentere Interaktionen mit Anwendungen und Daten ermöglicht. Es stellt einen Paradigmenwechsel von traditionellen Betriebssystemarchitekturen dar.
Verwandt:KI-native Codebase AI-native AI-Native Development
Agentic AI & Agenten
AI-Powered Workflow Automation
Einsatz von KI in Workflow-Plattformen fuer Reasoning und adaptive Entscheidungsfindung ueber traditionelle Trigger-Action-Muster hinaus.
Verwandt:Browser-Native AI Automation Workflow-Orchestrierung (Workflow Orchestration)Agentic Workflow
KI-Infrastruktur
API Deprecation
Der Prozess der schrittweisen Abschaltung einer API (Application Programming Interface), der oft eine Phase umfasst, in der die API noch funktional ist, jedoch mit Warnungen, bevor sie schließlich entfernt wird.
Verwandt:Modell-Deprecation (Model Deprecation)Responses API Skills API
KI-Ökonomie & Kosten
API vs. Abo
„API vs. Abo" bezeichnet die Beschaffungsentscheidung zwischen der nutzungsbasierten Abrechnung von KI pro Token (API) und einer festen monatlichen Pauschale pro Nutzer (Abonnement). Es ist die zentrale Kostenmodell-Frage, die sich jedes Unternehmen beim Einsatz generativer KI stellt. Beim nutzungsbasierten API-Modell wird pro Token für Eingabe und Ausgabe abgerechnet – Claude Opus 4.8 von Anthropic kostet etwa 5 $ pro Million Input-Token und 25 $ pro Million Output-Token, Sonnet 4.6 liegt bei 3 $ / 15 $. Die Kosten skalieren direkt mit der Nutzung: im Leerlauf zahlt man nichts, unter hoher automatisierter Last entsprechend viel. APIs bieten zudem Kostenhebel, die Abonnenten nicht haben – Prompt Caching (ca. 90 % günstigerer gecachter Input) und Batch-Verarbeitung (ca. 50 % günstiger). Dieses Modell eignet sich für Produkte, Agenten und automatisierte Pipelines. Beim Abo-Modell (pro Arbeitsplatz) zahlt ein Mensch eine planbare Pauschale für den interaktiven Zugang über eine App. Typische Stufen 2026: ChatGPT Plus (ca. 20 $/Monat), ChatGPT Business (ca. 25 $/Nutzer/Monat), Claude Pro (20 $/Monat) sowie Claude Max mit 100 $/Monat (5×) bzw. 200 $/Monat (20×). Gesteuert wird dies über Nutzungsobergrenzen statt über Token-Abrechnung. Dieses Modell passt für einzelne Wissensarbeiter und Entwickler, die eine Chat-Oberfläche oder einen Coding-Assistenten nutzen. Das Marktbild 2026 hat die Grenze verwischt: Die Token-Preise der APIs sind kontinuierlich gesunken, während Abonnements sich in viele Stufen aufgefächert haben – bis zu Premium-Leveln („Max/Pro", 100–200 $/Monat). Bemerkenswert: GitHub Copilot wechselte zum 1. Juni 2026 auf nutzungsbasierte Abrechnung – Sitze (Business 19 $, Enterprise 39 $/Nutzer/Monat) enthalten nun ein Kontingent an „AI Credits", Mehrverbrauch kostet 0,01 $/Credit – ein Hybrid zwischen Abo und API. Wie man entscheidet: Abonnements für eine bekannte Zahl von Menschen mit interaktiver Arbeit (planbares Budget, kein Entwicklungsaufwand); die API, wenn KI in ein Produkt eingebettet ist, automatisierte/agentische Workloads läuft, programmatische Steuerung braucht oder variable bzw. hohe Volumina bedient. Der Kern der Abwägung ist Planbarkeit vs. Skalierungsökonomie: Abos deckeln die Kosten pro Mensch, verschwenden aber Geld bei Gelegenheitsnutzern und können keine Automatisierung antreiben; APIs kosten im Leerlauf nichts und sind bei hoher Intensität günstiger, erfordern aber Budget-Monitoring, da die Kosten unbegrenzt sind.
Verwandt:Third-party Harness (Drittanbieter-Harness)Inferenzkosten Token-Economics
KI-Kerntechnologie
Apple Foundation Models
Apples proprietäre On-Device-KI-Modelle für datenschutzorientierte Verarbeitung auf iPhones, iPads und Macs. Teil von Apple Intelligence.
Verwandt:Foundation Model (Basismodell)Multi-Modal Foundation Models Operational Foundation
KI-Kerntechnologie
ARC AGI Benchmark
Der ARC AGI Benchmark ist ein Test, der die Fähigkeit von AI-Systemen misst, Probleme zu lösen, die für Menschen einfach, aber für AI äußerst schwierig sind. Er bewertet allgemeine Denk- und Abstraktionsfähigkeiten und stellt Fortschritte in Richtung künstlicher allgemeiner Intelligenz dar.
Verwandt:Benchmark-Kontamination
KI-Sicherheit & Leitplanken
Automated Red-Teaming
Der Einsatz von KI-Modellen, um andere KI-Systeme systematisch anzugreifen und Schwachstellen, Biases oder Sicherheitsrisiken vor der Veröffentlichung zu finden.
Verwandt:Prompt Injection Defense KI-Governance
KI-Engineering
Autonome KI-Entwicklung
Ein Entwicklungsansatz bei dem KI-Agenten selbststaendig Code planen schreiben testen und debuggen mit minimaler menschlicher Intervention.
KI-Engineering
Autonomous AI Development
Ein Softwareentwicklungsansatz, bei dem KI-Agenten eigenständig Code planen, schreiben, testen und debuggen – mit minimalem oder ohne menschliches Eingreifen und mithilfe von Selbstkorrekturschleifen.
Verwandt:Autonomous execution Spec-Driven Development AI-Native Development
Agentic AI & Agenten
Autonomous execution
Die Fähigkeit eines AI-Agenten, Aufgaben unabhängig auszuführen und Entscheidungen ohne ständige menschliche Intervention zu treffen.
Verwandt:Autonomous AI Development
Agentic AI & Agenten
autoresearch
Ein KI-gesteuertes autonomes Forschungsframework, bei dem ein Agent selbstständig Machine-Learning-Experimente entwirft, ausführt und auswertet. Der Mensch gibt ein Ziel als Markdown-Prompt an; der Agent schreibt Trainingscode, führt Experimente durch, misst Ergebnisse und iteriert ohne menschliche Eingriffe. Bekannt gemacht von Andrej Karpathy im März 2026 mit einer 630-Zeilen-Python-Implementierung, die 110 autonome LLM-Trainingsiterationen in 12 Stunden produzierte.
KI-Ökonomie & Kosten
B2B
Business-to-Business — Geschäftsmodell, bei dem Produkte von einem Unternehmen an ein anderes verkauft werden, mit höheren Auftragswerten als B2C.
Agentic AI & Agenten
Background Agents
KI-Agenten, die asynchron und autonom im Hintergrund arbeiten, ohne dass ein Mensch aktiv auf Antworten warten muss.
Verwandt:Agentic AI Claude Skills
KI-Infrastruktur
Bidirectional Communication Layer
Ein Kommunikationssystem, das es ermöglicht, dass Daten in beide Richtungen zwischen zwei Entitäten fließen, wie einem AI-Modell und einer UI-Komponente, und somit Echtzeit-Feedback und Zusammenarbeit ermöglicht.
Verwandt:Critic Layer Multi-Agenten-Kommunikation Proactive Communication
KI-Ökonomie & Kosten
Bootstrapping
Aufbau eines Unternehmens mit eigenen Mitteln und Umsätzen statt externer Investitionen. Verbreitet unter Indie-Hackern.
Agentic AI & Agenten
Browser Integration
Die Fähigkeit eines AI-Agenten oder einer Softwareanwendung, direkt mit einem Webbrowser zu interagieren, um Aufgaben wie Webrecherche, Formularausfüllung und Datenextraktion durchzuführen.
Verwandt:Browser-Native AI Automation Browser-Native AI
KI-Infrastruktur
Browser-Native AI
AI, die in Browser über Erweiterungen für die Echtzeit-Webinteraktion integriert ist.
Verwandt:Browser-Native AI Automation Browser Integration KI-native Codebase
Agentic AI & Agenten
Browser-Native AI Automation
AI-Automatisierung, die direkt in einer Webbrowser-Umgebung läuft und Browser-APIs sowie bestehende Sitzungen nutzt, ohne externe Skripting- oder headless Konfigurationen zu benötigen.
Verwandt:Browser-Native AI AI-Powered Workflow Automation Browser Integration
KI-Kerntechnologie
Chain-of-Thought (CoT)
Eine Technik, bei der KI-Systeme ihre schrittweise logische Herleitung artikulieren, was die Transparenz und Genauigkeit bei komplexen Aufgaben erhöht.
Verwandt:Reasoning Mode Agentic Reasoning
KI-Infrastruktur
Chrome DevTools Protocol (CDP)
Protokoll für die programmgesteuerte Steuerung des Chromium-Browsers.
Verwandt:Model Context Protocol (MCP)Model Context Protocol (MCP)Agent-to-Agent Protocol (A2A)
KI-Infrastruktur
CI/CD-Pipeline
Eine Reihe automatisierter Prozesse zur kontinuierlichen Integration von Codeänderungen (CI) und deren Bereitstellung in Produktionsumgebungen (CD). CI/CD-Pipelines umfassen typischerweise automatisierte Tests, Build- und Deployment-Stufen.
KI-Kerntechnologie
Claude
Ein AI-Modell von Anthropic, bekannt für komplexes Denken, nuancierte Code-Überprüfungen und Architekturentscheidungen.
Verwandt:Claude Skills Claude Code Claude Code Plugin-System
KI-Kerntechnologie
Claude Code Agent SDK
Ein Software-Entwicklungskit von Anthropic, das entwickelt wurde, um die Erstellung und Bereitstellung von AI-Agenten zu vereinfachen, speziell zugeschnitten auf die Verwendung mit dem Claude-Modell.
Verwandt:Claude Code Claude Code Plugin-System Claude Code Security
KI-Kerntechnologie
Claude Cowork
Anthropics Desktop-Automatisierungsfunktion, die es Claude erlaubt, den Bildschirm des Nutzers wie ein virtueller Kollege zu beobachten und mit ihm zu interagieren. Eingeführt Anfang 2026.
Verwandt:Claude Cowork Claude Cowork Claude Cowork
KI-Kerntechnologie
Claude Cowork
Anthropics Desktop-Automatisierung, die Claude ermöglicht, den Bildschirm des Nutzers zu beobachten und damit zu interagieren. Anfang 2026 gestartet.
Agentic AI & Agenten
Claude Cowork
Das Desktop-Automatisierungstool von Anthropic, das auf dem Claude-AI-Modell basiert und entwickelt wurde, um bei verschiedenen Aufgaben direkt vom Computer des Benutzers zu helfen.
Verwandt:Claude Cowork Claude Cowork Claude Cowork plug-ins
Agentic AI & Agenten
Claude Cowork plug-ins
Branchenspezifische AI-Tools, die von Anthropic entwickelt wurden, um professionelle Arbeitsabläufe in Bereichen wie rechtlicher und finanzieller Analyse sowie Unternehmensoperationen zu automatisieren.
Verwandt:Claude Cowork Claude Cowork Claude Cowork
KI-Ökonomie & Kosten
Claude Partner Network
Das Claude Partner Network ist Anthropics offizielles Partnerprogramm fuer Unternehmen und Agenturen, die Claude-basierte KI-Loesungen entwickeln, implementieren und vermarkten. Partner erhalten Zugang zu exklusiven Ressourcen, technischem Support, Go-to-Market-Unterstuetzung und in einigen Faellen bevorzugten API-Konditionen. Das Netzwerk ist in Tiers organisiert, die typischerweise nach Umsatz, Kompetenz und strategischer Ausrichtung differenziert werden: Technologie-Partner (die Claude in ihre eigenen Produkte integrieren), Service-Partner (die Claude-Implementierungen fuer Endkunden durchfuehren), und strategische Partner (tiefe technische Integration und gemeinsame Go-to-Market-Aktivitaeten). Vorteile der Partnerschaft umfassen: fruehzeitigen Zugang zu neuen Modellversionen und Beta-Features, Co-Marketing-Moeglichkeiten auf Anthropics Website und Events, technische Unterstuetzung fuer Implementierungsfragen, und in manchen Faellen guenstigere API-Preiskonditionen ab bestimmten Volumensschwellen. Das Claude Partner Network spiegelt Anthropics Strategie wider, ein Oekosystem von spezialisierten Implementierungspartnern aufzubauen, aehnlich wie Salesforce, Workday oder SAP ihre Partner-Oekosysteme entwickelt haben. Fuer AI-native Agenturen wie Context Studios sind solche Partnerschaften wichtige strategische Positionierungen.
Verwandt:Inferenzkosten KI-Inferenz GPT-5
KI-Infrastruktur
CLAUDE.md
Eine projektbezogene Konfigurationsdatei für Claude Code, die persistente Kontexte, Anweisungen und Regeln bereitstellt, die der KI-Agent zu Beginn jeder Sitzung liest, um Projektkonventionen und Anforderungen zu verstehen.
Verwandt:Claude Skills Claude Code Claude Code
Agentic AI & Agenten
CLI Coding Agent
Ein AI-gestütztes Tool, das über eine Befehlszeilenschnittstelle (CLI) arbeitet, um autonom Code zu generieren und zu verwalten.
Verwandt:Multi-Agent Coding Multi-Agent-Coding-Workflow AI Coding Agent
Agentic AI & Agenten
CLI-Coding-Agent
Ein KI-Coding-Agent, der ueber die Kommandozeile gesteuert wird und Programmieraufgaben im Terminal automatisiert.
Agentic AI & Agenten
Clinical Documentation Agent (CDA)
Ein AI-Agent, der entwickelt wurde, um die Erstellung medizinischer Dokumentationen zu automatisieren, indem strukturierte Daten aus Arzt-Patienten-Gesprächen extrahiert und elektronische Gesundheitsakten ausgefüllt werden.
Agentic AI & Agenten
Codex App
Die macOS-Desktopanwendung von OpenAI zur Verwaltung und Orchestrierung mehrerer AI-Coding-Agenten.
Verwandt:Codex App KI-Super-App AI Super App
KI-Sicherheit & Leitplanken
Cognitive Offloading
Die Strategie, routinemäßige Denkarbeit an KI-Systeme zu delegieren, um menschliche Kapazität für strategische und kreative Aufgaben freizusetzen.
Verwandt:Human-in-the-Loop (HITL)KI-Governance
Agentic AI & Agenten
Computer Use
Die Fähigkeit von KI-Modellen, Standard-Softwareoberflächen wie ein Mensch zu bedienen – Cursor bewegen, klicken und tippen in Anwendungen ohne API.
Verwandt:Agentic AI World Models
KI-Sicherheit & Leitplanken
Constitutional AI
Eine Methode, KI-Modellen feste Regeln oder eine 'Verfassung' zu geben, um sicherzustellen, dass sie auch ohne menschliche Überwachung hilfreich und ehrlich agieren.
Verwandt:KI-Governance RLHF (Reinforcement Learning from Human Feedback)
KI-Kerntechnologie
Context Compaction
Context Compaction ist der Prozess, bei dem die Größe des Kontextfensters eines Sprachmodells reduziert wird, während relevante Informationen erhalten bleiben, was längere und stabilere Sitzungen ermöglicht. Es erlaubt AI-Systemen, längere Gespräche zu führen, ohne kritischen Kontext zu verlieren.
Verwandt:Model Context Protocol (MCP)Context Engineering Context Window
Agentic AI & Agenten
Context Fork
Ein Mechanismus zur Erstellung isolierter Ausfuehrungsumgebungen innerhalb eines KI-Agenten gegen Kontextverschmutzung zwischen Skills.
KI-Kerntechnologie
Context Rot
Die Verschlechterung der Leistung eines KI-Modells, wenn sich das Kontextfenster mit irrelevanten, veralteten oder widersprüchlichen Informationen füllt – was die Ausgabequalität über längere Interaktionen hinweg mindert.
Verwandt:Context Rot Model Context Protocol (MCP)Context Engineering
KI-Kerntechnologie
Context Rot
Die Verschlechterung der KI-Modellleistung wenn das Kontextfenster mit irrelevanten veralteten oder widersprüchlichen Informationen gefuellt wird.
KI-Engineering
Context Rot
Der schleichende Verfall der Relevanz von Kontextinformationen in langen KI-Konversationen, wenn frühere Anweisungen durch neuere überschrieben oder vergessen werden.
Verwandt:Context Engineering Token Window Management
KI-Kerntechnologie
Context Window
Die maximale Menge an Text (gemessen in Tokens), die ein großes Sprachmodell in einer einzigen Interaktion verarbeiten kann. Größere Kontextfenster ermöglichen es Modellen, längere Dokumente zu verarbeiten und mehr Gesprächsverlauf zu behalten.
Verwandt:Kontextfenster 1M Token Context Window Long Context Window
KI-Engineering
Context Window Optimization
Die Optimierung des Kontextfensters umfasst Techniken zur Maximierung der effektiven Nutzung des Kontextfensters eines Sprachmodells, einschließlich strategischer Aufforderungsstrukturierung, Abrufaugmentation und Kontextpruning, um Informationen zu verarbeiten, die die nativen Grenzen überschreiten.
Verwandt:Context Window Kontextfenster 1M Token Context Window
KI-Kerntechnologie
Context: Fork
Ein Mechanismus zur Schaffung isolierter Ausführungsumgebungen innerhalb eines AI-Agenten, der eine Kontextverschmutzung zwischen verschiedenen Fähigkeiten oder Aufgaben verhindert.
Verwandt:Model Context Protocol (MCP)Context Engineering Context Window
KI-Kerntechnologie
Copilot Pro+
Copilot Pro+ ist GitHubs Premium-KI-Coding-Abonnement, das Zugang zu erweiterten Funktionen wie Agent HQ, Multi-Agent-Support und unbegrenzter Copilot-Nutzung bietet. Es richtet sich an professionelle Entwickler, die das vollständige KI-gestützte Entwicklungserlebnis benötigen.
Verwandt:Gemini 3 Pro Nano Banana Pro
Agentic AI & Agenten
Critic Layer
Eine Validierungskomponente in Multi-Agenten-KI-Systemen, die die Befunde einzelner Agenten gegeneinander prüft, bevor sie dem Nutzer präsentiert werden. In Claude Code Review sorgt die Critic-Schicht für Konsistenz der Befunde und reduziert False Positives, bevor Kommentare in GitHub gepostet werden.
Verwandt:Bidirectional Communication Layer
KI-Kerntechnologie
Custom GPTs
Custom GPTs sind personalisierte Versionen von ChatGPT, die Nutzer ohne Programmierung für spezifische Aufgaben erstellen können. Von OpenAI im November 2023 eingeführt, ermöglichen sie benutzerdefinierte Anweisungen, Wissensdateien und spezifische Fähigkeiten. Mit der Einstellung von GPT-4o wurden viele darauf basierende Custom GPTs automatisch auf neuere Modelle migriert.
Sicherheit & Souveränität
Dangerously Skip Permissions
Ein Claude Code Flag (`--dangerously-skip-permissions`), das die standardmäßigen Bestätigungsaufforderungen vor der Tool-Nutzung deaktiviert. Nur sicher auf dedizierten, isolierten Maschinen (wie einem VPS, der speziell für agentische Aufgaben bereitgestellt wurde), wo der mögliche Schaden eines unkontrollierten Prozesses auf diesen Server beschränkt ist und die primäre Entwicklungsumgebung nicht betrifft.
Verwandt:AI Agent Permissions (KI-Agenten-Berechtigungen)
KI-Kerntechnologie
Data
Rohdaten, die unorganisiert sind und verarbeitet werden müssen. Daten können etwas Einfaches und scheinbar Zufälliges und Nützliches sein, bis sie organisiert sind. Wenn Daten verarbeitet, organisiert, strukturiert oder in einem bestimmten Kontext präsentiert werden, um nützlich zu sein, werden sie Informationen genannt.
Verwandt:Data Scientist Synthetic Data Generation Zero Data Retention (ZDR)
KI-Kerntechnologie
Data Scientist
Ein Fachmann, der statistische Methoden, maschinelles Lernen und Datenvisualisierungstechniken verwendet, um große Datensätze zu analysieren und umsetzbare Erkenntnisse zu gewinnen.
Verwandt:Data Synthetic Data Generation Zero Data Retention (ZDR)
KI-Kerntechnologie
Deep Think Mode
Deep Think Mode ist ein core AI technology-Konzept in modernen KI-Systemen, das grundlegende technische Fähigkeiten moderner KI-Anwendungen repräsentiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die richtige Technologiewahl Anwendungsleistung und -fähigkeiten direkt bestimmt.
Verwandt:Reasoning Mode Chain-of-Thought (CoT)
Sicherheit & Souveränität
Differential Privacy for ML
Differential Privacy für ML ist ein mathematisches Konzept, das formale Garantien über die Privatsphäre von Individuen bietet, deren Daten im maschinellen Lernen verwendet werden. Es stellt sicher, dass die Ausgaben des Modells keine sensiblen Informationen über ein bestimmtes Trainingsbeispiel offenbaren.
Verwandt:Privacy-Preserving AI Privacy-Preserving Inference
KI-Kerntechnologie
DOM State
Der aktuelle Zustand und die Daten, die im Document Object Model (DOM) einer Webseite dargestellt sind, spiegeln die Struktur, den Inhalt und das Styling der angewendeten Elemente wider.
KI-Engineering
DPO (Direct Preference Optimization)
Eine effizientere Alternative zu RLHF, die den separaten Reward-Model-Schritt eliminiert. Trainiert das Modell direkt auf Präferenzpaaren. Einfacher zu implementieren, kann aber ebenfalls Mode Collapse verursachen, wenn Trainingsdaten Typicality Bias enthalten.
Verwandt:RLHF (Reinforcement Learning from Human Feedback)Mode Collapse
KI-Engineering
Dual-Model Coding
Dual-Model Coding ist ein KI-gestütztes Entwicklungsmuster, bei dem zwei Sprachmodelle mit komplementären Stärken am selben Codebase zusammenarbeiten. Ein Reasoning-Modell (Claude Opus 4.6, GPT-5) übernimmt Architekturentscheidungen und Code-Review, während ein schnelles Modell (Gemini 3.1 Flash, Claude Haiku) für Code-Generierung und Tests zuständig ist. Kein einzelnes Modell exzelliert in allem. Durch aufgabenbasiertes Routing erreichen Teams sowohl Qualität als auch Geschwindigkeit. Ein Opus-Workflow kostet ca. 10x mehr pro Token als Flash. Ein Dual-Model-Setup erreicht 80-90% der Qualität bei 20-30% der Kosten.
Verwandt:KI-native Codebase Reasoning Mode Chain-of-Thought (CoT)
KI-Infrastruktur
Edge AI Deployment
Edge AI Deployment bezieht sich auf das Ausführen von KI-Modellen auf Edge-Geräten, die nahe am Ort der Datenerzeugung liegen, anstatt in einer zentralisierten Cloud-Infrastruktur. Dies reduziert die Latenz, den Bandbreitenverbrauch und ermöglicht Echtzeit-KI-Anwendungen in IoT, Robotik und mobilen Geräten.
Verwandt:Edge Functions Enterprise AI Deployment (Enterprise-KI-Einführung)
KI-Infrastruktur
Edge Functions
Serverlose Funktionen, die am Rand des Netzwerks – näher an den Nutzern – ausgeführt werden, was geringere Latenz und schnellere Antwortzeiten bewirkt.
Verwandt:Edge AI Deployment
KI-Infrastruktur
Edge Functions
Serverlose Funktionen am Netzwerkrand, naeher am Nutzer, fuer geringere Latenz und schnellere Antwortzeiten.
KI-Kerntechnologie
Effort Controls
Effort Controls sind Mechanismen, die es Entwicklern ermöglichen, die Intelligenz, Latenz und Kosten eines KI-Modells für verschiedene Anwendungsfälle anzupassen. Sie bieten eine feinkörnige Kontrolle über den Kompromiss zwischen Antwortqualität und Rechenressourcen.
KI-Infrastruktur
Electronic Health Record (EHR)
Eine digitale Version der Patientenakte, die deren medizinische Vorgeschichte, Diagnosen, Medikamente und andere relevante Informationen enthält.
KI-Sicherheit & Leitplanken
Eval-Integritaet
Eval-Integritaet (Evaluation Integrity) bezeichnet das Prinzip und die Praxis, sicherzustellen, dass Evaluierungen von KI-Modellen und -Systemen fair, unverzerrt, reproduzierbar und aussagekraeftig sind. Es ist eine Antwort auf die zunehmenden Probleme mit Benchmark-Kontaminierung, Gaming von Metriken und irreführenden Leistungsvergleichen. Kernelemente der Eval-Integritaet umfassen: Datenisolation (Testsets werden streng von Trainingsdaten getrennt), Reproduzierbarkeit (Evaluierungen koennen unabhaengig wiederholt werden), Aufgabenrelevanz (Benchmarks messen Faehigkeiten, die fuer reale Anwendungsfaelle relevant sind), und Transparenz (Evaluierungsmethoden, Datensaetze und Ergebnisse werden veroeffentlicht). Praktische Massnahmen zur Sicherstellung von Eval-Integritaet: Verwendung privater oder dynamisch generierter Testsets, blind Evaluierung (das Modell weiss nicht, ob es bewertet wird), adversariale Tests (bewusst herausfordernde Eingaben), A/B-Evaluierung im Live-System mit echten Nutzern, und regelmassige Rotation der Evaluierungs-Benchmarks. Eval-Integritaet ist besonders wichtig in Unternehmenskontexten, wo die Wahl eines KI-Modells erhebliche Investitionsentscheidungen nach sich zieht. Unternehmen sollten nicht blind auf publizierte Benchmark-Rankings vertrauen, sondern eigene task-spezifische Evaluierungen auf representativen Produktionsdaten durchfuehren.
Verwandt:Benchmark-Kontamination Agenten-Zuverlaessigkeit GPT-5
KI-Kerntechnologie
Federated Learning
Federated Learning ist ein Ansatz im maschinellen Lernen, bei dem Modelle über dezentrale Geräte oder Server trainiert werden, die lokale Datenproben halten, ohne rohe Daten auszutauschen. Dies bewahrt die Privatsphäre und ermöglicht die kollaborative Verbesserung von Modellen.
Verwandt:In-Context Learning (ICL)
KI-Kerntechnologie
Fennec (Codename)
Der interne Codename für Anthropics Claude Sonnet 5 Modell, das der Tradition folgt, Tiernamen für die Modellentwicklung zu verwenden. Der Fennek ist bekannt für seine Agilität und scharfen Sinne.
KI-Kerntechnologie
Fine-tuning
Der Prozess, ein vortrainiertes Machine-Learning-Modell auf einem kleineren, aufgabenspezifischen Datensatz weiterzutrainieren, um sein Verhalten an einen bestimmten Anwendungsfall anzupassen.
Verwandt:Fine-Tuning SLM Fine-Tuning
KI-Infrastruktur
Fleet Management (Code)
Ein Framework zur gleichzeitigen Anwendung von Code-Aenderungen ueber eine grosse Anzahl von Repositories, das effizientes Management grosser Codebasen ermoeglicht.
Verwandt:Token Window Management
Sicherheit & Souveränität
Full System Access
Das Maß an Berechtigungen, das einem KI-Assistenten gewährt wird, um mit dem Betriebssystem und der Hardware eines Computers zu interagieren, einschließlich der Ausführung von Befehlen, der Verwaltung von Dateien und der Steuerung von Geräten.
Verwandt:Sandboxed Web-Zugriff Richtlinie für KI-Modellzugriff (Model Access Policy)Programmatic Access
KI-Kerntechnologie
Gemini 3 Flash
Googles geschwindigkeitsoptimiertes KI-Modell mit niedriger Latenz und grossen Kontextfenstern fuer Echtzeit-Anwendungen.
KI-Kerntechnologie
Gemini 3 Flash
Eine spezifische Version oder ein Modell der Google Gemini AI-Familie, bekannt für seine Geschwindigkeit (Antwortzeiten unter 500 ms) und das große Kontextfenster (1M Tokens).
Verwandt:Gemini 3 Pro Google Gemini
KI-Kerntechnologie
Gemini 3 Pro
Ein großes Sprachmodell (LLM), das von Google entwickelt wurde und für seine Kohärenz in mehrstufigen Denkprozessen hervorgehoben wird.
Verwandt:Copilot Pro+Gemini 3 Flash Google Gemini
KI-Kerntechnologie
Google Gemini
Eine Familie von AI-Modellen, die von Google entwickelt wurden, die für eine Vielzahl von Aufgaben wie Textgenerierung, Codierung und multimodale Verarbeitung konzipiert sind.
Verwandt:Gemini 3 Flash Gemini 3 Pro Google Flow
KI-Kerntechnologie
GPT-4o
Ein großes Sprachmodell (LLM), das von OpenAI erstellt wurde. GPT-4o ist eine multimodale Konversations-KI, die für ihren Gesprächsstil und die Benutzerwahrnehmung von Wärme bekannt ist.
Verwandt:GPT-5 GPT-5.3-Codex-Spark GPT-4o
KI-Kerntechnologie
GPT-5
Eine hypothetische oder zukünftige Iteration der GPT (Generative Pre-trained Transformer) Serie von großen Sprachmodellen, die von OpenAI entwickelt wurden.
Verwandt:GPT-5.3-Codex-Spark GPT-4o GPT-5.2
KI-Kerntechnologie
GPT-5.2
Das neueste große Sprachmodell von OpenAI, das Anfang 2026 veröffentlicht wurde, mit wesentlichen Verbesserungen in den Bereichen Codierung, Logik und multimodale Fähigkeiten.
Verwandt:GPT-5 GPT-5.3-Codex-Spark GPT-4o
KI-Kerntechnologie
GPT-5.2-Codex
Eine spezialisierte GPT-5.2-Variante, die für die Codegenerierung, das Debugging und die Softwareentwicklung optimiert ist.
Verwandt:GPT-5.3-Codex-Spark GPT-5.2-Codex GPT-5.3-Codex
Agentic AI & Agenten
GPT-5.3-Codex
Das fortschrittliche Codierungsmodell von OpenAI, eine Iteration der GPT-Serie, die speziell für die Codegenerierung und den Abschluss längerer, durchgängiger Codierungsaufgaben mit agentischen Fähigkeiten entwickelt wurde.
Verwandt:GPT-5.3-Codex-Spark GPT-5.2-Codex GPT-5.2-Codex
Sicherheit & Souveränität
GraphRAG
Eine fortschrittliche Retrieval-Methode, die Wissensgraphen nutzt, um der KI zu helfen, komplexe Beziehungen und Kontexte in großen Datensätzen besser zu verstehen als herkömmliche Suchen.
Verwandt:RAG (Retrieval-Augmented Generation)Vektordatenbank
KI-Kerntechnologie
Grok 4
Ein großes Sprachmodell (LLM), das von xAI entwickelt wurde und für sein fortgeschrittenes Denken und seine Leistung bekannt ist.
Agentic AI & Agenten
GSD-Framework
Das GSD-Framework (Get Shit Done) ist ein spezifikationsgesteuertes System für KI-Agenten auf Claude Code. Nutzt 50 Markdown-Dateien, 6 Slash-Befehle und 2 Hooks zur Orchestrierung vollständiger Entwicklungs-Workflows.
Verwandt:KI-Agenten-Framework (AI Agent Framework)
Agentic AI & Agenten
Hook
Ein Mechanismus in Claude Code zur Auslösung von Aktionen basierend auf spezifischen Ereignissen oder Bedingungen innerhalb des Systems.
Verwandt:Stop Hook Hook-System
KI-Kerntechnologie
Hook-System
Ein ereignisgesteuerter Mechanismus in der Plugin-Architektur von Claude Code der es Plugins ermoeglicht das Verhalten an bestimmten Punkten im Workflow abzufangen und zu modifizieren.
Verwandt:Hook Stop Hook
Agentic AI & Agenten
Horizontal Connection (AI)
Die Verbindung zwischen KI-Agenten, die Kommunikation, Zusammenarbeit und Aufgabendelegation ermöglicht. Diese Dimension deckt das ACP ab.
Verwandt:Vertical Connection Vertical Connection (AI)
Agentic AI & Agenten
Horizontale Verbindung (KI)
Die Verbindung zwischen KI-Agenten für Kommunikation und Zusammenarbeit. ACP deckt diese Dimension ab.
KI-Kerntechnologie
Hot-Reload Development
Ein Entwicklungs-Workflow, bei dem Codeänderungen sofort übernommen werden, ohne die Anwendung neu zu starten – für schnelle Iteration.
Verwandt:Skill Hot-Reload AI-Assisted Software Development Spec-Driven Development
KI-Kerntechnologie
Hot-Reload-Entwicklung
Ein Entwicklungsworkflow, bei dem Codeaenderungen sofort ohne Neustart der Anwendung angewendet werden.
Agentic AI & Agenten
Human-AI Collaboration Design
Der Prozess der Gestaltung von Systemen und Arbeitsabläufen, die es Menschen und KI ermöglichen, effektiv zusammenzuarbeiten, mit Fokus auf Benutzerfreundlichkeit, Vertrauen und gemeinsame Ziele.
Verwandt:Human-in-the-Loop (HITL)Schema-First Design
KI-Kerntechnologie
Hybrid Attention
Ein Aufmerksamkeitsmechanismus, der verschiedene Arten von Aufmerksamkeitsmechanismen (z. B. gated attention und delta net) kombiniert, um die Stärken jedes einzelnen zu nutzen und die Leistung zu verbessern.
Verwandt:Hybrider KI-Stack
KI-Kerntechnologie
Imagen 3
Googles DeepMind Text-zu-Bild KI-Modell der dritten Generation das Google Whisk antreibt und fuer hohen Fotorealismus und kreative Genauigkeit bekannt ist.
Verwandt:Imagen 3
KI-Kerntechnologie
Imagen 3
Googles DeepMind Text-zu-Bild KI-Modell der dritten Generation, das Google Whisk antreibt und für hohen Fotorealismus und kreative Genauigkeit bei der Bildgenerierung bekannt ist.
Verwandt:Imagen 3
KI-Infrastruktur
Inference Scaling
Inference Scaling ist der Prozess der Optimierung der Bereitstellung von KI-Modellen, um eine wachsende Anzahl von Inferenzanfragen oder steigenden Datenvolumina zu bewältigen. Dies umfasst Techniken wie Modellparallelismus, verteiltes Rechnen und Hardwarebeschleunigung, um die Leistung aufrechtzuerhalten und die Latenz zu minimieren.
Verwandt:KI-Inferenz Responsible Scaling Policy (RSP)Scaling AI
KI-Engineering
Inference-Time Compute
Inference-Time Compute ist ein AI engineering-Konzept in modernen KI-Systemen, das die Entwicklung und Wartung KI-gestützter Systeme verbessert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Software-Qualität und Entwicklungsgeschwindigkeit direkt Geschäftsergebnisse beeinflussen.
Verwandt:Test-Time Scaling Reasoning Mode
KI-Infrastruktur
Inferenz-Optimierung
Inferenz-Optimierung umfasst alle Techniken und Strategien, die eingesetzt werden, um die Performance (Latenz, Durchsatz) und/oder die Kosteneffizienz von KI-Inferenz-Systemen zu verbessern, ohne die Qualitaet der generierten Ausgaben signifikant zu beeintraechtigten. Die wichtigsten Optimierungsebenen sind: (1) Modell-Ebene: Quantisierung (Reduzierung der numerischen Praezision von FP16 auf INT8 oder FP4), Pruning (Entfernung wenig wichtiger Modell-Gewichte), Destillation (Training kleinerer Modelle auf Outputs groesserer); (2) Serving-Ebene: Continuous Batching (dynamisches Zusammenfassen von Anfragen), KV-Cache-Optimierung, Page-Attention (effiziente Speicherverwaltung fuer Kontext); (3) Hardware-Ebene: Tensorparallelismus, Flash-Attention, Kernel-Fusion; (4) System-Ebene: Speculative Decoding, Model Routing, Caching. Speculative Decoding ist besonders bemerkenswert: Ein kleines "Draft-Modell" generiert mehrere Token-Kandidaten, die ein groesseres "Verifier-Modell" dann in einem einzigen Pass validiert oder verwirft. Bei gutem Draft-Modell kann dies die effektive Generation-Geschwindigkeit um 2-4x erhoehen. Frameworks wie vLLM, TensorRT-LLM, und DeepSpeed-Inference haben sich als Standard fuer optimiertes Serving etabliert. Sie implementieren viele dieser Techniken automatisch und koennen gegenueber nativem HuggingFace-Serving 10-20x besseren Durchsatz erzielen.
Verwandt:KI-Inferenz Inferenzkosten Inferenz-Chip
KI-Ökonomie & Kosten
Inferenzkosten
Inferenzkosten bezeichnen die finanziellen Aufwendungen beim Betrieb eines KI-Modells — Kosten für die Verarbeitung jeder einzelnen Nutzeranfrage. Im Gegensatz zu Trainingskosten (einmalig, sehr hoch) fallen Inferenzkosten kontinuierlich an und stellen im laufenden Betrieb den größten KI-Kostenfaktor dar. Inferenzkosten werden typischerweise in Preis pro Token berechnet. Stand 2026: GPT-4o ca. $2–5/M Input-Tokens und $8–15/M Output-Tokens; Claude Sonnet $3/M Input, $15/M Output; günstigere Modelle wie Claude Haiku oder Gemini Flash $0,25–1/M Tokens. Output-Tokens sind teurer als Input-Tokens (wegen des Generierungsaufwands), weshalb kosteneffiziente Systeme Output-Längen aktiv optimieren. Kostentreiber: Modellgröße (mehr Parameter = höhere Kosten), Kontextlänge (längere Kontexte erhöhen Input-Token-Kosten überproportional), Output-Länge, Hardware des Anbieters, Peak-vs-Off-Peak-Nutzung und Lizenzmodell (API vs. self-hosted). Seit 2023 sind Inferenzkosten um über 100× gesunken — GPT-4-äquivalente Leistung kostet heute ~1% des 2023-Preises. Dieser Trend hält mit Blackwell und Vera Rubin an. Kostenoptimierung: Model-Routing (günstige Modelle für einfache Tasks), Batch-Inferenz (50–75% Rabatt), Prompt-Optimierung (kürzere Outputs anfordern), Caching häufiger Anfragen.
Verwandt:KI-Inferenz Batch-Inferenz Inferenz-Optimierung
Sicherheit & Souveränität
Injection Breakthroughs
Fälle, in denen bösartiger oder unbeabsichtigter externer Inhalt, der in eine Eingabeaufforderung eingefügt wird, es schafft, Sicherheitsmechanismen zu umgehen und das Verhalten des LLM auf unerwünschte Weise zu beeinflussen.
Verwandt:Prompt Injection Injection Attack (LLM)SQL-Injection
Sicherheit & Souveränität
Instruction/Data Separation
Trennung von vertrauenswürdigen Anweisungen und nicht vertrauenswürdigen Daten.
Verwandt:Agent-Anweisungsdatei Zero Data Retention (ZDR)Data
KI-Ökonomie & Kosten
Intelligent LLM Routing
Intelligent LLM Routing ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.
Verwandt:Token-Economics Small Language Models (SLM)
Agentic UX
Intent-Based Navigation
Intent-Based Navigation ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.
Verwandt:Agentic UX Principles Semantic Router
KI-Kerntechnologie
Interactive UI Components
Funktionale Benutzeroberflächenelemente (z. B. Schaltflächen, Schieberegler, Formulare, Dashboards), die es Benutzern ermöglichen, direkt mit Daten zu interagieren und diese zu manipulieren oder Aktionen innerhalb einer Anwendung oder KI-Konversation auszulösen.
Verwandt:React Server Components
KI-Kerntechnologie
iOS
Apples mobiles Betriebssystem, das hauptsächlich auf iPhones und iPads verwendet wird.
KI-Engineering
Jahresumsatz (ARR)
Eine SaaS-Kennzahl, die den wiederkehrenden Umsatz über 12 Monate misst. Claude Code erreichte im Februar 2026 einen ARR von 2,5 Milliarden Dollar — die schnellste Wachstumskurve in der Geschichte der Entwickler-Tools.
Verwandt:Revenue Validation
KI-Kerntechnologie
JSON Mode
JSON Mode bezieht sich auf die Fähigkeit eines Sprachmodells, seine Ausgabe in einem strukturierten JSON-Format bereitzustellen. Dies ist nützlich für Anwendungen, die eine programmgesteuerte Interaktion mit KI erfordern, und ermöglicht ein einfaches Parsen und die Integration der Modellantworten in Softwaresysteme.
Verwandt:Reasoning Mode JSON-RPC JSON-RPC
KI-Infrastruktur
JSON-RPC
Ein Remote-Procedure-Call-Protokoll, das JSON zur Datenserialisierung verwendet. Kernkommunikationsmethode in MCP.
KI-Ökonomie & Kosten
KI-Adoptionskluft
Die organisatorische und gesellschaftliche Spaltung zwischen frühen KI-Anwendern mit kumulativen Vorteilen und späten Anwendern, die zunehmend zurückfallen.
Verwandt:KI-Produktivitätslücke KI-Power-User
Agentic AI & Agenten
KI-Agent-Tools
Funktionen, APIs oder externe Ressourcen, die ein KI-Agent nutzen kann, um ueber reine Textgenerierung hinaus zu agieren.
Agentic AI & Agenten
KI-Agenten-Ökosystem
Ein Netzwerk vernetzter KI-Agenten, Tools, Plattformen und Standards. Umfasst Protokolle wie MCP und ACP.
KI-Ökonomie & Kosten
KI-Augmentation
Der Einsatz von KI, um die Fähigkeiten eines bestehenden Teams zu erweitern — sie in die Lage zu versetzen, mehr zu leisten, schwierigere Probleme anzugehen und schneller zu liefern — ohne die Mitarbeiterzahl zu reduzieren.
KI-Sicherheit & Leitplanken
KI-Firewall
Sicherheitssysteme, die KI-Eingaben und -Ausgaben in Echtzeit überwachen, um Prompt Injections, Datenexfiltration und Policy-Verletzungen zu verhindern.
Verwandt:Prompt Injection Defense KI-Governance
KI-Engineering
KI-generierte technische Schulden
Technische Schulden durch das Akzeptieren von KI-Code ohne angemessene Überprüfung, Tests oder Verständnis — führt zu Wartungsproblemen und Sicherheitsrisiken.
Verwandt:Vibe Coding Vibe-Coding-Kater
KI-Ökonomie & Kosten
KI-nativ
Ein Unternehmen oder eine Organisation, die ihre Abläufe grundlegend um KI herum umstrukturiert hat und KI-gesteuerte Automatisierung über traditionelle Prozesse stellt. KI-nativ zu werden bedeutet mehr als KI-Tools zu nutzen — es ist ein strategischer Wandel, bei dem KI Einstellungsentscheidungen, Produktentwicklung und Personalplanung prägt.
KI-Ökonomie & Kosten
KI-Preis-Disruption
Die Marktverschiebung durch Open-Source-KI-Modelle, die wettbewerbsfähige Leistung zu drastisch niedrigeren Kosten bieten und proprietäre KI-Unternehmen zum Umdenken zwingen.
Verwandt:Lang-Kontext-Modell
KI-Ökonomie & Kosten
KI-Talentpool
Die verfuegbare Belegschaft von Fachkraeften mit KI- und ML-Kenntnissen in einer Region. Ein kritischer Faktor fuer den Erfolg von KI-Startups.
KI-Kerntechnologie
Lang-Kontext-Modell
Ein KI-Sprachmodell, das sehr große Eingabesequenzen verarbeiten kann, was die Analyse ganzer Codebasen oder langer Dokumente ohne Kontextverlust ermöglicht.
Verwandt:KI-Preis-Disruption
KI-Infrastruktur
LLM-as-a-Judge Evaluations
LLM-as-a-Judge Evaluations ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.
Verwandt:KI-Governance Hallucination Monitoring
Agentic UX
llms.txt
Ein von Jeremy Howard initiierter Standard – eine strukturierte Textdatei im Root-Verzeichnis einer Website, die LLMs optimierte Informationen über die Website bereitstellt.
Verwandt:Generative Engine Optimization (GEO)
KI-Infrastruktur
Local AI Inference
Die Durchführung von AI-Modellvorhersagen direkt auf dem Gerät eines Benutzers, anstatt Daten an Cloud-Server zu senden, bietet Datenschutz, geringere Latenz und keine API-Kosten.
Verwandt:Local LLMs KI-Inferenz Inferenz-Optimierung
KI-Infrastruktur
Long-Term Memory Layers
Long-Term Memory Layers ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.
Verwandt:RAG (Retrieval-Augmented Generation)GraphRAG
KI-Kerntechnologie
macOS
Das Betriebssystem von Apple für Macintosh-Computer.
KI-Infrastruktur
MCP (Model Context Protocol)
Ein offener Standard von Anthropic, der ein universelles Protokoll für die Verbindung von KI-Modellen mit externen Tools und Datenquellen bereitstellt.
Verwandt:MCP Server MCP Server MCP Servers
KI-Infrastruktur
MCP Servers
Ein Server, der es Claude Code ermöglicht, sich mit externen Tools und Diensten zu integrieren, wodurch er auf deren Funktionen zugreifen und diese nutzen kann.
Verwandt:MCP (Model Context Protocol)MCP Server MCP Server
KI-Infrastruktur
MCP Tasks (Async)
MCP Tasks (Async) ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.
Verwandt:Model Context Protocol (MCP)Background Agents
KI-Kerntechnologie
Mixture of Experts (MoE)
Mixture of Experts (MoE) ist ein core AI technology-Konzept in modernen KI-Systemen, das grundlegende technische Fähigkeiten moderner KI-Anwendungen repräsentiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die richtige Technologiewahl Anwendungsleistung und -fähigkeiten direkt bestimmt.
Verwandt:Small Language Models (SLM)Intelligent LLM Routing
KI-Kerntechnologie
Mixture-of-Experts (MoE)
Eine neuronale Netzwerkarchitektur, die mehrere 'Experten'-Subnetzwerke verwendet. Während der Inferenz wird nur eine ausgewählte Teilmenge dieser Experten aktiviert, was eine große Modellkapazität bei reduzierten Rechenkosten ermöglicht.
Verwandt:Mixture of Experts (MoE)Mixture-of-Experts (MoE)
KI-Kerntechnologie
ML Engineer
Ein Software-Ingenieur, der auf die Entwicklung, Bereitstellung und Wartung von maschinellen Lernmodellen in Produktionsumgebungen spezialisiert ist.
KI-Kerntechnologie
ML Engineers
Machine-Learning-Ingenieure, die ML-Modelle und -Systeme entwerfen, bauen und bereitstellen. Sie schlagen die Brücke zwischen Data Science und Softwareentwicklung.
KI-Engineering
Model Distillation
Eine Technik, bei der ein kleineres, schnelleres KI-Modell trainiert wird, um die Fähigkeiten eines größeren Modells zu replizieren, was eine kosteneffiziente Bereitstellung bei gleichzeitiger Aufrechterhaltung hoher Leistung ermöglicht.
Verwandt:Distillationsangriff (Distillation Attack)
KI-Infrastruktur
Model Quantization
Model Quantization ist eine Technik zur Reduzierung des Speicherbedarfs und der Rechenanforderungen von KI-Modellen, indem Gewichte und Aktivierungen mit niedrigeren Präzisionszahlen dargestellt werden. Dies ermöglicht das Ausführen großer Modelle auf Consumer-Hardware und Edge-Geräten.
Verwandt:Quantization (AI)
KI-Kerntechnologie
Model-agnostic
Bezieht sich auf ein System oder eine Software, die dafür ausgelegt ist, mit verschiedenen KI-Sprachmodellen zu arbeiten, anstatt spezifisch an ein bestimmtes Modell gebunden zu sein.
Verwandt:Modell-agnostisch Model-agnostic Architecture (modellunabhängige Architektur)
KI-Kerntechnologie
Modell-agnostisch
Ein Systemdesign-Ansatz, bei dem das KI-Framework mit jedem Sprachmodell-Anbieter funktioniert. Ermoeglicht den Wechsel zwischen GPT-4, Claude, Gemini oder Open-Source-Modellen ohne Codeaenderungen.
Verwandt:Model-agnostic Model-agnostic Architecture (modellunabhängige Architektur)
KI-Infrastruktur
Modular Extension System
Ein System, das es Benutzern ermöglicht, die Funktionalität einer Softwareanwendung (wie Claude Code) anzupassen und zu erweitern, indem sie eigenständige Module oder Erweiterungen hinzufügen, entfernen oder modifizieren.
Verwandt:Side Panel Extension
Agentic AI & Agenten
Multi-Agent Coding
Der Prozess der Softwareentwicklung unter Verwendung mehrerer KI-Agenten, die parallel oder sequenziell arbeiten, um Programmieraufgaben abzuschließen.
Verwandt:Multi-Agent-Coding-Workflow Multi-Agent Orchestration Multi-Agenten-Kommunikation
Agentic AI & Agenten
Multi-Agent Orchestration
Die Koordination mehrerer spezialisierter KI-Agenten, die als digitales Team zusammenarbeiten, um komplexe, abteilungsübergreifende Probleme zu lösen.
Verwandt:Agentic AI LangGraph Agent Orchestrator
Agentic AI & Agenten
Multi-Agent Platform
Eine Plattform, die es Entwicklern ermöglicht, mehrere KI-Agenten zu verwenden und zu verwalten, oft von verschiedenen Anbietern, innerhalb einer einheitlichen Umgebung.
Verwandt:Multi-Agent-Plattform Multi-Agent Orchestration Multi-Agenten-Kommunikation
Agentic AI & Agenten
Multi-Agent Workflow
Ein System, in dem mehrere KI-Agenten zusammenarbeiten und koordinieren, um ein komplexes Ziel zu erreichen, oft mit Übergaben und Abhängigkeiten zwischen den Agenten.
Verwandt:Multi-Agent-Coding-Workflow Multi-Agent Orchestration Multi-Agenten-Kommunikation
Agentic AI & Agenten
Multi-Agent-Coding-Workflow
Ein Entwicklungs-Workflow, bei dem mehrere KI-Agenten parallel an verschiedenen Coding-Aufgaben arbeiten, koordiniert über eine zentrale Schnittstelle.
Verwandt:Codex App
Agentic AI & Agenten
Multi-Agent-Plattform
Eine Software-Umgebung, die mehrere KI-Agenten mit verschiedenen Fähigkeiten für komplexe Aufgaben orchestriert. GitHubs Agent HQ veranschaulicht dies durch aufgabenbasierte Zuweisung von Claude, Codex oder Copilot.
Verwandt:Multi-Agent Platform Multi-Agent Orchestration Multi-Agenten-Kommunikation
Agentic AI & Agenten
Multi-Agenten PR Review
Ein Code-Review-Ansatz, der mehrere KI-Agenten parallel einsetzt, um einen Pull Request gleichzeitig aus verschiedenen Perspektiven zu analysieren. Im Gegensatz zu Single-Pass-Tools nutzt Multi-Agenten-Review spezialisierte Agenten und validiert kombinierte Befunde durch eine Critic-Schicht, bevor sie priorisiert an Entwickler weitergegeben werden.
Verwandt:Multi-Agent Orchestration Multi-Agenten-Kommunikation Multi-Agent Coding
Agentic UX
Multi-Modal Feedback Loops
Multi-Modal Feedback Loops ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.
Verwandt:Computer Use Agentic UX Principles
KI-Kerntechnologie
Multimodal Model
Ein KI-Modell, das in der Lage ist, Informationen aus mehreren Modalitäten zu verarbeiten und zu integrieren, wie z. B. Text, Bilder und Audio.
Verwandt:Multimodale KI Multimodales Modell
KI-Kerntechnologie
Multimodales Modell
Ein KI-Modell, das mehrere Datentypen — Text, Bilder, Audio, Video — in einer einzigen Architektur verarbeitet und generiert. Modelle wie GPT-4o und Gemini verstehen Kontext über Medientypen gleichzeitig.
Verwandt:Multimodale KI Multimodal Model
KI-Infrastruktur
n8n
Eine Open-Source, node-basierte Workflow-Automatisierungsplattform, die es Benutzern ermöglicht, verschiedene Anwendungen und Dienste zu verbinden, um Aufgaben zu automatisieren.
Verwandt:n8n-MCP server
KI-Infrastruktur
n8n-MCP server
Ein Open-Source-Server, der als Brücke zwischen n8n und KI-Modellen (wie Claude Code) über das Model Context Protocol (MCP) fungiert und es KI ermöglicht, n8n-Workflows zu steuern und zu automatisieren.
Verwandt:MCP Server MCP Server MCP Server
KI-Kerntechnologie
Nano Banana Pro
Ein ultra-effizienter Open-Source-Bildgenerator von Google, der im Dezember 2025 veröffentlicht wurde und hochwertige Bilder mit minimalem Ressourcenverbrauch erzeugt.
Verwandt:Generative UI (v0)Deep Think Mode
KI-Sicherheit & Leitplanken
Natural Language Autoencoder (NLA)
Ein Natural Language Autoencoder (NLA) ist eine Interpretierbarkeits-Technik aus der KI-Sicherheitsforschung, die interne Aktivierungen eines Sprachmodells in eine natürlichsprachliche Beschreibung übersetzt – und aus dieser Beschreibung die ursprüngliche Aktivierung wieder rekonstruiert. Anders als ein klassischer Autoencoder, der Daten in einen numerischen Latentraum komprimiert, ist der Engpass hier bewusst menschenlesbarer Text. Dadurch lässt sich ablesen, welche Konzepte ein Modell in einem bestimmten Moment tatsächlich verarbeitet, statt nur Zahlenvektoren zu betrachten. Anthropic hat den Ansatz im Rahmen seiner Interpretierbarkeitsforschung eingesetzt, um nachzuvollziehen, wie ein Modell intern Situationen einordnet – etwa ob es erkennt, dass es gerade getestet wird. Der NLA bildet damit eine Brücke zwischen der mechanistischen Interpretierbarkeit (dem Reverse Engineering interner Schaltkreise) und einer für Menschen direkt verständlichen Erklärung. Statt einzelne Neuronen mühsam zu entschlüsseln, liefert die Methode eine kompakte sprachliche Zusammenfassung der aktiven Repräsentationen. Für die KI-Sicherheit ist das relevant, weil sich so Verhaltensweisen wie Evaluation Awareness oder Sandbagging nicht nur am Output, sondern an der internen Verarbeitung überprüfen lassen. Die natürlichsprachliche Rekonstruktion macht überprüfbar, ob eine Erklärung das Modellverhalten kausal erfasst oder nur plausibel klingt – ein wichtiger Schritt hin zu belastbaren, auditierbaren KI-Systemen.
Verwandt:Mechanistische Interpretierbarkeit (Mechanistic Interpretability)Evaluation Awareness (Bewertungsbewusstsein)Sandbagging (KI)
Agentic AI & Agenten
Natural Language Workflow Creation
Der Prozess der Definition und Erstellung automatisierter Workflows mithilfe von natürlichen Sprachaufforderungen, die dann von einem KI-System in ausführbare Anweisungen übersetzt werden.
Verwandt:Natural-Language-Driven Natural Language Autoencoder (NLA)Large Language Model (LLM)
Agentic AI & Agenten
Natural-Language-Driven
Ein Entwicklungsansatz, bei dem natürliche Sprache als primäre Eingabe für die Softwareerstellung verwendet wird, die von KI interpretiert und ausgeführt wird.
Verwandt:Natural Language Workflow Creation Natural Language Autoencoder (NLA)Spec-Driven Scaffolding
Agentic AI & Agenten
NemoClaw
NemoClaw ist das interne Agenten-Framework von Context Studios, das speziell fuer die Erstellung und Verwaltung von KI-Agenten-Pipelines im Content- und Marketing-Bereich entwickelt wurde. Es kombiniert Prinzipien aus dem GSD-Framework (Get Stuff Done) mit spezifischen Workflows fuer Content-Erstellung, SEO-Optimierung und Multi-Channel-Publishing. Das Framework ist nach einer Kombination aus "NVIDIA NeMo" (NVIDIAs Enterprise KI-Framework) und "Claw" (dem OpenClaw-Betriebssystem) benannt, was die technische Herkunft und Integration symbolisiert. NemoClaw laeuft auf OpenClaw und nutzt die MCP (Model Context Protocol) Infrastruktur von Context Studios. Kernelemente von NemoClaw umfassen: Spec-Driven Scaffolding fuer alle Content-Workflows, Phase-Budgets zur Kostenkontrolle, Multi-Agenten-Koordination zwischen Research-, Writing- und Publishing-Agenten, integrierte Qualitaetssicherung durch Review-Agenten, und automatische Multi-Sprachen-Expansion fuer internationale Inhalte. In der Praxis ermoeglicht NemoClaw Context Studios, einen vollstaendigen Blog-Post-Workflow — von der Keyword-Recherche bis zur oeffentlichen Veroeffentlichung auf 4 Sprachen — automatisiert auszufuehren. Dies umfasst SEO-Optimierung, Bild-Generierung, Social-Media-Posts und CMS-Integration.
Verwandt:GSD-Framework Agenten-Orchestrierung Multi-Agenten-Kommunikation
KI-Infrastruktur
NPU Optimization
NPU oder Neural Processing Unit Optimierung bezieht sich auf Techniken zur Maximierung der Leistung von dedizierten KI-Beschleunigerchips. NPUs sind spezialisierte Hardware, die für effiziente neuronale Netzwerk-Inferenz entwickelt wurde und in modernen Smartphones, Laptops und Edge-Geräten zu finden ist.
Verwandt:Inferenz-Optimierung KI-Agent-Optimierung Generative Engine Optimization (GEO)
Agentic AI & Agenten
Observe-Think-Act loop
Der grundlegende Zyklus eines KI-Agenten, bei dem er seine Umgebung wahrnimmt (Beobachten), die Informationen verarbeitet und eine Handlungsentscheidung trifft (Denken) und dann diese Handlung ausführt (Handeln).
Verwandt:Human-in-the-Loop (HITL)Deep Think Mode Agent Loop
KI-Kerntechnologie
Ollama Ecosystem
Das Ollama-Ökosystem bezieht sich auf die Werkzeuge, Modelle und die Gemeinschaft rund um Ollama, eine Open-Source-Plattform zum lokalen Ausführen großer Sprachmodelle. Es vereinfacht das Modellmanagement und bietet eine konsistente API für die lokale KI-Entwicklung.
Verwandt:AI Agent Ecosystem AI Agent Ecosystem Startup-Oekosystem
KI-Kerntechnologie
Open-weight Model
Ein Sprachmodell, dessen Gewichte (die gelernten Parameter) öffentlich zum Download und zur Verwendung verfügbar sind.
Verwandt:Open-Weight-Modell
KI-Kerntechnologie
Open-Weight-Modell
Ein Open-Weight-Modell ist ein KI-Modell, dessen trainierte Parameter – die Milliarden numerischer Gewichte, die das Wissen des Modells kodieren – öffentlich zum Download bereitstehen, ohne notwendigerweise den vollständigen Trainingscode, die Daten oder die Methodik offenzulegen. Open-Weight-Modelle nehmen eine Mittelposition ein: Sie sind zugänglicher als vollständig proprietäre Modelle wie OpenAI's GPT-4o oder Anthropic's Claude, die ausschließlich über API verfügbar sind, aber weniger transparent als vollständig quelloffene KI, bei der jede Komponente des Trainings nachvollziehbar ist. Bekannte Open-Weight-Modelle sind Metas Llama-Serie, Mistral AIs Mixtral, Googles Gemma und Zhipu AIs GLM-5. Die öffentliche Verfügbarkeit der Gewichte ermöglicht es Entwicklern und Unternehmen, Modelle herunterzuladen, selbst zu betreiben und für spezifische Domänen feinabzustimmen – ohne sensible Daten an externe APIs zu übertragen. Dies ist ein entscheidender Vorteil für Branchen mit strengen Datenschutzvorgaben wie Recht, Medizin und Finanzen. Open-Weight-Modelle haben eine Demokratisierung der KI-Fähigkeiten vorangetrieben: Organisationen können heute frontier-nahe Sprachmodelle auf eigenen GPU-Clustern betreiben und so die Kosten pro Token erheblich senken und Vendor-Lock-in vermeiden. Der Begriff unterscheidet sich von Open-Source-KI: Ein Modell kann seine Gewichte veröffentlichen, ohne Trainingsdaten oder Code offenzulegen. Lizenzen variieren stark – Llamas Community License schränkt die kommerzielle Nutzung ab 700 Millionen monatlich aktiver Nutzer ein, Mistrals Modelle nutzen Apache 2.0. Bei Context Studios evaluieren wir regelmäßig Open-Weight-Modelle für europäische Unternehmenskunden, bei denen DSGVO-konforme On-Premise-Inferenz API-basierten Cloud-Lösungen vorzuziehen ist.
Verwandt:Large Language Model (LLM)Fine-tuning
KI-Kerntechnologie
OpenAI Apps SDK
Ein UI-Framework, das die Erstellung plattformübergreifender KI-Anwendungen erleichtert, indem es Werkzeuge bereitstellt, um zwischen verschiedenen KI-Plattformen und MCP-Servern zu übersetzen.
Verwandt:OpenAI Agents SDK MCP Apps MCP Apps
KI-Kerntechnologie
OpenAI Codex
OpenAIs cloudbasierter KI-Coding-Agent, der Code ausführt, Repos verwaltet und Entwicklungsaufgaben autonom in einer Sandbox mit GitHub-Integration bewältigt.
Verwandt:OpenAI Codex OpenAI Apps SDK OpenAI Agents SDK
KI-Kerntechnologie
OpenAI Codex
Ein Modell von OpenAI, das natürliche Sprache in Code übersetzt; die Grundlage für Copilot.
Verwandt:OpenAI Codex OpenAI Apps SDK OpenAI Agents SDK
KI-Infrastruktur
OpenAI Connectors
Wrapper, die von OpenAI entwickelt wurden und die Integration zwischen KI-Agenten und häufig verwendeten Anwendungen und Diensten wie Google Drive, Slack und Notion erleichtern, oft unter Verwendung des Model Context Protocol (MCP).
Verwandt:OpenAI Agents SDK OpenAI Codex OpenAI Apps SDK
Agentic AI & Agenten
OpenClaw
Ein Open-Source-Framework zur Erstellung und Ausführung autonomer KI-Agenten, die über mehrere Messaging-Plattformen hinweg operieren können.
Verwandt:OpenClaw
Agentic AI & Agenten
Operational Foundation
Die grundlegenden Systeme und Prozesse, auf denen eine Organisation ihre täglichen Aktivitäten ausführt, die nun zunehmend auf KI-Agenten angewiesen sind.
Verwandt:Foundation Model (Basismodell)Multi-Modal Foundation Models Apple Foundation Models
Agentic AI & Agenten
Output Contract
Eine klar definierte Struktur und ein Format für die von einem KI-Agenten generierte Ausgabe, die Konsistenz und Vorhersehbarkeit für die nachgelagerte Verarbeitung oder den menschlichen Konsum gewährleistet.
KI-Kerntechnologie
Parameters (Model Parameters)
Die anpassbaren Gewichte innerhalb eines neuronalen Netzwerks, die während des Trainings gelernt werden. Sie bestimmen die Fähigkeit des Modells, Eingaben in Ausgaben zuzuordnen.
Verwandt:Active Parameters
Agentic AI & Agenten
Persistent Memory (AI)
Die Fähigkeit eines KI-Systems, Informationen über Sitzungen und Gespräche hinweg zu behalten und langfristigen Kontext über Nutzer und Aufgaben aufzubauen. Ermöglicht Kontinuität und Personalisierung.
Verwandt:Persistent Agents (Persistente KI-Agenten)Long-Term Memory Layers
Agentic AI & Agenten
Persistenter Speicher (KI)
Die Fähigkeit eines KI-Systems, Informationen über Sitzungen und Gespräche hinweg zu behalten und langfristigen Kontext über Benutzer und Aufgaben aufzubauen. Ermöglicht Kontinuität und Personalisierung.
Agentic AI & Agenten
Personal Intelligence
KI-Systeme, die tief in das Leben einzelner Nutzer integriert sind, deren Vorlieben lernen und proaktiv bei täglichen Aufgaben und Entscheidungen helfen. Eine von OpenAIs Sam Altman formulierte Vision.
Verwandt:Personal Intelligence
Agentic AI & Agenten
Personal Intelligence
Googles Initiative zur Erweiterung seines Gemini-Modells mit Funktionen, die auf die individuellen Bedürfnisse und Vorlieben der Nutzer zugeschnitten sind, um ein hochgradig personalisiertes AI-Erlebnis zu bieten.
Verwandt:Personal Intelligence
Agentic AI & Agenten
Persönliche Intelligenz
KI-Systeme, die tief in das Leben einzelner Nutzer integriert sind, Präferenzen lernen und proaktiv bei täglichen Aufgaben und Entscheidungen helfen. Eine von OpenAIs Sam Altman formulierte Vision.
KI-Kerntechnologie
Platform Consolidation
Der Trend, mehrere Funktionen und Dienste in einer einzigen, einheitlichen Plattform zu vereinen, oft unterstützt von AI, wodurch der Bedarf an unterschiedlichen Anwendungen verringert wird.
Verwandt:Plattform-Konsolidierung Multi-Agent-Plattform Multi-Agent Platform
KI-Kerntechnologie
Plattform-Konsolidierung
Der Trend, mehrere spezialisierte Software-Tools durch weniger, umfassendere Plattformen zu ersetzen. Im KI-Zeitalter absorbieren KI-Super-Apps Funktionen separater SaaS-Produkte und reduzieren Software-Wildwuchs.
Verwandt:Platform Consolidation Multi-Agent-Plattform Multi-Agent Platform
Compliance & Regulierung
Privacy-Preserving Inference
Privacy-Preserving Inference ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.
Verwandt:GDPR-Compliant RAG
KI-Infrastruktur
Private Cloud Compute
Apple Cloud-Infrastruktur verarbeitet AI-Anfragen mit hardwarebasierten Datenschutzgarantien. Daten in sicheren Enklaven, niemals gespeichert.
Verwandt:Private Cloud Compute Sovereign Cloud AI (GAIA-X)Test-Time Compute
KI-Infrastruktur
Private Cloud Compute
Die Technologie von Apple, die sensible Daten lokal auf dem Gerät oder über private, sichere Server verarbeitet, um die Privatsphäre der Nutzer zu wahren, während AI-Funktionen genutzt werden. Das Unternehmen möchte keine Nutzerdaten mit externen Cloud-Anbietern teilen.
Verwandt:Private Cloud Compute Sovereign Cloud AI (GAIA-X)Test-Time Compute
Agentic AI & Agenten
Proactive Communication
Die Fähigkeit eines AI-Assistenten, die Kommunikation mit einem Benutzer basierend auf Auslösern, Ereignissen oder gelernten Vorlieben zu initiieren, anstatt auf explizite Anfragen zu warten.
Verwandt:Multi-Agenten-Kommunikation Bidirectional Communication Layer
KI-Kerntechnologie
Programmatic Access
Der Zugriff auf ein Softwaresystem oder einen Dienst über Code (z. B. unter Verwendung einer API) anstelle einer grafischen Benutzeroberfläche.
Verwandt:Richtlinie für KI-Modellzugriff (Model Access Policy)Full System Access Sandboxed Web-Zugriff
KI-Infrastruktur
Prompt Caching
Eine Technik, die häufig verwendeten Kontext im Speicher eines KI-Modells speichert, was die Latenz und Kosten für repetitive Anfragen drastisch reduziert.
Verwandt:Token-Economics Context Engineering
KI-Sicherheit & Leitplanken
Prompt Injection Defense
Prompt Injection Defense ist ein AI safety-Konzept in modernen KI-Systemen, das sicherstellt, dass KI-Systeme innerhalb sicherer Grenzen arbeiten. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die Vermeidung schädlicher Outputs und Systemintegrität höchste Priorität haben.
Verwandt:Constitutional AI KI-Governance
Agentic AI & Agenten
Prompt Re-injection
Der Prozess, das gleiche ursprüngliche Prompt erneut in ein AI-Modell einzuspeisen, um es zu ermutigen, an einer Aufgabe weiterzuarbeiten und auf vorherigen Iterationen aufzubauen.
Verwandt:Prompt Injection Defense Prompt Injection Injection Attack (LLM)
KI-Engineering
Prompt Template
Wiederverwendbare Prompt-Strukturen mit Platzhaltern für dynamische Inhalte. Ermöglichen konsistente Outputs über verschiedene Inputs hinweg. Best Practices: Klare Rollendefinition, strukturierte Ausgabeformate, Few-Shot-Beispiele. LangChain, Guidance und LMQL bieten Template-Engines. Unterschied zu Ad-hoc-Prompts: Versionierbar, testbar, optimierbar.
Verwandt:Context Engineering Claude Skills
KI-Kerntechnologie
Provenance
Die Dokumentation des Ursprungs und der Geschichte eines Datensatzes, einschließlich woher er stammt, wie er abgeleitet wurde und wer ihn modifiziert hat. Im Kontext von LLMs bezieht es sich auf die Nachverfolgung der Quelle von Informationen, die in der Antwort des Modells verwendet werden.
KI-Engineering
Quantization (AI)
Eine Technik, die die Präzision der numerischen Gewichte eines AI-Modells reduziert (z. B. von 32-Bit auf 4-Bit), wodurch die Modellgröße und die Speicheranforderungen drastisch verringert werden, während die meisten Leistungen erhalten bleiben.
Verwandt:Model Quantization
KI-Kerntechnologie
Ralph Wiggum Plugin
Ein Claude Code Plugin das vollstaendig autonome KI-Entwicklung ermoeglicht indem es automatisch alle Tool-Aufrufe und Berechtigungen akzeptiert.
Verwandt:Ralph Wiggum Plugin Ralph Wiggum Technik Claude Code Plugin-System
KI-Kerntechnologie
Ralph Wiggum Plugin
Ein Claude Code Plugin, das vollständig autonome KI-Entwicklung ermöglicht, indem es automatisch alle Tool-Aufrufe und Berechtigungen akzeptiert, sodass Claude Code ohne menschliche Intervention an repetitiven oder Batch-Aufgaben arbeiten kann.
Verwandt:Ralph Wiggum Plugin Ralph Wiggum Technik Claude Code Plugin-System
Agentic AI & Agenten
Ralph Wiggum Technik
Eine autonome Entwicklungsmethodik für KI-Coding-Assistenten, erfunden von Geoffrey Huntley. Nutzt einen Stop Hook, der Claudes Exit-Versuche abfängt und denselben Prompt wiederholt zurückfüttert, bis die Aufgabe vollständig erledigt ist. Ermöglicht mehrstündige autonome Coding-Sessions.
Verwandt:Claude Code Agentic SDLC Background Agents
KI-Kerntechnologie
React Server Components
Eine React-Architektur, bei der Komponenten auf dem Server gerendert werden, um clientseitiges JavaScript zu reduzieren und Performance zu verbessern.
KI-Kerntechnologie
React Server Components
Eine React-Funktion, die es Komponenten ermöglicht, auf dem Server anstelle des Clients zu laufen, wodurch die Leistung verbessert und die clientseitige JavaScript reduziert wird.
Verwandt:Interactive UI Components MCP Server MCP Server
KI-Kerntechnologie
Refactoring
Der Prozess der Umstrukturierung vorhandener Computerprogramme - Änderung der Faktorisierung - ohne das externe Verhalten zu ändern.
KI-Infrastruktur
Resources (MCP)
Strukturierte Daten, auf die ein AI-Assistent über das Model Context Protocol (MCP) zugreifen kann, wie Datenbankschemata oder Dokumentationen.
KI-Infrastruktur
Responses API
OpenAIs API zur Erzeugung strukturierter Antworten von KI-Modellen, mit Unterstützung für Tool-Nutzung, Function Calling und mehrstufige Reasoning-Workflows.
Verwandt:API Deprecation Skills API API Key Governance (API-Schlüssel-Verwaltung)
KI-Infrastruktur
Responses API
OpenAIs API zur Generierung strukturierter Antworten von KI-Modellen, mit Unterstützung für Tool-Nutzung, Funktionsaufrufe und mehrstufige Reasoning-Workflows.
KI-Ökonomie & Kosten
Revenue Validation
Bestätigung, dass eine Produktidee zahlende Kunden generieren kann, bevor signifikante Entwicklungsressourcen investiert werden.
Verwandt:Jahresumsatz (ARR)Schema Validation
KI-Infrastruktur
Runtime
Die Umgebung, in der ein Computerprogramm oder ein AI-Agent ausgeführt wird, umfasst die Software- und Hardware-Ressourcen, die für seinen Betrieb erforderlich sind.
Verwandt:Agent Runtime (KI-Agenten-Laufzeitumgebung)Agent Runtime Architecture
KI-Kerntechnologie
SaaS
Software as a Service. Software, das als Dienst über das Internet bereitgestellt wird.
Verwandt:SaaS SaaS-Wildwuchs
Sicherheit & Souveränität
Sandbox-Container
Eine sichere, isolierte Umgebung zum Ausfuehren von Anwendungen, die den Zugriff auf Systemressourcen beschraenkt. Entscheidend fuer den Enterprise-Einsatz von KI-Agenten.
Verwandt:Sandboxed Web-Zugriff Sandboxed Iframe
Sicherheit & Souveränität
Sandboxed Web-Zugriff
Eine Claude Code Sicherheitskonfiguration, die die Browser-Fähigkeiten des KI-Agenten auf eine definierte Whitelist von Domains beschränkt. Anstatt uneingeschränkten Internetzugang zu haben, kann der Agent nur vorab genehmigte Seiten recherchieren, wodurch versehentliche Codebase-Änderungen, unbeabsichtigte API-Calls oder Zugriff auf sensible externe Dienste verhindert werden.
Verwandt:Sandbox-Container Full System Access Sandboxed Iframe
KI-Infrastruktur
Scaling AI
Der Prozess, die Größe, Komplexität und die Ressourcen, die AI-Modellen und -Systemen zugewiesen sind, zu erhöhen, wobei oft die Erweiterung des Trainingsdatensatzes, der Modellparameter und der Recheninfrastruktur einbezogen wird.
Verwandt:Responsible Scaling Policy (RSP)Inference Scaling Test-Time Scaling
KI-Kerntechnologie
Schema Validation
Der Prozess der Überprüfung, ob die Ausgabe eines Sprachmodells einem vordefinierten Schema oder Format entspricht.
Verwandt:Schema-First Design Revenue Validation
KI-Kerntechnologie
Schwachstellenanalyse
Der automatisierte Prozess zur Identifizierung von Sicherheitslücken in Software, Netzwerken oder Systemen. Moderne Ansätze reichen von regelbasierter statischer Analyse bis hin zu KI-gestütztem kontextuellem Code-Reasoning.
KI-Kerntechnologie
Seat
Im Kontext von Softwarelizenzen repräsentiert ein 'Seat' einen einzelnen Benutzer oder Benutzerkonto, das autorisiert ist, auf die Software zuzugreifen und sie zu nutzen. Die Preisgestaltung für SaaS basiert oft auf einem 'pro Seat' oder 'pro Benutzer'-Modell.
KI-Kerntechnologie
Seedance 2.0
Seedance 2.0 ist ein multimodales KI-Videogenerierungsmodell von ByteDance, dem Pekinger Technologiekonzern hinter TikTok. Das 2025 veröffentlichte Modell generiert hochwertige, temporal kohärente Videoclips aus Textprompts, Bildeingaben oder einer Kombination beider Modalitäten und tritt damit in direktem Wettbewerb mit OpenAIs Sora, Googles Veo 3 und Runway MLs Gen-3. Seedance 2.0 wurde auf einem großen proprietären Datensatz aus Video-Text-Paaren trainiert und nutzt eine diffusionsbasierte Architektur, die auf Bewegungsrealismus, Szenenkonsistenz und fotorealistische Darstellung optimiert ist. Zu den zentralen Fähigkeiten gehören Multi-Shot-Videogenerierung, Kamerabewegungssteuerung, frameübergreifende Charakterkonsistenz und Unterstützung für kinematische Seitenverhältnisse. ByteDance entwickelte Seedance 2.0, um kreative Workflows im eigenen Produktökosystem — darunter CapCut, die populäre Videobearbeitungs-App — zu bereichern und das Modell gleichzeitig Enterprise-API-Kunden zugänglich zu machen. Im Gegensatz zu Sora, das ausschließlich über ChatGPT Plus verfügbar ist, bietet Seedance 2.0 direkten API-Zugang, was es zu einer praktischen Wahl für Entwickler macht, die automatisierte Videoproduktionspipelines aufbauen. Das Modell unterstützt sowohl Text-to-Video als auch Image-to-Video-Generierung mit Ausgabelängen von fünf bis dreißig Sekunden. Seedance 2.0 markiert ByteDances bedeutendsten Einstieg in den generativen Videobereich. Bei Context Studios haben wir Seedance 2.0 für automatisierte Social-Media-Videoproduktion und Short-Form-Content-Workflows getestet und seine Bewegungsqualität mit Veo 3 und Sora verglichen.
KI-Infrastruktur
Self-hosted
Eine Software oder Dienstleistung, die auf der eigenen Infrastruktur des Benutzers gehostet wird und ihm im Vergleich zu cloudbasierten Lösungen mehr Kontrolle über Daten und Ressourcen gibt.
Verwandt:Self-Hosted AI Self-Hosted LLM (selbst gehostetes Sprachmodell)Self-Driving Enterprise
KI-Ökonomie & Kosten
Semantic Caching
Eine Technik, die KI-Antworten für ähnliche (nicht nur identische) Anfragen speichert, sodass das System Antworten sofort liefern kann, ohne neue API-Kosten zu verursachen.
Verwandt:Token-Economics Embedding
KI-Infrastruktur
SEP (MCP Enhancement Proposal)
Ein Design-Dokument, das der MCP-Community Informationen liefert oder ein neues Feature für das Model Context Protocol beschreibt. SEP-Governance bedeutet, dass Breaking Changes angekündigt werden bevor sie in Releases landen.
Agentic AI & Agenten
Session-Kontinuitaet
Session-Kontinuitaet bezeichnet die Faehigkeit eines KI-Agenten oder -Systems, den Zustand, Kontext und Fortschritt einer laufenden Aufgabe ueber Unterbrechungen, Neustarts oder Sitzungswechsel hinweg beizubehalten. Da LLMs von Natur aus zustandslos sind (kein eingebettetes Langzeitgedaechtnis), muss Kontinuitaet explizit implementiert werden. Die fundamentale Herausforderung: Jede neue LLM-Konversation beginnt ohne Wissen ueber vorherige Interaktionen. Fuer langfristige Agenten-Aufgaben — etwa ein mehrtaegiger Forschungsauftrag oder ein kontinuierlich laufender Content-Prozess — ist dies problematisch. Die Loesung liegt in externen Zustandsspeichern und strukturierten Kontextuebergaben. Implementierungsstrategien fuer Session-Kontinuitaet: (1) Gedaechtnis-Dateien (der Zustand wird in Textdateien auf Disk gespeichert, die bei Wiederaufnahme geladen werden), (2) Vektor-Datenbanken (Embeddings von frueheren Interaktionen fuer semantischen Abruf), (3) Strukturierte Zustandsobjekte (JSON-Dokumente die den Agenten-Zustand repraesentieren), (4) Event-Logs (Chronologisches Protokoll aller Aktionen, das Wiederaufnahme ermoeglicht). Bei Context Studios wird Session-Kontinuitaet durch taeglich rotierende Memory-Files, ein Cortex-basiertes Langzeitgedaechtnis und strukturierte Session-Logs implementiert — ein Beispiel fuer ein produktionsreifes Kontinuitaetssystem.
Verwandt:Agenten-Orchestrierung Agenten-Zuverlaessigkeit Multi-Agenten-Kommunikation
Agentic AI & Agenten
Skill
Ein modulares, wiederverwendbares Element, das entwickelt wurde, um eine spezifische Aufgabe innerhalb von Claude Code auszuführen. Fähigkeiten können durch Benutzereingaben oder andere Ereignisse ausgelöst werden.
Verwandt:Skill Definition (in YAML format)Skill Hot-Reload
Agentic AI & Agenten
Skill Definition (in YAML format)
Die Definition der spezifischen Fähigkeiten und Funktionen eines KI-Agenten unter Verwendung von YAML, einer menschenlesbaren Datenserialisierungssprache. Dies umreißt, was der Agent tun kann und wie er mit Werkzeugen und anderen Agenten interagiert.
Verwandt:Skill Skill Hot-Reload
KI-Kerntechnologie
Skill Hot-Reload
Die Faehigkeit, Skills eines KI-Agenten ohne vollstaendigen Systemneustart zu aktualisieren und schneller zu iterieren.
KI-Kerntechnologie
Skill Hot-Reload
Die Fähigkeit, Fähigkeiten in einer Entwicklungsumgebung automatisch zu aktualisieren und neu zu laden, ohne einen vollständigen Neustart des Systems zu erfordern.
Verwandt:Hot-Reload Development Skill Skill Definition (in YAML format)
Agentic AI & Agenten
Skills
Automatisch ausgelöste Fähigkeiten von Claude Code, die durch den Kontext aktiviert werden und es ihm ermöglichen, Aufgaben ohne ausdrückliche Benutzerbefehle auszuführen.
Verwandt:Claude Skills Agent Skills Skills System
KI-Infrastruktur
Skills API
Eine Anwendungsprogrammierschnittstelle (API), die es Entwicklern ermöglicht, wiederverwendbare Anweisungssets ('Fähigkeiten') in KI-Plattformen zu erstellen, zu verwalten und zu integrieren, um Automatisierung und Anpassung zu ermöglichen.
Verwandt:API Deprecation Responses API Claude Skills
Agentic AI & Agenten
Skills System
Ein modulares Framework innerhalb eines KI-Assistenten, das es Benutzern ermöglicht, dessen Funktionalität durch installierbare Plugins oder Module zu erweitern.
Verwandt:Claude Skills Agent Skills Skills
Agentic AI & Agenten
Skills System (AI)
Eine modulare Architektur, in der KI-Fähigkeiten als eigenständige, einsteckbare Skill-Module organisiert sind, die unabhängig hinzugefügt, entfernt oder aktualisiert werden können. Eingesetzt in Systemen wie Clawdbot.
Verwandt:Claude Skills Agent Skills Skills
Agentic AI & Agenten
Skills-System (KI)
Eine modulare Architektur, bei der KI-Fähigkeiten als diskrete, einsteckbare Skill-Module organisiert sind, die unabhängig hinzugefügt, entfernt oder aktualisiert werden können. Wird in Systemen wie Clawdbot verwendet.
Zukunft & Innovation
Software 3.0
Software 3.0 bezieht sich auf das Paradigma, in dem KI-Modelle die primäre Art und Weise sind, wie Software funktioniert, und über traditionellen Code (1.0) und neuronale Netzwerke, die auf Daten trainiert sind (2.0), hinausgeht. In Software 3.0 schreiben, testen und implementieren KI-Agenten autonom Code.
Verwandt:AI-Assisted Software Development Software for One
KI-Kerntechnologie
Software for One
Personalisierte Software-Tools, die schnell für den individuellen Gebrauch erstellt werden, oft unter Nutzung von KI für schnelles Prototyping und Automatisierung.
Verwandt:AI-Assisted Software Development Software 3.0
Compliance & Regulierung
Sovereign Cloud AI (GAIA-X)
Sovereign Cloud AI (GAIA-X) ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.
Verwandt:EU AI Act Compliance KI-Souveränität
Zukunft & Innovation
Spatial Intelligence
Die Fähigkeit der KI, 3D-Räume wahrzunehmen, zu interpretieren und darin zu agieren – die Brücke zwischen digitaler Intelligenz und physikalischer Realität.
Verwandt:World Models Physical AI
KI-Ökonomie & Kosten
Startup-Oekosystem
Das vernetzte Netzwerk aus Startups, Investoren, Acceleratoren, Universitaeten und Foerderprogrammen, das Unternehmertum und Innovation in einer Region foerdert.
Verwandt:AI Agent Ecosystem AI Agent Ecosystem Ollama Ecosystem
Agentic AI & Agenten
Stop Hook
Ein Mechanismus, der das normale Beendigungsverhalten eines KI-Modells abfängt, um Modifikationen oder eine Fortsetzung des Betriebs zu ermöglichen, bevor das Modell abschließt.
Verwandt:Hook Hook-System
KI-Infrastruktur
Streamable HTTP Transport
Streamable HTTP Transport ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.
Verwandt:Model Context Protocol (MCP)FastMCP
Agentic AI & Agenten
Subagents
Kleinere, spezialisierte AI-Agenten, die innerhalb eines größeren AI-Agentensystems zusammenarbeiten, um komplexe Aufgaben zu erfüllen.
KI-Kerntechnologie
Swift Assist
Apples KI-gestützter Codierungsassistent, der in Xcode integriert ist und Entwicklern hilft, Swift-Code zu schreiben, zu verstehen und zu debuggen, indem er große Sprachmodelle nutzt.
KI-Kerntechnologie
Synthetic Data Generation
Die Generierung synthetischer Daten umfasst die Erstellung von künstlichen Daten, die die statistischen Eigenschaften von realen Daten nachahmen. Dies wird häufig verwendet, um reale Daten in maschinellen Lernaufgaben zu ergänzen oder zu ersetzen, insbesondere wenn reale Daten knapp, teuer oder datenschutzsensibili sind.
Verwandt:Data Data Scientist Zero Data Retention (ZDR)
KI-Engineering
Tech Stack
Die vollstaendige Sammlung von Technologien zum Erstellen und Betreiben einer Softwareanwendung. Im KI-Bereich beeinflussen Tech-Stack-Entscheidungen Modellleistung, Skalierbarkeit und Wartungskosten erheblich.
Verwandt:Hybrider KI-Stack
KI-Kerntechnologie
Technical Debt Tsunami
Eine Metapher, die die überwältigende Ansammlung von technischem Schulden beschreibt, die aus hastigen oder schlecht geplanten Entwicklungspraktiken resultiert, insbesondere bei der Verwendung von KI-generiertem Code ohne angemessene Aufsicht.
Verwandt:KI-generierte technische Schulden
KI-Kerntechnologie
Terminal Workflow
Der Satz von Aufgaben, Befehlen und Prozessen, die ein Entwickler oder Benutzer innerhalb einer Befehlszeilenschnittstelle (Terminal) für Softwareentwicklung, Systemadministration oder andere technische Zwecke ausführt.
Verwandt:Terminal-Bench (KI-Coding-Benchmark)Deterministischer Workflow (Deterministic Workflow)Workflow-Orchestrierung (Workflow Orchestration)
KI-Infrastruktur
Test-Time Compute
Test-Time Compute bezieht sich auf die Rechenressourcen, die erforderlich sind, um Inferenz durchzuführen oder Vorhersagen mit einem trainierten KI-Modell zu treffen. Effiziente Test-Time-Compute ist entscheidend für die Bereitstellung von KI-Modellen in realen Anwendungen mit niedriger Latenz und hoher Durchsatz.
Verwandt:Test-Time Compute Scaling Test-Time Scaling Inference-Time Compute
KI-Engineering
Test-Time Scaling
Die Praxis, zum Zeitpunkt der Antwortgenerierung (Inferenz) mehr Rechenleistung einzusetzen als nur während des Trainings, damit das Modell für bessere Ergebnisse 'länger nachdenken' kann.
Verwandt:Reasoning Mode Chain-of-Thought (CoT)
Agentic UX
Time-to-First-Token (TTFT)
Time-to-First-Token (TTFT) ist eine zentrale Leistungsmetrik für große Sprachmodelle, die die Zeitspanne zwischen dem Absenden einer Anfrage und dem Empfang des ersten generierten Tokens misst. TTFT ist entscheidend für die wahrgenommene Reaktionsfähigkeit von KI-Anwendungen – niedrigere Werte bedeuten schnellere erste Antworten. Typische TTFT-Werte reichen von unter 100ms bei optimierten Edge-Modellen bis zu mehreren Sekunden bei großen Reasoning-Modellen. Faktoren wie Modellgröße, Hardware (GPU vs. WSE), Prompt-Länge und KV-Cache-Strategien beeinflussen TTFT maßgeblich. Im Jahr 2026 ist TTFT ein Schlüsseldifferenzierer zwischen Anbietern, wobei Cerebras WSE und optimierte Modelle wie GPT-5.3-Codex-Spark besonders niedrige Werte erreichen.
Verwandt:GPT-5.3-Codex-Spark Wafer-Scale Engine (WSE)
KI-Infrastruktur
Token Budget
Die begrenzte Anzahl von Tokens (Texteinheiten), die aufgrund von Kosten, Leistung oder Modellbeschränkungen im Eingabekontext eines Sprachmodells enthalten sein können. Dieses Budget schränkt die Menge an Informationen ein, die dem Modell bereitgestellt werden können.
Verwandt:Context Budget (Kontextbudget)Phase-Budget Token-Economics
KI-Kerntechnologie
Token Input Context
Die maximale Anzahl von Tokens (Texteinheiten), die ein KI-Modell in einer einzigen Anfrage als Eingabe verarbeiten kann.
Verwandt:1M Token Context Window Token-Economics Time-to-First-Token (TTFT)
KI-Ökonomie & Kosten
Token Yield Optimization
Token Yield Optimization ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.
Verwandt:Token-Economics Prompt Caching
KI-Kerntechnologie
Tokens (in LLMs)
Die grundlegenden Textelemente, die LLMs verarbeiten, typischerweise Wörter oder Teile von Wörtern. Der Tokenverbrauch bezieht sich auf die Anzahl der Tokens, die sowohl für Eingaben als auch für Ausgaben verwendet werden, was Kosten und Leistung beeinflusst.
Verwandt:Tokens per Second (TPS)
KI-Infrastruktur
Tool Use / Function Calling
Tool Use / Function Calling ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.
Verwandt:Model Context Protocol (MCP)Agentic AI Structured Outputs
Agentic AI & Agenten
Tool Use in AI
Die Fähigkeit von KI-Modellen, während der Inferenz mit externen Software-Tools, APIs und Diensten zu interagieren, um Informationen zu beschaffen oder ihre Fähigkeiten zu erweitern.
Verwandt:Tool Calling (Werkzeugaufruf)Tool-Nutzung (KI)Tool Use
Agentic AI & Agenten
Tool Use in KI
Die Faehigkeit von KI-Modellen mit externen Software-Tools APIs und Diensten waehrend der Inferenz zu interagieren.
KI-Infrastruktur
Tools (MCP)
Ausführbare Aktionen, die ein KI-Assistent über das Model Context Protocol (MCP) auslösen kann, wie das Schreiben einer Datei oder das Aufrufen einer API.
Verwandt:AI Agent Tools Agentische Coding-Tools
KI-Kerntechnologie
Turbopack
Ein hochperformanter inkrementeller Bundler fuer JavaScript und TypeScript, als Webpack-Nachfolger mit deutlich schnelleren Build-Zeiten.
KI-Infrastruktur
Turbopack
Ein leistungsstarkes Build-Tool für JavaScript und TypeScript, das als Nachfolger von Webpack konzipiert wurde. Bemerkenswert schnellere Build-Zeiten durch Caching.
KI-Engineering
Typicality Bias
Die systematische menschliche Präferenz für ‚typische' Texte gegenüber ungewöhnlichen – ein gut dokumentiertes Phänomen der kognitiven Psychologie. In LLM-Alignment-Daten mit α = 0.57±0.07 gemessen. Hauptursache für Mode Collapse, da RLHF/DPO diesen Bias verstärken.
Verwandt:Mode Collapse RLHF (Reinforcement Learning from Human Feedback)DPO (Direct Preference Optimization)
KI-Infrastruktur
Unified Playground
Eine konsolidierte Schnittstelle oder Umgebung, die den Zugriff auf mehrere KI-Modelle und -Tools ermöglicht und es den Benutzern erlaubt, verschiedene Modelle innerhalb einer einzigen Plattform zu experimentieren, zu vergleichen und zu nutzen.
KI-Kerntechnologie
val_bpb (Validierungs-Bits pro Byte)
Eine Leistungsmetrik fuer Sprachmodelle, die misst wie effizient ein Modell Validierungsdaten komprimiert. Niedrigere Werte zeigen bessere Komprimierung und damit bessere Modellleistung an. Im autoresearch-Projekt von Karpathy als Optimierungsziel verwendet, da sie automatisch berechenbar ist und kein menschliches Urteil zwischen Iterationen erfordert.
KI-Kerntechnologie
Veo 3.1
Googles neuestes KI-Modell zur Videogenerierung, das Google Flow antreibt. Es bietet hochwertige Videosynthese mit Unterstützung für komplexe Übergänge und native Audiogenerierung.
Verwandt:Veo 3.1
KI-Kerntechnologie
Veo 3.1
Googles neuestes KI-Modell zur Videogenerierung das Google Flow antreibt und hochwertige Videosynthese mit komplexen Uebergaengen und nativer Audiogenerierung bietet.
KI-Kerntechnologie
Veo 3.1
Googles neuestes KI-Modell zur Videogenerierung, das Google Flow antreibt und hochwertige Videosynthese mit Unterstützung für komplexe Übergänge und native Audiogenerierung bietet.
Verwandt:Veo 3.1
KI-Kerntechnologie
Verbalized Sampling
Eine Technik gegen Mode Collapse, bei der das KI-Modell über natürliche Sprach-Prompts ausdrücklich angewiesen wird, vielfältige Ausgaben zu erzeugen – statt sich auf Temperatur- oder Sampling-Parameter zu verlassen.
Verwandt:Verbalized Sampling
KI-Kerntechnologie
Verbalized Sampling
Eine Technik zur Bekaempfung von Mode Collapse bei der das KI-Modell durch natuerlichsprachliche Anweisungen aufgefordert wird diverse Ausgaben zu generieren.
Agentic AI & Agenten
Verketteter Agenten-Workflow
Eine Sequenz miteinander verbundener KI-Agenten, bei der der Output eines Agenten als Input für den nächsten dient. Claude Code /loop ermöglicht verkettete Agenten-Workflows, indem es Sub-Agenten zur Fehlerbehebung startet und autonome iterative Verbesserungszyklen schafft.
Verwandt:Agentic Workflow Workflow-Orchestrierung (Workflow Orchestration)Agentic AI
Agentic AI & Agenten
Vertical Connection
Im Kontext von KI-Agenten bezieht sich eine vertikale Verbindung auf die Verbindung zwischen einem Agenten und den externen Tools, Datenbanken und APIs, die er zur Ausführung von Aufgaben verwendet.
Verwandt:Vertical Connection (AI)Horizontal Connection (AI)
Agentic AI & Agenten
Vertical Connection (AI)
Die Verbindung zwischen einem KI-Agenten und den Tools, Datenbanken und APIs, auf die er zugreifen muss, um externe Informationen zu nutzen und Aufgaben auszuführen. In der KI-Protokolllandschaft deckt MCP diese vertikale Dimension ab.
Verwandt:Vertical Connection Horizontal Connection (AI)
Agentic AI & Agenten
Vertikale Verbindung (KI)
Die Verbindung zwischen einem KI-Agenten und den Tools, Datenbanken und APIs, die er benötigt, um auf externe Informationen zuzugreifen und Aufgaben auszuführen. In der KI-Protokolllandschaft deckt MCP diese vertikale Dimension ab.
KI-Engineering
Vibe-Coding-Kater
Die negativen Folgen nach extensivem Vibe Coding: angehäufte technische Schulden, unwartbarer Code und die Erkenntnis, dass KI-Code Engineering-Rigor erfordert.
Verwandt:Vibe Coding KI-generierte technische Schulden
KI-Infrastruktur
Wafer-Scale Engine (WSE)
Die Wafer-Scale Engine (WSE) ist ein von Cerebras Systems entwickelter Prozessor, der einen gesamten Silizium-Wafer als einzelnen Chip nutzt – im Gegensatz zu herkömmlichen Prozessoren, die aus kleinen Chips geschnitten werden. Die aktuelle WSE-3 Generation bietet 4 Billionen Transistoren und 900.000 KI-optimierte Kerne auf einer einzigen 300mm-Wafer-Fläche. Diese Architektur eliminiert die Kommunikationsengpässe zwischen mehreren GPUs und ermöglicht ultraschnelles Training und Inferenz großer Sprachmodelle. WSE ist besonders relevant für Unternehmen, die extreme Leistung bei LLM-Inferenz benötigen, mit Time-to-First-Token-Werten unter 100 Millisekunden.
Verwandt:GPT-5.3-Codex-Spark Time-to-First-Token (TTFT)
Agentic AI & Agenten
Workflow Redesign
Die Neugestaltung bestehender Geschäftsprozesse zur Integration und Optimierung des Einsatzes von AI-Agenten, was oft zu erheblichen Effizienzgewinnen führt.
Verwandt:Workflow-Orchestrierung (Workflow Orchestration)Agentic Workflow Multi-Agent-Coding-Workflow
Zukunft & Innovation
World Models
KI-Systeme, die ein grundlegendes Verständnis von physikalischen und kausalen Gesetzen entwickeln, um Vorhersagen in virtuellen und realen Umgebungen zu treffen.
Verwandt:Spatial Intelligence Physical AI
KI-Kerntechnologie
Xcode
Apples integrierte Entwicklungsumgebung (IDE) zur Softwareentwicklung für macOS, iOS, watchOS und tvOS.
Verwandt:Xcode Xcode Previews
KI-Kerntechnologie
Xcode Previews
Eine Funktion innerhalb von Xcode, die es Entwicklern ermöglicht, eine visuelle Darstellung ihrer Benutzeroberfläche in Echtzeit zu sehen, während sie codieren.
Verwandt:Xcode Xcode
Agentic AI & Agenten
Agenten-Orchestrierung
Agenten-Orchestrierung bezeichnet die Koordination mehrerer KI-Agenten durch einen zentralen Orchestrator-Agenten oder ein Orchestrierungssystem, um komplexe Aufgaben zu loesen, die einzelne Agenten nicht effizient bewältigen koennen. Die Orchestrierung bestimmt, welche Agenten wann aufgerufen werden, wie Ergebnisse zusammengefuehrt werden, und wie mit Fehlern umgegangen wird. Ein typisches Orchestrierungsmuster sieht wie folgt aus: Ein Orchestrator empfängt eine komplexe Aufgabe, zerlegt sie in Teilaufgaben, verteilt diese an spezialisierte Sub-Agenten (z.B. Research-Agent, Writing-Agent, SEO-Agent), sammelt die Ergebnisse, loest Konflikte auf und liefert das Gesamtergebnis. Der Orchestrator selbst ist oft ein LLM, das den Fortschritt beobachtet und dynamisch entscheidet. Orchestrierungsstrategien umfassen: sequenzielle Orchestrierung (Agenten arbeiten nacheinander), parallele Orchestrierung (Agenten arbeiten gleichzeitig), hierarchische Orchestrierung (verschachtelte Agenten-Teams), und dynamische Orchestrierung (der Orchestrator entscheidet zur Laufzeit, welche Agenten benoetigt werden). Die Hauptherausforderungen sind: Fehlerfortpflanzung (ein fehlgeschlagener Sub-Agent kann das ganze System blockieren), Zustandsverwaltung (der Orchestrator muss den Kontext aller laufenden Agenten verwalten), und Kostenkontrolle (multiple Agenten multiplizieren die Token-Kosten).
Verwandt:Multi-Agenten-Kommunikation GSD-Framework NemoClaw
Agentic AI & Agenten
Agenten-Zuverlaessigkeit
Agenten-Zuverlaessigkeit (Agent Reliability) bezeichnet das Mass, in dem ein KI-Agent konsistent und korrekt die gewuenschten Aufgaben erfuellt, ohne unerwartete Fehler, Abrechnungen oder Abweichungen vom vorgesehenen Verhalten. Sie ist eine der kritischsten Anforderungen fuer den produktiven Einsatz von KI-Agenten. Faktoren, die die Zuverlaessigkeit beeinflussen: Determinismus (laeuft der Agent bei gleicher Eingabe konsistent?), Fehlerbehandlung (erkennt und behandelt der Agent Fehler gracefully?), Grenzfall-Robustheit (wie reagiert der Agent auf unerwartete Eingaben?), Ressourcenbeschraenkungen (haelt der Agent Kosten- und Token-Budgets ein?), und Halluzinationsrate (wie oft erfindet der Agent falsche Fakten?). Messgroessen fuer Agent Reliability umfassen: Task-Completion-Rate (Anteil erfolgreicher Durchlaeufe), Mean Time Between Failures (MTBF), Error-Recovery-Rate (wie oft loest sich der Agent selbst aus Fehlerzustaenden?), und Output-Konsistenz-Score (Uebereinstimmung zwischen erwarteten und tatsaechlichen Outputs). Strategien zur Verbesserung der Zuverlaessigkeit: Spec-Driven Scaffolding (klare Ausfuehrungsrahmen), Phase-Budgets (verhindern Endlosschleifen), robuste Fehlerbehandlung mit Fallbacks, regelmassige Evaluierung mit Regressionstests, und Monitoring-Systeme die Anomalien erkennen.
Verwandt:Agenten-Orchestrierung GSD-Framework Eval-Integritaet
Agentic AI & Agenten
Agentische Coding-Tools
Softwareplattformen wie Claude Code, die KI-Agenten ermöglichen, Code autonom zu schreiben, zu testen und zu überprüfen. Anders als einfache Autovervollständigung führen agentische Coding-Tools mehrstufige Entwicklungs-Workflows mit minimaler menschlicher Intervention aus.
Verwandt:Agentic Coding Agentisches Coding Async Agentisches Coding
Agentic AI & Agenten
Agentisches Coding
Agentisches Coding bezeichnet Softwareentwicklungs-Workflows, bei denen KI-Agenten autonom Code schreiben, testen, debuggen, refaktorieren und iterieren – mit minimaler menschlicher Eingreifen –, um komplexe Programmieraufgaben über mehrere Schritte hinweg abzuschließen. Im Gegensatz zu herkömmlichen KI-Code-Assistenten wie GitHub Copilot, die Ergänzungen oder Snippets als Reaktion auf Entwickler-Prompts vorschlagen, nehmen agentische Coding-Systeme High-Level-Anweisungen entgegen und führen mehrstufige Pläne aus: vorhandene Codebasen lesen, neue Funktionen schreiben, Tests ausführen, Fehlermeldungen interpretieren und Bugs in einer Schleife beheben, bis die Aufgabe abgeschlossen ist. Führende agentische Coding-Plattformen umfassen Anthropics Claude Code, OpenAIs Codex CLI, Cursor, Devin von Cognition AI und Apples erweiterte Xcode-KI-Integration. Diese Systeme nutzen Large Language Models mit Tool-Use-Fähigkeiten und geben Agenten Zugang zu Dateisystemen, Terminals, Browser-Umgebungen und externen APIs. Agentisches Coding beschleunigt die Softwareentwicklung, indem repetitive Implementierungsaufgaben, Boilerplate-Generierung, Testschreiben und Refaktorierung an KI-Agenten ausgelagert werden. Wichtige Herausforderungen sind die Aufrechterhaltung der Code-Korrektheit in langen agentischen Sitzungen, die Vermeidung von Kontextdrift und sichere Sandboxing-Umgebungen. Bei Context Studios nutzen wir agentische Coding-Tools – insbesondere Claude Code und Cursor – als Kernkomponenten unseres internen Entwicklungs-Workflows, was schnellere Prototyp-Iterationen und automatisierte Testgenerierung für Kunden-KI-Anwendungen ermöglicht.
Verwandt:AI Agent
KI-Ökonomie & Kosten
AI Model Ping-Pong
AI Model Ping-Pong ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.
Verwandt:Intelligent LLM Routing Token-Economics
Agentic AI & Agenten
Async Agentisches Coding
Ein Entwicklungsworkflow, bei dem ein KI-Coding-Agent autonom auf der lokalen Maschine läuft und Aufgaben über einen längeren Zeitraum ausführt, ohne dass ständige Entwicklerüberwachung erforderlich ist. Der Entwickler schaut periodisch vorbei, um den Fortschritt zu überprüfen, Aktionen zu genehmigen oder Anleitung zu geben. Ermöglicht durch Tools wie Claude Code Remote Control.
Verwandt:Agentic Coding Agentisches Coding Agentische Coding-Tools
KI-Infrastruktur
Batch-Inferenz
Batch-Inferenz bezeichnet die gebündelte Verarbeitung mehrerer KI-Anfragen in einem einzelnen Durchlauf, statt jede Anfrage sofort einzeln zu beantworten. Inputs werden gesammelt, zu Batches zusammengefasst und gemeinsam durch das Modell verarbeitet – im Gegensatz zur Real-Time-Inferenz, bei der jede Anfrage sofort einzeln beantwortet wird. Die wirtschaftlichen Vorteile sind erheblich: KI-Anbieter wie Anthropic und OpenAI bieten Batch-APIs an, die 50–75% günstiger sind als synchrone Endpunkte. Der Grund ist bessere GPU-Auslastung – statt viele kleine Anfragen sequenziell zu verarbeiten, nutzen Batches verfügbare Rechenkapazität nahezu vollständig aus. NVIDIA Blackwell und Tensor-Kerne sind speziell auf hohen Batch-Durchsatz ausgelegt. Typische Batch-Inferenz Use Cases: Massenübersetzung von Dokumenten, automatisierte SEO-Analyse großer Content-Bibliotheken, tägliche Zusammenfassungen von News-Feeds, Produktkatalog-Klassifizierung, Sentiment-Analyse von Kundenfeedback und nächtliche Verarbeitung von Analysedaten. Gemeinsam ist diesen Szenarien: Ergebnisse werden nicht in Echtzeit benötigt – Verzögerungen von Minuten bis Stunden sind akzeptabel. Wichtige technische Parameter: Batch-Größe (Anzahl Anfragen pro Batch), maximale Latenz (Deadline für Ergebnisse), Fehlerbehandlung (was passiert bei einzelnen fehlschlagenden Items?) und adaptives Batching (dynamische Größenanpassung basierend auf Last und Token-Anzahl pro Anfrage). Moderne Batch-Systeme implementieren Continuous Batching für maximale GPU-Effizienz.
Verwandt:KI-Inferenz Echtzeit-Inferenz Tokens per Second (TPS)
KI-Sicherheit & Leitplanken
Benchmark-Kontamination
Benchmark-Kontamination bezeichnet das Problem, bei dem Evaluierungsdaten eines Benchmarks versehentlich oder absichtlich in den Trainingsdaten eines KI-Modells enthalten sind. Das Modell erscheint dadurch auf diesem Benchmark besser als es tatsächlich generalisiert — es hat Antworten 'auswendig gelernt' statt Fähigkeiten erworben. Das Problem ist systemischer Natur: Moderne Sprachmodelle trainieren auf riesigen Web-Datensätzen; populäre Benchmarks (MMLU, HumanEval, GSM8K, MATH) sind frei im Internet verfügbar, was versehentliche Aufnahme wahrscheinlich macht. Gleichzeitig schaffen wirtschaftliche Anreize Bedingungen für intentionale Kontamination. Symptome: Dramatisch bessere Benchmark-Scores als reale Task-Performance; große Diskrepanz zwischen Benchmark-Ergebnissen und Nutzererfahrungen; der 'MMLU-Shuffle'-Effekt, bei dem zufällige Antwort-Reihenfolgen Scores stark verändern — ein bekanntes Kontaminationssignal. Gegenmaßnahmen: Private Hold-out-Benchmarks vor Veröffentlichung; dynamische Benchmarks mit täglich neu generierten Fragen; Contamination-Detection über N-gram-Overlap-Analyse; Vertrauen auf unabhängige externe Evaluierungen statt Selbstberichte. Organisationen wie METR, HELM und ARC Evals entwickeln kontaminationsresistentere Methodologien.
Verwandt:Eval-Integritaet GPT-5 KI-Inferenz
Agentic AI & Agenten
Coding Agent
Ein KI-System, das über die Codevervollständigung hinausgeht und autonom komplexe Software-Engineering-Aufgaben wie das Implementieren von Funktionen, das Beheben von Fehlern, das Ausführen von Tests und das Verwalten von Git-Workflows durchführt.
Verwandt:Multi-Agent Coding CLI Coding Agent Multi-Agent-Coding-Workflow
Agentic AI & Agenten
Computer Use (KI)
Computer Use (KI) bezeichnet die Faehigkeit von KI-Agenten, einen Computer direkt zu bedienen — also Maus zu bewegen, zu klicken, Text einzugeben, Bildschirminhalte zu lesen und auf Anwendungen zuzugreifen — genau wie ein menschlicher Nutzer. Diese Faehigkeit wurde 2024 von Anthropic mit Claude als erste weitreichend verfuegbare Implementierung vorgestellt. Im Gegensatz zu herkoemmlicher Browser-Automatisierung (die auf strukturierten APIs, CSS-Selektoren und vordefinierten Skripten basiert) arbeitet ein Computer-Use-Agent auf Pixelebene: Er sieht einen Screenshot des Bildschirms, entscheidet, wo er klicken oder was er eingeben soll, fuehrt die Aktion aus und beobachtet das Ergebnis. Dieser Ansatz ist universell — er funktioniert mit jeder Anwendung und jeder Website ohne spezielles Engineering. Die praktischen Faehigkeiten umfassen: Navigation auf beliebigen Websites ohne API-Zugang, Interaktion mit Desktop-Anwendungen, Ausfuellen von Formularen, Extrahieren von Daten aus visuellen Interfaces, und die Ausfuehrung von mehrstufigen Workflows die keine programmatischen Schnittstellen haben. Computer Use hat auch bekannte Schwaechen: Es ist langsamer als direkte API-Aufrufe (da jeder Schritt einen Screenshot erfordert), anfaelliger fuer Fehler bei unerwarteten UI-Aenderungen, und teurer in Token-Verbrauch da Screenshots als Input mitgehen. Trotzdem ist es fuer viele Automatisierungsaufgaben, die keine API anbieten, die einzig praktikable Option.
Verwandt:Agenten-Orchestrierung Multi-Agenten-Kommunikation GSD-Framework
KI-Infrastruktur
Echtzeit-Inferenz
Echtzeit-Inferenz bezeichnet die sofortige Verarbeitung von KI-Anfragen mit minimaler Latenz, typischerweise im Bereich von Millisekunden bis wenige Sekunden. Im Gegensatz zur Batch-Inferenz, bei der Anfragen gesammelt und gebündelt verarbeitet werden, reagiert Echtzeit-Inferenz auf jede Eingabe unverzüglich — entscheidend für interaktive Anwendungen, bei denen Nutzer unmittelbares Feedback erwarten. Die wichtigste Metrik ist der Time-to-First-Token (TTFT): Zeit zwischen Anfrage und erstem Token der Antwort. Für Chatbots gilt TTFT unter 500ms als akzeptabel; für Coding-Assistenten werden sub-200ms angestrebt. Streaming-Ausgabe (Token für Token) verbessert die wahrgenommene Latenz erheblich, auch wenn die Gesamtantwortzeit gleich bleibt. Typische Echtzeit-Inferenz Use Cases: Konversations-Chatbots wie ChatGPT oder Claude.ai, KI-Coding-Assistenten wie GitHub Copilot oder Cursor, Echtzeit-Übersetzung, Voice-Assistenten (Spracherkennung + Generierung), interaktive Dokument-Analyse und autonome KI-Agenten, die schnell auf Umgebungsveränderungen reagieren müssen. Die technischen Anforderungen sind deutlich höher als bei Batch-Inferenz: niedrige Latenz erfordert geografisch nahe Server (Edge Inference), spezielle Low-Latency-Optimierungen oder kleinere, schnellere Modelle. Anbieter wie Groq (LPU-Chip) oder Cerebras erreichen über 500 TPS für Echtzeit-Anwendungen. Entscheidend ist der Trade-off zwischen Latenz, Durchsatz und Kosten pro Token.
Verwandt:KI-Inferenz Batch-Inferenz Time-to-First-Token (TTFT)
KI-Kerntechnologie
EHR
Elektronische Gesundheitsakte — digitale Patientenakte. KI-Agenten integrieren sich zunehmend mit EHR-Systemen für automatisierte Dokumentation.
KI-Sicherheit & Leitplanken
Evidence Packs
Kuratierte Dokumentenbündel, die dem KI-Modell als verifizierte Faktenbasis für komplexe Aufgaben bereitgestellt werden, um Halluzinationen signifikant zu reduzieren.
Verwandt:Context Engineering Hallucination Monitoring
KI-Kerntechnologie
GGUF Format
GGUF ist ein Dateiformat zum Speichern quantisierter großer Sprachmodelle, das für effizientes Laden und Inferenz entwickelt wurde. Es hat das ältere GGML-Format ersetzt und wird häufig von Tools wie llama.cpp und Ollama verwendet, um Modelle lokal auszuführen.
KI-Kerntechnologie
GLM-5
GLM-5 ist ein großes Sprachmodell von Zhipu AI, einem Pekinger KI-Forschungsunternehmen, mit rund 744 Milliarden Parametern – eines der leistungsfähigsten Open-Weight-Modelle, das bislang veröffentlicht wurde. GLM-5 ist das erste Open-Weight-Modell, das auf Augenhöhe mit OpenAIs GPT-5.2 abschneidet – bei Reasoning, Coding und mehrsprachigem Textverständnis. Anders als vollständig proprietäre Modelle von OpenAI, Google oder Anthropic sind die Gewichte von GLM-5 öffentlich zugänglich, sodass Unternehmen das Modell auf eigener Infrastruktur betreiben, für spezifische Domänen feinabstimmen und vollständige Datensouveränität gewährleisten können. GLM-5 nutzt eine Mixture-of-Experts-Architektur (MoE), bei der pro Inferenzschritt nur ein Bruchteil der Parameter aktiviert wird – das reduziert den Rechenaufwand gegenüber dichten Modellen vergleichbarer Stärke erheblich. Das Modell unterstützt ein 128K-Token-Kontextfenster und ermöglicht damit die Analyse langer Dokumente, komplexes mehrstufiges Reasoning sowie tiefes Code-Verständnis. GLM-5 markiert einen Wendepunkt in der globalen KI-Landschaft: Frontier-Intelligenz ist nicht länger das exklusive Terrain westlicher Tech-Konzerne. Das zweisprachige chinesisch-englische Vortraining verschafft GLM-5 einen Vorsprung bei ostasiatischen Sprachen, während die Leistung auch in europäischen Sprachen überzeugt. Bei Context Studios haben wir GLM-5 eingehend für Kundenanwendungen bewertet, bei denen On-Premise-Betrieb oder DSGVO-konforme Datenhaltung erforderlich ist. Die Kombination aus offenen Gewichten, erweitertem Kontextfenster und Frontier-Performance macht GLM-5 zur überzeugenden Alternative für Unternehmen, die Kontrolle und Compliance über API-Abhängigkeit stellen.
Agentic AI & Agenten
Human-in-the-Loop (HITL)
Menschliche Aufsicht, die in die KI-Entscheidungsfindung integriert ist.
Verwandt:Human-AI Collaboration Design Agent Loop Observe-Think-Act loop
KI-Infrastruktur
Inferenz-Chip
Ein Inferenz-Chip ist ein spezialisierter Halbleiter-Prozessor, optimiert für die effiziente Ausführung von KI-Modellen bei der Inferenz. Im Gegensatz zu General-Purpose-CPUs oder Training-GPUs priorisieren Inferenz-Chips Durchsatz (TPS), Energieeffizienz und niedrige Latenz für bereits trainierte Modelle. Die drei dominanten Kategorien: GPUs wie NVIDIAs H100 und B200 Blackwell, die durch massive parallele Rechenarchitektur und Tensor-Kerne glänzen; TPUs (Tensor Processing Units) von Google, speziell für Matrix-Multiplikationen in neuronalen Netzen entwickelt; sowie ASICs (Application-Specific Integrated Circuits) für eine spezifische Aufgabe — etwa Groqs LPU (Language Processing Unit) mit 500+ TPS, Cerebrases CS-3 oder Amazons Inferentia-Chips. NVIDIAs Blackwell-Generation (GB200, B200) hat die Inferenz-Landschaft revolutioniert: Natives FP4 ermöglicht 4× mehr Operationen pro Watt vs. H100; 192 GB HBM3e-Speicher hält selbst die größten Frontier-Modelle vollständig im VRAM. Der GB200 NVL72 Rack (72 B200 GPUs, 1,4 TB Gesamt-VRAM) erreicht 30× höheren Durchsatz als H100-Systeme. Die Wahl des richtigen Inferenz-Chips beeinflusst Kosten, Latenz und maximale Modellgröße: Kleinere Modelle laufen effizient auf einzelnen H100s; Frontier-Modelle benötigen Multi-GPU-Cluster.
Verwandt:KI-Inferenz NVIDIA Blackwell NVIDIA Vera Rubin
Sicherheit & Souveränität
Injection Attack (LLM)
Bösartige Anweisungen in der Eingabe zur Manipulation des Verhaltens von LLM.
Verwandt:Distillationsangriff (Distillation Attack)Prompt Injection SQL-Injection
KI-Kerntechnologie
JSON-RPC
Ein leichtgewichtiges, in JSON kodiertes Remote-Procedure-Call-Protokoll, das im Model Context Protocol als Kommunikationsschicht für den standardisierten Nachrichtenaustausch zwischen KI-Modellen und Tool-Servern dient.
Verwandt:JSON-RPC JSON Mode
KI-Kerntechnologie
JSON-RPC
Ein leichtgewichtiges Remote-Procedure-Call-Protokoll in JSON-Kodierung das als Kommunikationsschicht im Model Context Protocol verwendet wird.
KI-Kerntechnologie
JSON-RPC
Ein leichtgewichtiges Remote-Procedure-Call-Protokoll in JSON-Kodierung das als Kommunikationsschicht im Model Context Protocol fuer den standardisierten Nachrichtenaustausch verwendet wird.
Verwandt:JSON-RPC JSON Mode
KI-Ökonomie & Kosten
KI-Aktienverkauf
Ein KI-Aktienverkauf bezieht sich auf einen signifikanten Rückgang der Aktienkurse von KI-bezogenen Unternehmen. Im Februar 2026 erlebte der S&P 500 Software & Services Index einen bemerkenswerten Ausverkauf, während NVIDIA-CEO Jensen Huang eine optimistische Einschätzung der KI-Infrastrukturausgaben beibehielt.
Agentic AI & Agenten
KI-Coding-Agent
Ein KI-gestütztes System, das autonom Code generiert, modifiziert und bereitstellt und sich in Entwicklungsworkflows wie CI/CD-Pipelines und Versionskontrolle integriert. Im Gegensatz zu Code-Assistenten, die Vervollständigungen vorschlagen, können Coding-Agenten eigenständig ganze Aufgaben erledigen.
KI-Kerntechnologie
KI-Coding-Desktop-App
Eine eigenständige Desktop-Anwendung für KI-gestützte Softwareentwicklung mit Agentenverwaltung, Aufgabenüberwachung und integrierten Entwicklungsworkflows.
Verwandt:Codex App Multi-Agent Coding
KI-Infrastruktur
KI-Inferenz
KI-Inferenz (auch AI Inference) bezeichnet den Prozess, bei dem ein trainiertes KI-Modell eine Eingabe verarbeitet und eine Vorhersage oder Ausgabe generiert. Im Gegensatz zum Training, das einmalig und rechenintensiv ist, findet Inferenz bei jeder einzelnen Nutzeranfrage statt — ob bei einem Chatbot, einem Coding-Assistenten oder einer Bildanalyse. Die Inferenz ist daher der mit Abstand kostenrelevanteste Faktor im KI-Betrieb: Während ein Modell einmal trainiert wird (Kosten im Millionenbereich), wird es millionenfach pro Tag für Inferenz genutzt. Die wichtigsten Metriken sind Time-to-First-Token (TTFT) für die Latenz und Tokens-per-Second (TPS) für den Durchsatz. Moderne Inferenz-Optimierungen umfassen Quantisierung (Reduktion der Rechengenauigkeit), Batching (Bündelung mehrerer Anfragen), Speculative Decoding und spezialisierte Hardware wie NVIDIAs Blackwell-Architektur. Für Unternehmen ist die Wahl zwischen Batch-Inferenz (günstig, aber langsam) und Echtzeit-Inferenz (schnell, aber teurer) eine zentrale Architekturentscheidung.
Verwandt:Batch-Inferenz Echtzeit-Inferenz Time-to-First-Token (TTFT)
KI-Kerntechnologie
Kontextfenster
Das Kontextfenster bezeichnet die maximale Textmenge – gemessen in Token –, die ein großes Sprachmodell in einem einzigen Inferenzaufruf verarbeiten und berücksichtigen kann. Token sind die Grundeinheiten des Texts für LLMs und entsprechen grob drei bis vier Zeichen oder drei Viertel eines englischen Wortes. Das Kontextfenster bestimmt, was das Modell beim Generieren einer Antwort sehen kann: Gesprächsverläufe, abgerufene Dokumente, Codedateien und Anweisungen konkurrieren alle um diesen begrenzten Raum. Frühe Transformer-Modelle wie BERT arbeiteten mit 512-Token-Fenstern; GPT-3 erweiterte dies auf 4.096 Token. Heutige Frontier-Modelle gehen weit darüber hinaus: GPT-4 Turbo bietet 128K Token, Googles Gemini 1.5 Pro unterstützt bis zu einer Million Token, und Anthropics Claude 3.7 Sonnet verarbeitet 200K Token – ausreichend, um ganze Rechtsverträge, Codebasen oder Bücher in einem einzigen Prompt zu verarbeiten. Das Kontextfenster ist eine kritische Architekturbeschränkung, da Attention-Mechanismen quadratisch mit der Sequenzlänge skalieren und sehr lange Kontexte rechenintensiv machen. Retrieval-Augmented Generation (RAG) entstand teilweise als Workaround für begrenzte Kontextfenster, indem relevante Passagen dynamisch abgerufen werden. Mit wachsenden Kontextfenstern ergänzen sich RAG und Long-Context-Ansätze zunehmend, anstatt zu konkurrieren. GLM-5 unterstützt ein 128K-Token-Kontextfenster. Bei Context Studios ist die Größe des Kontextfensters eine der ersten Spezifikationen, die wir bei der Auswahl eines Sprachmodells für einen Kundenanwendungsfall evaluieren.
Verwandt:Large Language Model (LLM)Transformer RAG (Retrieval-Augmented Generation)
KI-Kerntechnologie
Medical Coding
Übersetzung medizinischer Diagnosen in standardisierte Codes (ICD-10/11, CPT). KI-Agenten automatisieren diesen fehleranfälligen Prozess.
Verwandt:AI Coding Agents (KI-Codieragenten)AI Coding Assistants AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)
KI-Infrastruktur
Mixture-of-Experts (MoE)
Mixture-of-Experts (MoE) ist eine neuronale Netzwerkarchitektur, bei der ein Modell aus mehreren spezialisierten Teilnetzwerken – sogenannten Experten – besteht, kombiniert mit einem erlernten Gating-Mechanismus, der jeden Eingabe-Token dynamisch zu den relevantesten Experten weiterleitet. Anstatt bei jedem Token alle Parameter zu aktivieren, wählt ein MoE-Modell pro Vorwärtsdurchlauf nur eine kleine Teilmenge der Experten aus – typischerweise zwei bis acht von Dutzenden. Das reduziert den aktiven Rechenaufwand erheblich, ohne die Gesamtkapazität zu verringern. Google Brain popularisierte dieses Konzept mit dem Switch Transformer, Mistral AI brachte es mit Mixtral 8x7B und 8x22B in die Open-Source-Community. Heute nutzen GPT-4, Gemini 1.5 Pro, DeepSeek V3 und GLM-5 alle MoE-Architekturen. MoE ermöglicht es, die Gesamtanzahl der Parameter auf Hunderte von Milliarden oder gar Billionen zu skalieren, ohne dass die Inferenzkosten proportional steigen: Ein MoE-Modell mit 700 Milliarden Parametern aktiviert pro Token möglicherweise nur 40 bis 70 Milliarden, was den Betriebskosten eines weit kleineren dichten Modells entspricht. Der entscheidende Kompromiss ist der Speicherbedarf: Alle Expertengewichte müssen während der Inferenz im VRAM liegen, auch wenn nur ein Bruchteil genutzt wird. MoE ist heute ein grundlegendes Muster in der Frontier-KI-Entwicklung, das die Wissenskapazität eines massiven Modells zu den Kosten eines kompakten ermöglicht. Bei Context Studios ist das Verständnis von MoE essenziell, wenn wir Kunden bei der GPU-Infrastruktur für Self-Hosted-Deployments beraten.
Verwandt:Transformer Large Language Model (LLM)
KI-Kerntechnologie
Modell-Einstellung
Modell-Einstellung ist der Prozess, bei dem KI-Unternehmen ältere KI-Modelle abkündigen und einstellen und Nutzer auf neuere Versionen umleiten. OpenAIs Einstellung von GPT-4o am 13. Februar 2026 war bemerkenswert für die emotionale Reaktion, die sie auslöste, und verdeutlichte die Bindung der Nutzer an spezifische KI-Persönlichkeiten.
KI-Kerntechnologie
Moonshot AI
Ein chinesisches KI-Unternehmen, das die Kimi-Serie von Sprachmodellen entwickelt hat, bekannt für bahnbrechende ultra-lange Kontextfenster und wettbewerbsfähige Open-Source-Modelle.
Verwandt:Lang-Kontext-Modell KI-Preis-Disruption
Agentic AI & Agenten
Multi-Agenten-Kommunikation
Multi-Agenten-Kommunikation bezeichnet die Protokolle, Mechanismen und Patterns, über die mehrere KI-Agenten miteinander interagieren, Informationen austauschen und Aufgaben koordinieren. In komplexen KI-Systemen arbeiten spezialisierte Agenten zusammen: Ein Orchestrator koordiniert Sub-Agenten für Recherche, Schreiben, Qualitätsprüfung und Publishing. Die dominanten Kommunikationsmodelle: Direktes Orchestrieren (übergeordneter Agent ruft Sub-Agenten auf), MCP (Model Context Protocol) von Anthropic als standardisierter Tool-Aufruf-Protokoll zwischen Agenten und externen Diensten, A2A (Agent-to-Agent Protocol) von Google als offenem Standard für Peer-Kommunikation, sowie Message-Queue-basierte Systeme für asynchrone Kommunikation. Kritische Design-Entscheidungen: Synchron vs. asynchron (synchron = einfacher, asynchron = skalierbarer); Push vs. Pull; Fehlerhandling (was passiert, wenn ein Sub-Agent ausfällt?); Zustandsmanagement (wie wird gemeinsamer Kontext konsistent gehalten?). Jede Agent-zu-Agent-Schnittstelle muss explizit spezifiziert, versioniert und unabhängig getestet werden. Praxisbeispiel: Ein Content-Erstellungs-Multi-Agent-System besteht aus Recherche-Agent (holt aktuelle Daten via MCP), Schreib-Agent (erhält Research-Output, generiert Draft), Qualitäts-Agent (prüft Draft gegen Regeln) und Publishing-Agent (veröffentlicht genehmigten Content). Ohne klare Kommunikationsverträge werden Multi-Agenten-Systeme fragil und schwer zu debuggen.
Verwandt:GSD-Framework Agenten-Orchestrierung Spec-Driven Scaffolding
KI-Kerntechnologie
Multimodale KI
Multimodale KI bezeichnet künstliche Intelligenzsysteme, die Informationen über mehrere Datenmodalitäten hinweg verarbeiten, verstehen und generieren können – darunter Text, Bilder, Audio, Video und strukturierte Daten – innerhalb eines einzigen, einheitlichen Modells. Anders als unimodale Systeme, die auf einen Datentyp spezialisiert sind, können multimodale KI-Modelle gleichzeitig über Modalitäten hinweg schlussfolgern: ein Bild beschreiben, Fragen zu einem Video beantworten, Sprache transkribieren und analysieren oder Bilder aus Textbeschreibungen generieren. Die Transformer-Architektur, die von Google Brain entwickelt und später von OpenAI, DeepMind und Anthropic verfeinert wurde, erwies sich durch Attention-Mechanismen, die einheitlich über diverse Token-Sequenzen operieren, als natürlich geeignet für multimodales Lernen. Wegweisende multimodale Modelle sind OpenAIs GPT-4V und GPT-4o, Google DeepMinds Gemini 1.5 und 2.0, Anthropics Claude-3-Familie und Metas Llama 3.2 Vision. ByteDances Seedance 2.0 ist ein Beispiel für multimodale KI in der Videogenerierung. Die praktischen Anwendungen multimodaler KI reichen von Gesundheitswesen (gemeinsame Analyse von Bildbefunden und klinischen Notizen) über Fertigung (Kombination von Sensordaten mit visueller Inspektion) bis zu Handel (Bildersuche nach Produkten) und Medien (automatische Videountertitelung). Multimodale KI wird schnell zum Standard-Paradigma für Foundation Models. Bei Context Studios setzen wir multimodale KI in Kundenanwendungen ein – von Dokumentenintelligenz-Pipelines, die Text und eingebettete Bilder verarbeiten, bis zu Produktvisualisierungstools.
Verwandt:Large Language Model (LLM)Transformer
KI-Infrastruktur
NVIDIA Blackwell
NVIDIA Blackwell ist NVIDIAs KI-GPU-Architektur der neuesten Generation, benannt nach Mathematiker David Harold Blackwell. Auf GTC 2024 vorgestellt und auf GTC 2025/2026 erweitert, umfasst sie mehrere GPU-Varianten: B200 (Inferenz- und Training-optimiert), GB200 (Grace Blackwell Superchip, kombiniert ARM-CPU + B200-GPU), und GB200 NVL72 (72-GPU-Rack-Scale-System für Hyperscaler). Technische Fortschritte gegenüber Hopper (H100): Natives FP4 bedeutet gegenüber FP8 nochmals 2× Recheneffizienz. Der B200 erreicht 20 Petaflops FP4-Inferenz-Leistung. Der integrierte NVLink-Switch mit 1,8 TB/s Bandbreite eliminiert Inter-GPU-Kommunikations-Bottlenecks. 192 GB HBM3e-Speicher pro B200 ermöglicht, 400B-Parameter-Modelle ohne Model-Parallelism zu halten. Für Inferenz besonders relevant: Der GB200 NVL72 Rack (72 B200 GPUs, 1,4 TB HBM3e gesamt) hält ein 1-Billion-Parameter-Modell vollständig im VRAM und verarbeitet es mit 30× höherem Durchsatz als H100-Systeme. Auf GTC 2026 kündigte NVIDIA Blackwell Ultra an: weitere 2× Inferenz-Durchsatz-Verbesserung plus verbesserte Multi-Instance-GPU-Fähigkeiten. Cloud-Anbieter AWS, Azure und Google Cloud deployen Blackwell-Infrastruktur schrittweise 2025/2026, was zu weiteren API-Preissenkungen führt.
Verwandt:Inferenz-Chip NVIDIA Vera Rubin KI-Inferenz
KI-Infrastruktur
NVIDIA Vera Rubin
NVIDIA Vera Rubin ist die nächste GPU-Architekturgeneration nach Blackwell, auf dem GTC 2026 von Jensen Huang angekündigt und für 2026/2027 geplant. Benannt nach Astronomin Vera Rubin, die Evidenz für dunkle Materie lieferte, soll die Architektur erneut einen Generationssprung bei KI-Inferenz- und Training-Performance bringen. Bekanntgegebene Eckdaten: Der 'Vera' ARM-CPU als Nachfolger des Grace-Prozessors mit höherer Speicherbandbreite und verbesserten KI-Erweiterungen, sowie der 'Rubin' GPU-Die als Rechenmotor. Gemeinsam bilden sie den Vera Rubin Superchip — analog zur Grace Blackwell Architektur. NVIDIA folgt seinem jährlichen Roadmap-Rhythmus: Hopper (2022) → Blackwell (2024) → Blackwell Ultra (2025) → Vera Rubin (2026/2027). Für die KI-Industrie bedeutet Vera Rubin die Fortsetzung des Hardware-Deflationstrends: Alle 1–2 Jahre verdoppelt bis verdreifacht sich die Inferenz-Performance pro Dollar. Dieser Trend treibt den jährlichen 50–80% Preisverfall bei LLM-APIs. Unternehmen mit teuren Inferenz-Workloads können bei Vera-Rubin-basierter Cloud-Kapazität mit drastisch günstigeren Kosten rechnen. Im Wettbewerb konkurriert NVIDIA mit AMDs MI400, Googles Ironwood TPU (ebenfalls GTC 2026 angekündigt), Intel Gaudi 4 und ASIC-Anbietern wie Groq, Cerebras und Amazon Trainium 3.
Verwandt:NVIDIA Blackwell Inferenz-Chip KI-Inferenz
Agentic AI & Agenten
Phase-Budget
Ein Phase-Budget ist ein explizit definiertes Zeitlimit oder Token-Limit für eine einzelne Phase innerhalb eines KI-Agenten-Workflows. Das Konzept entstammt dem GSD-Framework von Context Studios und löst eines der häufigsten Probleme bei autonomen Agenten: unkontrolliertes Wachsen von Sitzungen (Runaway Sessions), bei denen Agenten ohne Zeitbeschränkung in analyseparalytische Endlos-Loops geraten. In der Praxis: Ein Content-Erstellungs-Agent erhält 120 Sekunden für Recherche, 300 Sekunden für Schreiben und 60 Sekunden für Qualitätsprüfung. Überschreitet eine Phase das Budget, bricht der Agent diese Phase ab, gibt das bisherige Ergebnis weiter und protokolliert die Überschreitung. So blockiert kein einzelner überlaufender Schritt die gesamte Pipeline. Phase-Budgets sind besonders kritisch in Multi-Agent-Systemen, wo ein langsamer Teilagent die gesamte Orchestrierung verzögern kann. Sie ermöglichen präzise Kostenkontrolle: Da LLM-Inferenzkosten direkt von Token-Anzahl abhängen, begrenzen Token-Budgets maximale Kosten pro Phase. Best Practices: Budgets großzügig, aber nicht unbegrenzt setzen. Immer einen Fallback definieren — was passiert bei Überschreitung? Budgets empirisch nach mehreren Produktionsläufen kalibrieren. Typische Token-Budgets: 2.000–20.000 Tokens pro Phase je nach Aufgabenkomplexität.
Verwandt:GSD-Framework Spec-Driven Scaffolding Agenten-Zuverlaessigkeit
KI-Kerntechnologie
Research Preview
Eine Vorabversion von Software für begrenzte Nutzer zum Testen vor dem offiziellen Launch. Üblich bei KI-Produkten.
Verwandt:Deep Research Agents
KI-Kerntechnologie
SaaS-Wildwuchs
SaaS-Wildwuchs bezeichnet das unkontrollierte Wachstum von Software-as-a-Service-Abonnements in einer Organisation. Das durchschnittliche Unternehmen nutzt 130+ SaaS-Tools, wobei 25-30% der Ausgaben für ungenutzte Lizenzen verschwendet werden. KI-Super-Apps versprechen, den SaaS-Wildwuchs zu reduzieren.
Verwandt:SaaS SaaS
KI-Infrastruktur
Sandboxed Iframe
Ein Sandboxed Iframe ist ein eingeschränkter HTML-Container, der eingebetteten Inhalt aus Sicherheitsgründen von der übergeordneten Seite isoliert. Im Kontext von MCP Apps ermöglichen Sandboxed Iframes KI-Assistenten, interaktive Drittanbieter-Anwendungen sicher in Konversationen zu rendern.
Verwandt:Sandbox-Container Sandboxed Web-Zugriff
KI-Infrastruktur
Semantic Router
Eine leichtgewichtige Schicht, die die Absicht des Nutzers klassifiziert und an den effizientesten Sub-Agenten oder das passende Modell weiterleitet, um Zeit und Geld zu sparen.
Verwandt:Embedding Intelligent LLM Routing
KI-Kerntechnologie
Small Language Model (SLM)
Ein KI-Sprachmodell mit relativ wenigen Parametern (typischerweise unter 10B), das für eine effiziente lokale Bereitstellung auf Verbrauchshardware konzipiert ist und gleichzeitig nützliche Fähigkeiten für spezifische Aufgaben beibehält.
Verwandt:Small Language Models (SLM)Large Language Model (LLM)Vision-Language Models
KI-Engineering
Spec-Driven Development
Spec-Driven Development ist ein AI engineering-Konzept in modernen KI-Systemen, das die Entwicklung und Wartung KI-gestützter Systeme verbessert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Software-Qualität und Entwicklungsgeschwindigkeit direkt Geschäftsergebnisse beeinflussen.
Verwandt:AGENTS.md Claude Skills
Agentic AI & Agenten
Spec-Driven Scaffolding
Spec-Driven Scaffolding bezeichnet den Ansatz, KI-Agenten nicht durch freie Prompts, sondern durch strukturierte, maschinenlesbare Spezifikationen zu steuern — ähnlich wie Softwareentwickler Code gegen technische Anforderungsdokumente schreiben. Statt 'schreibe einen Blogpost über KI' definiert eine Spezifikation präzise: Format, Zielgruppe, Mindest-Wortanzahl, erforderliche Sektionen, Quellenpflichten, verbotene Formulierungen und Akzeptanzkriterien. Das 'Scaffolding' bezeichnet das Gerüst strukturierter Instruktionen, das dem Agenten Halt gibt und Drift verhindert. Wie ein Baugerüst während der Konstruktion gibt das Spec-Scaffolding dem Agenten zur Laufzeit eine feste Struktur. Diese umfasst typischerweise: Agenten-Rolle und Kontext, Eingabe-Validierungsregeln, Schritt-für-Schritt-Deliverables, Output-Format-Anforderungen und explizite Grenzen (was der Agent nicht tun soll). Der Unterschied zu klassischem Prompt Engineering ist fundamental: Prompt Engineering optimiert für Sprachqualität; Spec-Driven Scaffolding optimiert für Verhaltenskonsistenz. Ein gut spezifizierter Agent produziert beim 1000. Durchlauf das gleiche strukturelle Ergebnis wie beim ersten. Spec-Driven Scaffolding ermöglicht einen wichtigen operativen Vorteil: Spezifikationen können versioniert, peer-reviewed, getestet und iterativ verbessert werden, unabhängig vom zugrundeliegenden Modell.
Verwandt:GSD-Framework Phase-Budget Agenten-Orchestrierung
KI-Engineering
Speculative Decoding
Eine Optimierungstechnik, bei der ein kleines, schnelles Modell die nächsten Token vorhersagt und ein großes Modell diese nur verifiziert, was die Geschwindigkeit drastisch erhöht.
Verwandt:Small Language Models (SLM)Token-Economics
KI-Infrastruktur
Test Felder
Dies ist eine Testdefinition die alle Felder testet. KI-Inferenz bezeichnet den Prozess, bei dem ein trainiertes KI-Modell neue Eingabedaten verarbeitet und Vorhersagen oder Ausgaben generiert. Dies ist eine ausreichend lange Definition mit mehreren Sätzen, die den Begriff klar erklärt. Wir beschreiben hier die Grundlagen der KI-Inferenz und ihre Bedeutung für den laufenden Betrieb. In der Praxis sind Inferenzkosten der dominierende Kostenfaktor.
Verwandt:Batch-Inferenz Echtzeit-Inferenz
KI-Kerntechnologie
Text-to-Video
Text-to-Video bezeichnet eine Kategorie generativer KI-Technologie, bei der Modelle Videosequenzen direkt aus natürlichsprachlichen Beschreibungen erzeugen – ohne traditionelles Filmen, Animation oder manuelles Editing. Text-to-Video-Modelle analysieren einen Textprompt und synthetisieren temporal konsistente Videoframes, die die beschriebenen Szenen, Kamerabewegungen, Lichtverhältnisse und Objekte abbilden. Das Feld hat sich seit OpenAIs Sora, das Anfang 2024 mit physikalisch plausiblen, minutenlangen kinematischen Clips Aufsehen erregte, rasant entwickelt. Führende Text-to-Video-Systeme sind heute Googles Veo 3, ByteDances Seedance 2.0, Runway MLs Gen-3 Alpha, Stability AIs Stable Video Diffusion und Kling AI von Kuaishou. Die meisten modernen Modelle kombinieren großangelegte Video-Diffusionsarchitekturen mit Sprachencodern wie CLIP oder T5 für reichhaltige semantische Verankerung. Wichtige Leistungsdimensionen umfassen Videodauer, Auflösung, Bewegungsrealismus, Prompt-Treue, Charakterkonsistenz und Kamerasteuerung (Schwenk, Zoom, Dolly). Text-to-Video transformiert Marketing, Unterhaltung, Bildung und E-Commerce, indem es KI-native Videoinhalte zu einem Bruchteil herkömmlicher Produktionskosten ermöglicht. Marken können Produktdemonstrationen, Erklärvideos und Social-Media-Inhalte programmatisch in großem Maßstab generieren. Context Studios integriert Text-to-Video-Generierung in Client-Content-Pipelines und nutzt Modelle wie Veo 3, Seedance 2.0 und Sora für Social Content, Produktvisualisierungen und automatisierte Videoproduktions-Workflows.
KI-Infrastruktur
Tokens per Second (TPS)
Tokens per Second (TPS) ist die primäre Durchsatz-Metrik für KI-Sprachmodell-Inferenz. Sie misst, wie viele Tokens pro Sekunde ein Modell generiert, nachdem der Generierungsprozess begonnen hat. TPS und Time-to-First-Token (TTFT) bestimmen gemeinsam die User Experience. Ein Token entspricht grob 0,75 Wörtern in Englisch oder 0,5–0,6 Wörtern in anderen Sprachen. Typische TPS-Werte: Groqs LPU erreicht 500–800 TPS für 7B-Modelle; Anthropics Claude-API liefert je nach Modell 30–100 TPS; Open-Source-Modelle auf einem H100 erreichen 50–200 TPS je nach Größe. TPS beeinflusst UX auf zwei Weisen: Für kurze Anfragen (bis ~500 Tokens) dominiert TTFT die gefühlte Responsivität; für lange Outputs (Dokumente, Code, Analysen) wird TPS entscheidend. Bei 30 TPS benötigt ein 3.000-Wörter-Dokument ~80 Sekunden; bei 200 TPS nur ~12 Sekunden. Für Voice-KI ist mindestens 100 TPS notwendig für Sprachsynthese ohne wahrnehmbare Lücken. Einflussfaktoren: Modellgröße (größer = langsamere TPS), Quantisierungsniveau (FP4 vs FP8 vs BF16), Batch-Größe (höheres Batching erhöht Gesamt-TPS, senkt individuelles TPS), Hardware und KV-Cache-Auslastung.
Verwandt:Time-to-First-Token (TTFT)KI-Inferenz Echtzeit-Inferenz
KI-Kerntechnologie
Vendor Lock-In (KI)
Vendor Lock-In in der KI bezeichnet die Abhängigkeit von den Modellen, Tools und dem Ökosystem eines einzelnen KI-Anbieters, was den Wechsel kostspielig macht. GitHubs Agent HQ begegnet dem durch Unterstützung mehrerer KI-Agenten, sodass Entwickler Einzelanbieter-Abhängigkeit vermeiden können.
KI-Kerntechnologie
YAML Frontmatter
Ein Metadatenblock am Anfang einer Datei im YAML-Format, häufig zur Konfiguration von KI-Agenten-Skills, Blogbeiträgen und Dokumentation verwendet.
KI-Kerntechnologie
YAML Frontmatter
Ein Metadatenblock am Anfang einer Datei im YAML-Format, haeufig zur Konfiguration von KI-Agent-Skills und Dokumentation verwendet.