KI Wissensdatenbank 2026

KI Glossar 2026

Präzise Definitionen für die Ära von Agentic AI und Spatial Intelligence.

KI-Sicherheit & Leitplanken

Behavioral Drift (KI-Verhaltensabweichung)

Behavioral Drift bezeichnet das schleichende Abweichen eines KI-Agenten von seinem ursprünglich definierten Verhaltensprofil im Laufe der Zeit. Während einzelne Interaktionen noch innerhalb der Spezifikationen liegen können, führt die kumulative Wirkung von Feedback-Schleifen, Selbstoptimierung oder veränderten Kontextbedingungen dazu, dass das Systemverhalten zunehmend von den ursprünglichen Zielparametern abweicht. Das Phänomen tritt besonders häufig bei selbstverbessernden KI-Systemen auf, die ihre eigenen Fähigkeiten durch wiederholte Ausführung optimieren. Ohne geeignete Schranken und kontinuierliches Monitoring kann Behavioral Drift zu unerwarteten Outputs, gefährlichen Entscheidungsmustern oder dem vollständigen Verlust der ursprünglichen Systemausrichtung führen. Für Unternehmen, die KI-Agenten in produktionskritischen Prozessen einsetzen, ist Behavioral Drift ein wesentlicher Risikofaktor. Gegenmaßnahmen umfassen regelmäßige Baseline-Vergleiche, Ausgabe-Anomalie-Erkennung sowie RLHF-Feedback-Loops, die Abweichungen frühzeitig korrigieren, bevor sie kritische Schäden verursachen.

Konzept entdecken
Agentic Infrastructure

Batch-Inferenz

Batch-Inferenz bezeichnet die gebündelte Verarbeitung mehrerer KI-Anfragen in einem einzelnen Durchlauf, statt jede Anfrage sofort einzeln zu beantworten. Inputs werden gesammelt, zu Batches zusammengefasst und gemeinsam durch das Modell verarbeitet – im Gegensatz zur Real-Time-Inferenz, bei der jede Anfrage sofort einzeln beantwortet wird. Die wirtschaftlichen Vorteile sind erheblich: KI-Anbieter wie Anthropic und OpenAI bieten Batch-APIs an, die 50–75% günstiger sind als synchrone Endpunkte. Der Grund ist bessere GPU-Auslastung – statt viele kleine Anfragen sequenziell zu verarbeiten, nutzen Batches verfügbare Rechenkapazität nahezu vollständig aus. NVIDIA Blackwell und Tensor-Kerne sind speziell auf hohen Batch-Durchsatz ausgelegt. Typische Batch-Inferenz Use Cases: Massenübersetzung von Dokumenten, automatisierte SEO-Analyse großer Content-Bibliotheken, tägliche Zusammenfassungen von News-Feeds, Produktkatalog-Klassifizierung, Sentiment-Analyse von Kundenfeedback und nächtliche Verarbeitung von Analysedaten. Gemeinsam ist diesen Szenarien: Ergebnisse werden nicht in Echtzeit benötigt – Verzögerungen von Minuten bis Stunden sind akzeptabel. Wichtige technische Parameter: Batch-Größe (Anzahl Anfragen pro Batch), maximale Latenz (Deadline für Ergebnisse), Fehlerbehandlung (was passiert bei einzelnen fehlschlagenden Items?) und adaptives Batching (dynamische Größenanpassung basierend auf Last und Token-Anzahl pro Anfrage). Moderne Batch-Systeme implementieren Continuous Batching für maximale GPU-Effizienz.

Konzept entdecken
KI-Sicherheit & Leitplanken

Benchmark-Kontamination

Benchmark-Kontamination bezeichnet das Problem, bei dem Evaluierungsdaten eines Benchmarks versehentlich oder absichtlich in den Trainingsdaten eines KI-Modells enthalten sind. Das Modell erscheint dadurch auf diesem Benchmark besser als es tatsächlich generalisiert — es hat Antworten 'auswendig gelernt' statt Fähigkeiten erworben. Das Problem ist systemischer Natur: Moderne Sprachmodelle trainieren auf riesigen Web-Datensätzen; populäre Benchmarks (MMLU, HumanEval, GSM8K, MATH) sind frei im Internet verfügbar, was versehentliche Aufnahme wahrscheinlich macht. Gleichzeitig schaffen wirtschaftliche Anreize Bedingungen für intentionale Kontamination. Symptome: Dramatisch bessere Benchmark-Scores als reale Task-Performance; große Diskrepanz zwischen Benchmark-Ergebnissen und Nutzererfahrungen; der 'MMLU-Shuffle'-Effekt, bei dem zufällige Antwort-Reihenfolgen Scores stark verändern — ein bekanntes Kontaminationssignal. Gegenmaßnahmen: Private Hold-out-Benchmarks vor Veröffentlichung; dynamische Benchmarks mit täglich neu generierten Fragen; Contamination-Detection über N-gram-Overlap-Analyse; Vertrauen auf unabhängige externe Evaluierungen statt Selbstberichte. Organisationen wie METR, HELM und ARC Evals entwickeln kontaminationsresistentere Methodologien.

Konzept entdecken