KI Wissensdatenbank 2026

KI Glossar 2026

Präzise Definitionen für die Ära von Agentic AI und Spatial Intelligence.

Inference & Engineering

Embeddings (Vektordarstellung)

Embeddings sind numerische Vektordarstellungen von Text, Bildern, Audio oder anderen Daten, die von KI-Modellen verwendet werden, um die semantische Bedeutung von Inhalten zu erfassen. Ein Embedding wandelt einen Text – etwa einen Satz oder ein Dokument – in einen Vektor aus Hunderten oder Tausenden von Dezimalzahlen um. Semantisch ähnliche Inhalte erhalten dabei ähnliche Vektoren; verwandte Begriffe liegen im Vektorraum nahe beieinander. Embedding-Modelle wie OpenAIs text-embedding-ada-002, Voyage AI oder Googles text-embedding-004 sind speziell auf diesen Zweck trainiert. Sie ermöglichen es, Texte maschinell zu vergleichen, ohne explizite Regeln oder Stichwortlisten zu benötigen – ein System kann so verstehen, dass 'PKW kaufen' und 'Auto erwerben' semantisch gleich bedeuten, obwohl sie keine gemeinsamen Wörter teilen. Im Unternehmenskontext werden Embeddings besonders für Retrieval-Augmented Generation (RAG) eingesetzt: Dokumente werden eingebettet und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird die Frage ebenfalls eingebettet und mit den Dokumentvektoren verglichen, um die relevantesten Quellen zu finden und dem Sprachmodell als Kontext bereitzustellen. Weitere Anwendungen: semantische Suche, Empfehlungssysteme, Duplikaterkennung sowie Klassifikation und Clustering von Inhalten.

Konzept entdecken
Inference & Engineering

Enterprise AI Deployment (Enterprise-KI-Einführung)

Enterprise AI Deployment beschreibt die kontrollierte Einführung von KI-Systemen in produktive Unternehmensprozesse. Dabei geht es nicht nur darum, ein Modell oder einen Chatbot live zu schalten. Entscheidend sind Zielbild, Datenzugriff, Modell- und Tool-Auswahl, Integrationen in bestehende Systeme, Rollenrechte, Monitoring, Kostenkontrolle und klare Verantwortlichkeiten. Ein gutes Deployment verbindet Strategie, Engineering und Governance: Use Cases werden priorisiert, Risiken bewertet, Pilotphasen begrenzt und erfolgreiche Workflows schrittweise skaliert. Für Unternehmen ist der Begriff wichtig, weil viele KI-Projekte in Demos gut aussehen, aber an Betrieb, Sicherheit, Akzeptanz oder fehlender Messbarkeit scheitern. Enterprise AI Deployment macht aus Experimenten belastbare Fähigkeiten: dokumentierte Architektur, nachvollziehbare Entscheidungen, Review-Prozesse, Fallbacks, Datenschutzprüfungen und laufende Optimierung. Dazu gehören Change Management, Schulungen, klare Supportwege und ein Betriebsmodell, das auch nach dem ersten Release funktioniert. Ebenso wichtig sind Verantwortliche für Fachbereich, IT und Datenschutz, damit Entscheidungen nicht im Pilotteam hängen bleiben. Besonders bei Agenten, RAG-Systemen oder Coding-Agenten müssen Unternehmen festlegen, welche Aufgaben automatisiert werden dürfen, wann Menschen prüfen und welche Qualitätsmetriken den produktiven Einsatz rechtfertigen.

Konzept entdecken
KI-Sicherheit & Leitplanken

Eval-Integritaet

Eval-Integritaet (Evaluation Integrity) bezeichnet das Prinzip und die Praxis, sicherzustellen, dass Evaluierungen von KI-Modellen und -Systemen fair, unverzerrt, reproduzierbar und aussagekraeftig sind. Es ist eine Antwort auf die zunehmenden Probleme mit Benchmark-Kontaminierung, Gaming von Metriken und irreführenden Leistungsvergleichen. Kernelemente der Eval-Integritaet umfassen: Datenisolation (Testsets werden streng von Trainingsdaten getrennt), Reproduzierbarkeit (Evaluierungen koennen unabhaengig wiederholt werden), Aufgabenrelevanz (Benchmarks messen Faehigkeiten, die fuer reale Anwendungsfaelle relevant sind), und Transparenz (Evaluierungsmethoden, Datensaetze und Ergebnisse werden veroeffentlicht). Praktische Massnahmen zur Sicherstellung von Eval-Integritaet: Verwendung privater oder dynamisch generierter Testsets, blind Evaluierung (das Modell weiss nicht, ob es bewertet wird), adversariale Tests (bewusst herausfordernde Eingaben), A/B-Evaluierung im Live-System mit echten Nutzern, und regelmassige Rotation der Evaluierungs-Benchmarks. Eval-Integritaet ist besonders wichtig in Unternehmenskontexten, wo die Wahl eines KI-Modells erhebliche Investitionsentscheidungen nach sich zieht. Unternehmen sollten nicht blind auf publizierte Benchmark-Rankings vertrauen, sondern eigene task-spezifische Evaluierungen auf representativen Produktionsdaten durchfuehren.

Konzept entdecken
Agentic Infrastructure

Echtzeit-Inferenz

Echtzeit-Inferenz bezeichnet die sofortige Verarbeitung von KI-Anfragen mit minimaler Latenz, typischerweise im Bereich von Millisekunden bis wenige Sekunden. Im Gegensatz zur Batch-Inferenz, bei der Anfragen gesammelt und gebündelt verarbeitet werden, reagiert Echtzeit-Inferenz auf jede Eingabe unverzüglich — entscheidend für interaktive Anwendungen, bei denen Nutzer unmittelbares Feedback erwarten. Die wichtigste Metrik ist der Time-to-First-Token (TTFT): Zeit zwischen Anfrage und erstem Token der Antwort. Für Chatbots gilt TTFT unter 500ms als akzeptabel; für Coding-Assistenten werden sub-200ms angestrebt. Streaming-Ausgabe (Token für Token) verbessert die wahrgenommene Latenz erheblich, auch wenn die Gesamtantwortzeit gleich bleibt. Typische Echtzeit-Inferenz Use Cases: Konversations-Chatbots wie ChatGPT oder Claude.ai, KI-Coding-Assistenten wie GitHub Copilot oder Cursor, Echtzeit-Übersetzung, Voice-Assistenten (Spracherkennung + Generierung), interaktive Dokument-Analyse und autonome KI-Agenten, die schnell auf Umgebungsveränderungen reagieren müssen. Die technischen Anforderungen sind deutlich höher als bei Batch-Inferenz: niedrige Latenz erfordert geografisch nahe Server (Edge Inference), spezielle Low-Latency-Optimierungen oder kleinere, schnellere Modelle. Anbieter wie Groq (LPU-Chip) oder Cerebras erreichen über 500 TPS für Echtzeit-Anwendungen. Entscheidend ist der Trade-off zwischen Latenz, Durchsatz und Kosten pro Token.

Konzept entdecken