KI Wissensdatenbank 2026

KI Glossar 2026

Präzise Definitionen für die Ära von Agentic AI und Spatial Intelligence.

Embedding

Die numerische Repräsentation von Text, Bildern oder anderen Daten als hochdimensionaler Vektor. Ermöglicht semantischen Vergleich basierend auf Bedeutung statt exakter Wortübereinstimmung. Grundlage für RAG-Systeme, Empfehlungen und semantische Suche.

Konzept entdecken

Reasoning & Verlässlichkeit

Embedding Models

Embedding-Modelle sind KI-Modelle, die Daten wie Text oder Bilder in hochdimensionale Vektorrepräsentationen umwandeln, die die semantische Bedeutung und die Beziehungen zwischen Datenpunkten erfassen. Diese Embeddings werden für semantische Suche, Ähnlichkeitsanalysen und Clusterbildung verwendet.

Konzept entdecken

Inference & Engineering

Embeddings (Vektordarstellung)

Embeddings sind numerische Vektordarstellungen von Text, Bildern, Audio oder anderen Daten, die von KI-Modellen verwendet werden, um die semantische Bedeutung von Inhalten zu erfassen. Ein Embedding wandelt einen Text – etwa einen Satz oder ein Dokument – in einen Vektor aus Hunderten oder Tausenden von Dezimalzahlen um. Semantisch ähnliche Inhalte erhalten dabei ähnliche Vektoren; verwandte Begriffe liegen im Vektorraum nahe beieinander. Embedding-Modelle wie OpenAIs text-embedding-ada-002, Voyage AI oder Googles text-embedding-004 sind speziell auf diesen Zweck trainiert. Sie ermöglichen es, Texte maschinell zu vergleichen, ohne explizite Regeln oder Stichwortlisten zu benötigen – ein System kann so verstehen, dass 'PKW kaufen' und 'Auto erwerben' semantisch gleich bedeuten, obwohl sie keine gemeinsamen Wörter teilen. Im Unternehmenskontext werden Embeddings besonders für Retrieval-Augmented Generation (RAG) eingesetzt: Dokumente werden eingebettet und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird die Frage ebenfalls eingebettet und mit den Dokumentvektoren verglichen, um die relevantesten Quellen zu finden und dem Sprachmodell als Kontext bereitzustellen. Weitere Anwendungen: semantische Suche, Empfehlungssysteme, Duplikaterkennung sowie Klassifikation und Clustering von Inhalten.

Konzept entdecken

Inference & Engineering

Enterprise AI Deployment (Enterprise-KI-Einführung)

Enterprise AI Deployment beschreibt die kontrollierte Einführung von KI-Systemen in produktive Unternehmensprozesse. Dabei geht es nicht nur darum, ein Modell oder einen Chatbot live zu schalten. Entscheidend sind Zielbild, Datenzugriff, Modell- und Tool-Auswahl, Integrationen in bestehende Systeme, Rollenrechte, Monitoring, Kostenkontrolle und klare Verantwortlichkeiten. Ein gutes Deployment verbindet Strategie, Engineering und Governance: Use Cases werden priorisiert, Risiken bewertet, Pilotphasen begrenzt und erfolgreiche Workflows schrittweise skaliert. Für Unternehmen ist der Begriff wichtig, weil viele KI-Projekte in Demos gut aussehen, aber an Betrieb, Sicherheit, Akzeptanz oder fehlender Messbarkeit scheitern. Enterprise AI Deployment macht aus Experimenten belastbare Fähigkeiten: dokumentierte Architektur, nachvollziehbare Entscheidungen, Review-Prozesse, Fallbacks, Datenschutzprüfungen und laufende Optimierung. Dazu gehören Change Management, Schulungen, klare Supportwege und ein Betriebsmodell, das auch nach dem ersten Release funktioniert. Ebenso wichtig sind Verantwortliche für Fachbereich, IT und Datenschutz, damit Entscheidungen nicht im Pilotteam hängen bleiben. Besonders bei Agenten, RAG-Systemen oder Coding-Agenten müssen Unternehmen festlegen, welche Aufgaben automatisiert werden dürfen, wann Menschen prüfen und welche Qualitätsmetriken den produktiven Einsatz rechtfertigen.

Konzept entdecken

EU & Compliance

EU AI Act

Das EU AI-Gesetz ist der umfassende regulatorische Rahmen der Europäischen Union für künstliche Intelligenz. Es legt risikobasierte Anforderungen für KI-Systeme fest, mit strengeren Regeln für hochriskante Anwendungen im Gesundheitswesen, Beschäftigung und kritischer Infrastruktur.

Konzept entdecken

EU & Compliance

EU AI Act Compliance

EU AI Act Compliance ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.

Konzept entdecken

Agentic Infrastructure

Edge AI Deployment

Edge AI Deployment bezieht sich auf das Ausführen von KI-Modellen auf Edge-Geräten, die nahe am Ort der Datenerzeugung liegen, anstatt in einer zentralisierten Cloud-Infrastruktur. Dies reduziert die Latenz, den Bandbreitenverbrauch und ermöglicht Echtzeit-KI-Anwendungen in IoT, Robotik und mobilen Geräten.

Konzept entdecken

Agentic Infrastructure

Edge Functions

Serverlose Funktionen am Netzwerkrand, naeher am Nutzer, fuer geringere Latenz und schnellere Antwortzeiten.

Konzept entdecken

Reasoning & Verlässlichkeit

Effort Controls

Effort Controls sind Mechanismen, die es Entwicklern ermöglichen, die Intelligenz, Latenz und Kosten eines KI-Modells für verschiedene Anwendungsfälle anzupassen. Sie bieten eine feinkörnige Kontrolle über den Kompromiss zwischen Antwortqualität und Rechenressourcen.

Konzept entdecken

Agentic Infrastructure

Electronic Health Record (EHR)

Eine digitale Version der Patientenakte, die deren medizinische Vorgeschichte, Diagnosen, Medikamente und andere relevante Informationen enthält.

Konzept entdecken

KI-Sicherheit & Leitplanken

Eval-Integritaet

Eval-Integritaet (Evaluation Integrity) bezeichnet das Prinzip und die Praxis, sicherzustellen, dass Evaluierungen von KI-Modellen und -Systemen fair, unverzerrt, reproduzierbar und aussagekraeftig sind. Es ist eine Antwort auf die zunehmenden Probleme mit Benchmark-Kontaminierung, Gaming von Metriken und irreführenden Leistungsvergleichen. Kernelemente der Eval-Integritaet umfassen: Datenisolation (Testsets werden streng von Trainingsdaten getrennt), Reproduzierbarkeit (Evaluierungen koennen unabhaengig wiederholt werden), Aufgabenrelevanz (Benchmarks messen Faehigkeiten, die fuer reale Anwendungsfaelle relevant sind), und Transparenz (Evaluierungsmethoden, Datensaetze und Ergebnisse werden veroeffentlicht). Praktische Massnahmen zur Sicherstellung von Eval-Integritaet: Verwendung privater oder dynamisch generierter Testsets, blind Evaluierung (das Modell weiss nicht, ob es bewertet wird), adversariale Tests (bewusst herausfordernde Eingaben), A/B-Evaluierung im Live-System mit echten Nutzern, und regelmassige Rotation der Evaluierungs-Benchmarks. Eval-Integritaet ist besonders wichtig in Unternehmenskontexten, wo die Wahl eines KI-Modells erhebliche Investitionsentscheidungen nach sich zieht. Unternehmen sollten nicht blind auf publizierte Benchmark-Rankings vertrauen, sondern eigene task-spezifische Evaluierungen auf representativen Produktionsdaten durchfuehren.

Konzept entdecken

Agentic Infrastructure

Echtzeit-Inferenz

Echtzeit-Inferenz bezeichnet die sofortige Verarbeitung von KI-Anfragen mit minimaler Latenz, typischerweise im Bereich von Millisekunden bis wenige Sekunden. Im Gegensatz zur Batch-Inferenz, bei der Anfragen gesammelt und gebündelt verarbeitet werden, reagiert Echtzeit-Inferenz auf jede Eingabe unverzüglich — entscheidend für interaktive Anwendungen, bei denen Nutzer unmittelbares Feedback erwarten. Die wichtigste Metrik ist der Time-to-First-Token (TTFT): Zeit zwischen Anfrage und erstem Token der Antwort. Für Chatbots gilt TTFT unter 500ms als akzeptabel; für Coding-Assistenten werden sub-200ms angestrebt. Streaming-Ausgabe (Token für Token) verbessert die wahrgenommene Latenz erheblich, auch wenn die Gesamtantwortzeit gleich bleibt. Typische Echtzeit-Inferenz Use Cases: Konversations-Chatbots wie ChatGPT oder Claude.ai, KI-Coding-Assistenten wie GitHub Copilot oder Cursor, Echtzeit-Übersetzung, Voice-Assistenten (Spracherkennung + Generierung), interaktive Dokument-Analyse und autonome KI-Agenten, die schnell auf Umgebungsveränderungen reagieren müssen. Die technischen Anforderungen sind deutlich höher als bei Batch-Inferenz: niedrige Latenz erfordert geografisch nahe Server (Edge Inference), spezielle Low-Latency-Optimierungen oder kleinere, schnellere Modelle. Anbieter wie Groq (LPU-Chip) oder Cerebras erreichen über 500 TPS für Echtzeit-Anwendungen. Entscheidend ist der Trade-off zwischen Latenz, Durchsatz und Kosten pro Token.

Konzept entdecken

Reasoning & Verlässlichkeit

EHR

Elektronische Gesundheitsakte — digitale Patientenakte. KI-Agenten integrieren sich zunehmend mit EHR-Systemen für automatisierte Dokumentation.

Konzept entdecken

KI-Sicherheit & Leitplanken

Evidence Packs

Kuratierte Dokumentenbündel, die dem KI-Modell als verifizierte Faktenbasis für komplexe Aufgaben bereitgestellt werden, um Halluzinationen signifikant zu reduzieren.

Konzept entdecken