Context Studios

Context Studios

KI Wissensdatenbank 2026

KI Glossar 2026

Präzise Definitionen für die Ära von Agentic AI und Spatial Intelligence.

Reasoning & Verlässlichkeit

1M Token Context Window

Ein 1-Million-Token-Kontextfenster ist die Fähigkeit von großen Sprachmodellen, Informationen aus einem Dokument oder Gespräch von bis zu 1 Million Tokens zu verarbeiten und zu behalten. Dies ermöglicht die Analyse ganzer Codebasen, Bücher oder längerer Gespräche, ohne den Kontext zu verlieren.

Konzept entdecken

Ökonomie & Skalierung

Agent Economics (KI-Agenten-Ökonomie)

Agent Economics beschreibt die Kostenstruktur, Effizienzlogik und wirtschaftlichen Abwägungen beim Betrieb von KI-Agenten in produktiven Systemen. Im Unterschied zu klassischen Softwarekosten entstehen bei Agenten variable Betriebskosten pro Aufgabe: jeder Agentenlauf verbraucht Tokens, belegt Kontextfenster und erzeugt Inferenzkosten – und das oft über mehrere Modellaufrufe, Werkzeugnutzungen und Denkschritte hinweg. Ein zentrales Konzept der Agent Economics ist die Kosten-pro-Aufgabe-Metrik (Cost per Task), die den Gesamtverbrauch eines Agenten über einen vollständigen Arbeitszyklus erfasst. Diese Kennzahl ersetzt in agentenbasierten Systemen die klassische Metrik Kosten pro API-Aufruf, da ein einziger Agentenlauf Dutzende von Modellaufrufen umfassen kann. Hinzu kommen Designentscheidungen wie Model Routing (günstigere Modelle für einfache Teilaufgaben) und Kontextbudgetierung (Begrenzung des Kontextfensters je Teilschritt), die erheblichen Einfluss auf die Gesamtkosten haben. Mit der zunehmenden Verbreitung von KI-Agenten in Entwicklungsteams – etwa für Code-Review, Dokumentation oder autonomes Testing – wird Agent Economics zu einer operativen Kernkompetenz. Unternehmen, die Agenten ohne Kostenkontrolle einsetzen, riskieren unkontrolliertes Token-Wachstum; wer hingegen systematisch Routing-Strategien, Kontextlimits und Aufgabenabschnitte optimiert, erzielt signifikant niedrigere Kosten bei vergleichbarer Ausgabequalität. Agent Economics ist damit nicht nur eine Finanzfrage, sondern beeinflusst direkt, welche Agenten-Workflows in der Praxis skalierbar und nachhaltig eingesetzt werden können.

Konzept entdecken

EU & Compliance

Agent Governance

Frameworks und Tools zur Überwachung, Steuerung und Compliance-Sicherung von autonomen KI-Agenten im Unternehmenseinsatz.

Konzept entdecken

Agentic Business

Agent Handoff (KI-Agenten-Übergabe)

Agent Handoff beschreibt den strukturierten Übergabeprozess zwischen zwei oder mehreren KI-Agenten in einem Multi-Agenten-System. Dabei übergibt ein ausführender Agent eine aktive Aufgabe zusammen mit dem gesamten Kontext, den Zwischenergebnissen und der Zielbeschreibung an einen anderen Agenten – entweder an einen spezialisierten Sub-Agenten, einen Peer-Agenten oder einen übergeordneten Orchestrator. Ein funktionsfähiger Agent Handoff basiert auf drei Kernelementen: erstens der vollständigen Kontextübertragung, die alle für die Aufgabenfortführung notwendigen Informationen enthält; zweitens einem definierten Übergabeprotokoll, das Bedingungen, Auslöser und Verantwortlichkeiten festlegt; drittens einer robusten Fehlerbehandlung, die sicherstellt, dass ein fehlgeschlagener Handoff erkannt, protokolliert und neu initiiert wird. In der Praxis tritt Agent Handoff in agentengesteuerten Pipelines auf, in denen Planung, Implementierung, Review und Deployment auf spezialisierte Agenten verteilt sind. Ein Planungsagent erstellt die Aufgabenstruktur, übergibt sie an einen Coding-Agenten, der das Ergebnis wiederum an einen Validierungsagenten weiterleitet. Jeder Handoff ist ein kritischer Übergabepunkt, an dem Informationsverlust oder Fehlkommunikation die gesamte Pipeline gefährden können. Für skalierte Agentenarchitekturen ist ein gut definierter Handoff-Mechanismus entscheidend: Er ermöglicht parallele Verarbeitung, reduzierten Kontext-Overhead pro Agent und eine klare Verantwortlichkeitsverteilung. Moderne Frameworks wie LangGraph, AutoGen oder das MCP-Protokoll bieten standardisierte Handoff-Muster als Teil ihrer Orchestrierungsschicht.

Konzept entdecken

Agentic Business

Agent HQ

GitHubs Multi-Agent-Orchestrierungsplattform, die Entwicklern das Wechseln zwischen Claude, Codex und Copilot-Agenten in einer einheitlichen Oberfläche ermöglicht. Verwandelt GitHub von einem Tool-Anbieter in einen KI-Agent-Orchestrator.

Konzept entdecken

Agentic Business

Agent Loop

Der grundlegende iterative Prozess von KI-Agenten: Kontext sammeln, handeln, Ergebnisse pruefen und wiederholen bis zum Ziel.

Konzept entdecken

Agentic Infrastructure

Agent Observability (KI-Agenten-Beobachtbarkeit)

Agent Observability bezeichnet die Fähigkeit, das Verhalten, den Zustand und die Entscheidungsprozesse von KI-Agenten in Echtzeit zu überwachen, zu messen und zu verstehen. Im Gegensatz zu klassischer Software-Observability – die typischerweise Logs, Metriken und Traces umfasst – müssen bei KI-Agenten zusätzlich semantische Ebenen erfasst werden: Welche Aufgaben führt der Agent gerade aus? Welche Tools werden aufgerufen? Wie viele Token werden pro Schritt verbraucht? Wo entstehen Engpässe oder unerwartete Abweichungen im Ablauf? Zu den typischen Observability-Daten für KI-Agenten gehören: Task-Status und Fortschrittsmetriken, Tool-Call-Protokolle mit Ein- und Ausgaben, Token-Verbrauch pro Aktion, Latenz einzelner Reasoning-Schritte sowie Fehler- und Retry-Muster. Moderne Plattformen wie Langfuse, Arize Phoenix oder das Hermes-Dashboard bieten Visualisierungen, die diese Signale aggregieren und für Engineering-Teams direkt auswertbar machen. Agent Observability ist die operative Grundlage für verlässlichen KI-Agenten-Betrieb: Ohne sie ist es kaum möglich, Qualitätsdrift frühzeitig zu erkennen, Kapazitätsplanungen datenbasiert vorzunehmen oder Sicherheitsaudits zu belegen. Für Unternehmen, die KI-Agenten in produktiven Workflows einsetzen, ist Observability kein optionales Feature, sondern eine betriebliche Notwendigkeit und ein wesentlicher Baustein einer nachhaltigen KI-Strategie.

Konzept entdecken

Agentic Business

Agent Pull Request (Autonome Code-Einreichung)

Ein Agent Pull Request bezeichnet den automatisierten Prozess, bei dem ein KI-Coding-Agent — wie Claude Code, OpenAI Codex oder ähnliche Systeme — selbstständig Codeänderungen umsetzt und diese als Pull Request (PR) in einem Versionskontrollsystem wie GitHub einreicht, ohne dass ein menschlicher Entwickler den Einreichungsschritt ausführen muss. Im Gegensatz zu herkömmlichen KI-Coding-Assistenten, die lediglich Vorschläge liefern, übernimmt ein agentisches System beim Agent Pull Request die vollständige Ausführungskette: Analyse der Aufgabe, Implementierung der Änderungen, Ausführung von Tests, Behebung von Fehlern und abschließende Einreichung des Code-Reviews. Dieser Ablauf kann vollautomatisch oder im Rahmen eines Human-in-the-Loop-Modells erfolgen, bei dem ein Entwickler den fertigen PR vor dem Merge prüft. Der Begriff wurde durch Protokolle wie den Agent PR Protocol geprägt und beschreibt einen der zentralen Anwendungsfälle agentengetriebener Software-Entwicklung. Typische Einsatzszenarien umfassen automatisiertes Bug-Fixing, die Implementierung kleiner Feature-Requests, Code-Refactoring nach festgelegten Standards sowie die Generierung von Tests für bestehenden Code. Die Qualitätssicherung eines Agent Pull Request erfolgt üblicherweise durch Diff-First-Review-Methoden, automatisierte CI/CD-Pipelines und ergänzende KI-Code-Sicherheitsprüfungen. In größeren Organisationen werden Agent Pull Requests in spezifische Review-Loops eingebettet, um Konsistenz und Rückverfolgbarkeit sicherzustellen. Das Konzept des Agent Pull Request ist ein Kernbestandteil moderner agentenbasierter Entwicklungsworkflows und markiert den Übergang von KI als passivem Assistenten hin zu KI als aktivem Contributor im Software-Entwicklungsprozess.

Konzept entdecken

Agentic Infrastructure

Agent Runtime (KI-Agenten-Laufzeitumgebung)

Eine Agent Runtime ist die technische Laufzeitumgebung, in der KI-Agenten Aufgaben planen, Tools aufrufen, Daten lesen, Zwischenergebnisse speichern und mit anderen Systemen interagieren. Sie ist mehr als ein Modell-Wrapper: Zur Runtime gehören Identität und Berechtigungen, Tool-Registrierung, Speicher- und Kontextverwaltung, Ausführungsregeln, Fehlerbehandlung, Logging, Observability und oft auch Handoff-Mechanismen zwischen Agenten. In einfachen Prototypen steckt diese Logik häufig in Skripten oder Prompt-Ketten. In produktiven Unternehmenssystemen wird sie zur stabilen Betriebsschicht, die entscheidet, welche Aktion ein Agent ausführen darf, wie lange ein Task läuft, welche Kosten entstehen und wie Ergebnisse überprüft werden. Dazu kommen Schutzmechanismen wie Rate Limits, Freigaben, Sandboxes und Wiederanlaufregeln, damit ein Agent nicht unbemerkt falsche Daten nutzt oder gefährliche Aktionen wiederholt. Dadurch lassen sich Agenten reproduzierbarer, sicherer und besser auditierbar betreiben. Der Begriff ist wichtig, weil viele Agentenprojekte nicht am Modell scheitern, sondern an der fehlenden Laufzeitarchitektur: Ohne Runtime gibt es keine sauberen Grenzen für Tools, keine belastbaren Logs und keine klare Verantwortung bei Fehlern.

Konzept entdecken

Agentic Infrastructure

Agent Runtime Architecture

Die Agent Runtime Architecture beschreibt die technische Ausführungsumgebung, in der KI-Agenten ihre Aufgaben verarbeiten, Werkzeuge aufrufen und Zustand verwalten. Sie umfasst die Laufzeitschicht zwischen dem Sprachmodell und den externen Systemen — also alles, was bestimmt, wie ein Agent Schritte plant, Fehler behandelt, parallele Aufgaben koordiniert und seinen Kontext über mehrere Sitzungen hinweg erhält. Zu den zentralen Komponenten gehören der Orchestrator (der den Ablauf steuert), die Tool-Registry (welche Werkzeuge verfügbar sind), der Session-State (kurzfristiges Gedächtnis) sowie persistente Workspaces (für langfristige Aufgaben). Moderne Runtimes wie OpenAI Agents SDK v0.14, LangGraph oder Anthropics eigene Agenten-Infrastruktur unterscheiden sich vor allem darin, wie sie mit Zustand, Parallelisierung und Fehlertoleranz umgehen. Eine robuste Agent Runtime ist entscheidend, wenn Agenten nicht nur einzelne Anfragen beantworten, sondern mehrstündige Workflows mit vielen Zwischenschritten, Toolaufrufen und möglichen Unterbrechungen zuverlässig durchführen sollen.

Konzept entdecken

Agentic Business

Agent Teams

Agententeams ist eine Funktion, die die parallele Koordination mehrerer KI-Agenten ermöglicht, die gemeinsam an komplexen Aufgaben arbeiten. Anstatt dass ein einzelner Agent sequenziell arbeitet, arbeiten mehrere spezialisierte Agenten zusammen, wobei jeder verschiedene Aspekte eines Problems gleichzeitig bearbeitet.

Konzept entdecken

Agentic Infrastructure

Agent-Accessible APIs (agentenfähige APIs)

Agent-Accessible APIs sind Programmierschnittstellen, die nicht nur für menschliche Entwickler, sondern explizit für KI-Agenten entworfen werden. Der Kern ist Maschinenlesbarkeit: klare OpenAPI- oder JSON-Schema-Definitionen, eindeutige Parameter, stabile Feldnamen und konsistente Fehlermeldungen. Für Agenten ist außerdem wichtig, dass Operationen deterministisch und idempotent sind, damit sie bei Retries keine doppelten Buchungen, Bestellungen oder Änderungen auslösen. Gute agentenfähige APIs kombinieren diese Designprinzipien mit feingranularen Berechtigungen, nachvollziehbaren Audit-Logs, Rate Limits und klaren Guardrails. In modernen Agent-Stacks werden solche APIs oft als Tools exponiert – etwa über das Model Context Protocol (MCP) – sodass Modelle Funktionen finden, aufrufen und Ergebnisse strukturiert zurückgeben können. Ohne diese API-Qualität bleiben Agenten in manuellen Workarounds hängen: sie scrapen Oberflächen, scheitern an unsteten Antworten oder produzieren unsichere Nebenwirkungen. Agent-Accessible APIs sind deshalb ein Infrastrukturthema: Sie machen aus KI-Demos belastbare, automatisierbare Geschäftsprozesse.

Konzept entdecken

Agentic Business

Agent-to-Agent Protocol (A2A)

Agent-to-Agent Protocol (A2A) ist ein agentic AI-Konzept in modernen KI-Systemen, das autonome Agenten-Fähigkeiten ermöglicht. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Systeme eigenständig arbeiten und gleichzeitig menschliche Aufsicht gewährleisten müssen.

Konzept entdecken

Agentic Business

Agentic AI

KI-Systeme, die autonom denken, planen und mehrstufige Aufgaben ausführen, um spezifische Ziele zu erreichen, anstatt nur Text zu generieren.

Konzept entdecken

Vertrauen & Souveränität

Agentic AI Security

Agentic AI Security bezieht sich auf die Verwendung von KI-Agenten, um proaktiv Sicherheitsrisiken innerhalb von KI-Systemen und breiteren IT-Umgebungen zu identifizieren, zu bewerten und zu mindern. Es nutzt die autonomen Entscheidungsfähigkeiten von KI, um die Sicherheitslage und Reaktionszeiten zu verbessern.

Konzept entdecken

Agentic Business

Agentic Commerce Protocol

Von OpenAI und Stripe im Oktober 2025 veröffentlichter offener Standard, der es KI-Agenten ermöglicht, sichere Kauftransaktionen im Namen von Nutzern durchzuführen.

Konzept entdecken

Ökonomie & Skalierung

Agentic Compute (agentengetriebene Rechenlast)

Agentic Compute bezeichnet die gesamte Rechen- und Ausführungslast, die entsteht, wenn KI-Agenten nicht nur eine einzelne Antwort erzeugen, sondern eigenständig mehrstufige Aufgaben ausführen. Dazu gehören Modellaufrufe, Tool Calling, Browser- und API-Zugriffe, Codeausführung, Speicherzugriffe, Retries und lange Laufzeiten. Der Begriff ist wichtig, weil sich Kosten und Betriebsrisiken bei Agenten anders verhalten als bei klassischem Chat-LLM-Verkehr. Bei einem normalen Chat skaliert der Aufwand grob mit Prompt- und Output-Token. Bei Agentic Compute skaliert er zusätzlich mit Schrittzahl, Parallelität, Tool-Nutzung, Schleifen sowie Beobachtungs- und Sicherheitslogik. Ein Coding-Agent, der Dateien liest, Tests startet, Logs prüft und mehrere Korrekturschleifen durchläuft, verbraucht daher deutlich mehr Ressourcen als eine einzelne Modellantwort. Für Architektur und Pricing bedeutet das: Unternehmen müssen nicht nur Tokenpreise betrachten, sondern Budgets pro Workflow, maximale Laufzeit, Concurrency-Limits, Tracing, Abbruchregeln und menschliche Freigaben definieren. Agentic Compute ist damit weniger ein einzelnes Modellmerkmal als ein Betriebsmodell für autonome KI-Systeme. Besonders in produktiven Unternehmensumgebungen wird der Begriff relevant, weil Autonomie ohne Kostenkontrolle schnell zu Budgetspitzen, unnötigen Schleifen oder schwer erklärbaren Betriebszuständen führen kann.

Konzept entdecken

Inference & Engineering

Agentic Engineering (agentisches Engineering)

Agentic Engineering ist ein strukturierter Entwicklungsansatz, bei dem KI-Agenten nicht nur Code vorschlagen, sondern als kontrollierte Arbeitskräfte in den Softwareprozess eingebunden werden. Im Unterschied zu Vibe Coding basiert Agentic Engineering auf klaren Zielen, begrenztem Kontext, kleinen Pull Requests, Tests, Review-Schleifen und nachvollziehbaren Entscheidungen. Der Mensch bleibt verantwortlich für Architektur, Priorisierung, Sicherheitsregeln und Abnahme; der Agent übernimmt abgegrenzte Aufgaben wie Implementierung, Analyse, Refactoring oder Testergänzung. Entscheidend ist nicht, dass mehr Code schneller entsteht, sondern dass KI-generierte Arbeit prüfbar, reproduzierbar und produktionsreif wird. Gute agentische Engineering-Prozesse definieren Kontextbudgets, Tool-Berechtigungen, Akzeptanzkriterien, Rollback-Optionen und Messpunkte für Qualität, Kosten und Risiko. In der Praxis verbindet das Prompt-Design, Repository-Regeln, CI-Checks, Sicherheitsgrenzen und Dokumentation zu einem wiederholbaren Ablauf. Teams behandeln Agenten damit wie neue Mitglieder der Delivery-Pipeline: nützlich, schnell und skalierbar, aber nur innerhalb klarer Leitplanken. Dadurch wird KI-gestützte Entwicklung vom Experiment zu einem belastbaren Betriebsmodell für Teams, die regelmäßig mit Coding Agents in produktiven Codebasen arbeiten.

Konzept entdecken

Reasoning & Verlässlichkeit

Agentic Reasoning

Extended Thinking für autonome Agenten – die Fähigkeit, vor Aktionen explizit zu "denken". Claude Opus 4.5, GPT-5.2 und Gemini 3 Pro nutzen zusätzliche Compute-Zeit für komplexe Schlussfolgerungen. Unterschied zu Chain-of-Thought: Agentic Reasoning plant mehrstufige Aktionssequenzen, nicht nur Antworten.

Konzept entdecken

Agentic Business

Agentic Systems (Agentenbasierte Systeme)

Agentic Systems sind KI-Systeme, die eigenständig Entscheidungen treffen und Aktionen durchführen, um komplexe Aufgaben zu lösen. Im Gegensatz zu klassischen KI-Systemen, die nur auf Eingaben reagieren, nutzen agentenbasierte Systeme ein Schleifenmodell: Sie wahrnehmen die Umgebung, formulieren Ziele, planen Schritte und führen Aktionen aus – alles ohne kontinuierliche menschliche Interventionen. Ein Beispiel: Ein Agentic System könnte automatisch Kundenanfragen analysieren, die relevantesten Lösungen recherchieren, interne Systeme abfragen und eine Antwort generieren. Dies wird ermöglicht durch Model Context Protocol (MCP), das Tools und Datenquellen nahtlos integriert.

Konzept entdecken

Agentic Business

Agentic Workflow

Ein iterativer Prozess, bei dem KI-Agenten Aufgaben zerlegen, ausführen und sich durch Reflexionsschleifen selbst korrigieren, um Ergebnisse höchster Qualität zu sichern.

Konzept entdecken

Inference & Engineering

AGENTS.md

Eine Markdown-Datei in einem Code-Repository, die strukturierte Anweisungen für KI-Coding-Agenten bereitstellt und deren Aufgabenerfüllung um bis zu 29% verbessert.

Konzept entdecken

Agentic Infrastructure

AI Agent Capacity Planning (KI-Agenten-Kapazitätsplanung)

AI Agent Capacity Planning beschreibt die systematische Planung von Rechenleistung, API-Quoten, Parallelität, Warteschlangen und Fallbacks für produktive KI-Agenten. Anders als klassische Server-Kapazitätsplanung berücksichtigt sie, dass Agenten nicht nur eine einzelne Anfrage beantworten, sondern Aufgaben in Schritte zerlegen, Tools aufrufen, Code ausführen, Dateien lesen und mehrfach mit Modellen kommunizieren. Dadurch entstehen Lastspitzen bei Tokens, Kontextfenstern, Rate Limits, Speicher, CI-Läufen und menschlichen Freigaben. Gute Kapazitätsplanung definiert deshalb erwartete Aufgabenvolumina, maximale Laufzeiten, Budgetgrenzen, Prioritätsklassen, Degradationspfade und Eskalationsregeln. Sie beantwortet Fragen wie: Welche Agenten dürfen parallel laufen? Wann wird auf ein kleineres Modell geroutet? Welche Aufgaben warten, welche brechen ab, und welche bekommen garantierte Kapazität? Zusätzlich müssen Monitoring, Abrechnung und Sicherheitsregeln zusammenpassen, damit ein Agent nicht unbemerkt teure Schleifen produziert oder kritische Ressourcen blockiert. Für Unternehmen ist das ein Betriebsmodell für verlässliche Agenten. Es verbindet Infrastruktur, Kostenkontrolle, Governance und Nutzererlebnis, damit KI-Agenten auch bei Anbieterlimits, Compute-Engpässen oder plötzlicher Nachfrage planbar stabil bleiben. Besonders wichtig ist diese Disziplin bei Multi-Agenten-Systemen und geschäftskritischen Automatisierungen.

Konzept entdecken

Agentic Business

AI Agent Control Plane (KI-Agenten-Kontrollebene)

Eine AI Agent Control Plane ist die Steuerungsschicht, über die KI-Agenten geplant, autorisiert, überwacht und begrenzt werden. Während das Modell die nächste Aktion vorschlägt, entscheidet die Control Plane, welche Werkzeuge, Datenquellen, Repositories, APIs oder Umgebungen ein Agent nutzen darf, unter welchen Bedingungen ein Mensch freigeben muss und wie Aktionen protokolliert werden. Sie bündelt Berechtigungen, Richtlinien, Secrets, Laufzeitumgebungen, Rate Limits, Kostenregeln, Evaluationssignale und Audit-Logs in einer Architektur, die über einzelne Prompts hinausgeht. In modernen agentischen Systemen ist diese Ebene wichtig, weil Agenten nicht nur Text erzeugen, sondern Tickets bearbeiten, Code ändern, Daten abrufen oder Geschäftsprozesse auslösen können. Eine gute Control Plane trennt Fähigkeiten von Freigaben: Ein Agent kann technisch ein Tool kennen, darf es aber nur im definierten Scope ausführen. Dadurch werden Experimente, Rollouts und produktive Automatisierung kontrollierbar, wiederholbar und compliance-fähig. Für Unternehmen entsteht damit ein verbindlicher Betriebsrahmen, der Prototypen, interne Assistenten und autonome Workflows unter denselben Sicherheits- und Qualitätsregeln zusammenführt.

Konzept entdecken

Agentic Business

AI Agent Governance (KI-Agenten-Governance)

AI Agent Governance beschreibt die Regeln, Kontrollen und Verantwortlichkeiten, mit denen Unternehmen KI-Agenten sicher, nachvollziehbar und geschäftstauglich betreiben. Anders als klassische KI-Governance betrachtet sie nicht nur ein Modell oder einen Chatbot, sondern autonome oder teilautonome Agenten, die Werkzeuge nutzen, Code ändern, Daten abrufen, Entscheidungen vorbereiten oder Prozesse ausführen. Dazu gehören Rollen- und Rechtekonzepte, Freigabegrenzen, Audit-Logs, Human-in-the-Loop-Prüfungen, Testumgebungen, Monitoring, Kostenlimits und klare Eskalationswege. Gute Governance definiert außerdem, welche Agenten in welcher Umgebung arbeiten dürfen, welche Daten sie sehen, welche Aktionen sie nie ausführen dürfen und wie Fehler rückgängig gemacht werden. In der Praxis ist AI Agent Governance die Brücke zwischen schneller Agenten-Entwicklung und belastbarem Betrieb. Sie legt fest, wie neue Agenten vor dem Rollout getestet werden, welche Qualitätsmetriken gelten, wer Änderungen freigibt und wie Vorfälle dokumentiert werden. Besonders wichtig ist die Trennung zwischen Entwicklungs-, Test- und Produktivumgebungen, damit ein Agent nicht versehentlich Kundendaten verändert oder produktive Systeme belastet. Sie macht aus experimentellen Assistenten kontrollierte digitale Mitarbeiter, deren Verhalten messbar, überprüfbar und an Unternehmensziele gebunden ist.

Konzept entdecken

Agentic Infrastructure

AI Agent Operations (KI-Agenten-Betrieb)

AI Agent Operations bezeichnet die Betriebsdisziplin, mit der KI-Agenten nach dem Prototyp zuverlässig, sicher und wirtschaftlich in echten Arbeitsabläufen laufen. Dazu gehören Session- und Aufgabenverwaltung, Tool-Berechtigungen, API-Schlüssel, Rate Limits, Warteschlangen, Protokolle, Monitoring, Fallback-Modelle und klare Eskalationswege für Menschen. Anders als klassisches MLOps betrachtet AI Agent Operations nicht nur ein Modell oder eine Pipeline, sondern ein handelndes System, das Code ausführt, Dateien verändert, Datenbanken abfragt oder externe Dienste nutzt. Deshalb müssen Teams jederzeit sehen können, welcher Agent welche Aufgabe verfolgt, welche Werkzeuge er nutzt, welche Kosten entstehen und wann ein Mensch entscheiden muss. Gute Agent Operations verbinden Observability, Governance und Infrastruktur: Logs erklären Entscheidungen, Kontrollflächen begrenzen Risiken, Kapazitätsplanung verhindert Ausfälle und Runbooks machen Vorfälle reproduzierbar. Für Unternehmen ist der Begriff wichtig, weil produktive Agenten sonst schnell zu schwer prüfbaren Einzellösungen werden. Mit einem Operations-Ansatz werden sie zu verwaltbaren digitalen Mitarbeitern, die messbar, kontrollierbar und schrittweise skalierbar sind. Besonders wichtig ist dabei eine gemeinsame Betriebssicht für Fachbereiche, IT und Compliance.

Konzept entdecken

Agentic Business

AI Agent Permissions (KI-Agenten-Berechtigungen)

AI Agent Permissions beschreiben die expliziten Rechte, die ein KI-Agent in Software, Datenquellen und Geschäftsprozessen erhält. Anders als ein Chatbot, der nur antwortet, kann ein agentisches System Werkzeuge aufrufen, Dateien lesen, Tickets ändern, Code ausführen, Pull Requests öffnen oder externe APIs nutzen. Permissions legen fest, welche dieser Aktionen erlaubt sind, unter welchen Bedingungen sie eine menschliche Freigabe brauchen und welche Grenzen niemals überschritten werden dürfen. Gute Berechtigungsmodelle arbeiten mit Least Privilege, rollenbasierten Scopes, temporären Tokens, Umgebungsgrenzen, Secret-Isolation und vollständigen Audit Logs. Ein Coding Agent darf zum Beispiel Repository-Dateien lesen, Tests ausführen und einen Pull Request vorschlagen, aber keine Produktionsdeployments starten oder Kundendaten exportieren. Für Unternehmen sind AI Agent Permissions damit die operative Sicherheits- und Governance-Schicht zwischen leistungsfähiger Automatisierung und kontrolliertem Risiko. Sie entscheiden, ob Agenten nur assistieren oder zuverlässig in reale Workflows integriert werden können. Besonders wichtig ist die Trennung von Lese-, Schreib- und Ausführungsrechten: Ein Agent kann Informationen sammeln, ohne automatisch Änderungen auszulösen. Erst wenn Risiko, Kontext und Verantwortlichkeit klar sind, wird die nächste Berechtigungsstufe aktiviert.

Konzept entdecken

Vertrauen & Souveränität

AI Agent Security (KI-Agenten-Sicherheit)

AI Agent Security beschreibt die Sicherheitsarchitektur für KI-Agenten, die nicht nur Text erzeugen, sondern Tools aufrufen, Dateien ändern, Code ausführen, APIs nutzen oder externe Systeme steuern. Der Begriff umfasst technische und organisatorische Schutzmaßnahmen: Sandboxes für riskante Ausführung, klare Berechtigungen, Approval-Flows, Netzwerkregeln, Secret- und Credential-Isolation, Logging, Telemetrie und Notfallabschaltung. Anders als klassische Applikationssicherheit muss AI Agent Security mit einem nicht deterministischen Akteur umgehen: Ein Agent kann aus Prompts, Tool-Ergebnissen und Kontext neue Handlungsschritte ableiten. Deshalb reicht es nicht, nur das Modell abzusichern. Entscheidend ist die gesamte Laufzeitumgebung vom System Prompt über Tool Scopes bis zum Audit Trail. In Unternehmen wird AI Agent Security besonders wichtig, sobald Coding Agents Pull Requests erstellen, Daten analysieren, Tickets bearbeiten oder Produktionssysteme vorbereiten. Gute Agentensicherheit trennt Experimente von produktiven Rechten, reduziert den Blast Radius und macht jede kritische Aktion nachvollziehbar. Sie ist damit die Grundlage, um autonome oder teilautonome KI-Systeme kontrolliert in echte Geschäftsprozesse einzubauen. Besonders relevant sind klare Verantwortlichkeiten zwischen Mensch, Agent und Infrastruktur.

Konzept entdecken

Agentic Business

AI Agent Workflow

Eine strukturierte Abfolge von Aufgaben eines KI-Agenten für ein Geschäftsergebnis, mit Reasoning, Entscheidungsfindung und adaptiven Reaktionen.

Konzept entdecken

Reasoning & Verlässlichkeit

AI Agents in Production

AI Agents in Production bezieht sich auf die Bereitstellung und Operationalisierung von KI-Agenten in realen Umgebungen zur Automatisierung von Aufgaben, Unterstützung von Benutzern und Interaktion mit anderen Systemen. Dies umfasst die Gewährleistung der Zuverlässigkeit, Skalierbarkeit und Sicherheit von KI-Agenten in Live-Umgebungen.

Konzept entdecken

AI Autonomy in Enterprises

AI Autonomy in Enterprises beschreibt das Ausmaß, in dem KI-Systeme unabhängig Aufgaben ausführen, Entscheidungen treffen und Prozesse innerhalb einer Organisation ohne menschliches Eingreifen verwalten können. Dazu gehören selbstoptimierende Algorithmen, autonome Workflows und KI-gesteuerte Ressourcenallokation.

Konzept entdecken

Vertrauen & Souveränität

AI Code Security Review (KI-Code-Sicherheitsprüfung)

AI Code Security Review bezeichnet die systematische Sicherheitsprüfung von Code, der mit KI-Coding-Tools, Agenten oder automatisierten Entwicklungsworkflows entstanden ist. Der Review prüft nicht nur klassische Schwachstellen wie Injection, fehlerhafte Authentifizierung oder unsichere Abhängigkeiten, sondern auch KI-spezifische Risiken: Halluzinierte APIs, fehlende Fehlerpfade, unvollständige Tests, überbreite Berechtigungen, Prompt-Injection-Angriffsflächen und unsaubere Trennung von Secrets, Netzwerkzugriff und Build-Pipeline. Gute Reviews kombinieren statische Analyse, Dependency-Scanning, Laufzeittests, menschliche Architekturprüfung und oft einen zweiten Agenten, der Fixes unabhängig revalidiert. Entscheidend ist, dass der Prozess wiederholbar ist: klare Merge Gates, nachvollziehbare Findings, reproduzierbare Testbefehle und dokumentierte Entscheidungen statt einmaliger Bauchgefühl-Prüfung. Für Teams wird AI Code Security Review damit zur Brücke zwischen schneller KI-Entwicklung und belastbarer Software-Lieferung. Er macht sichtbar, welche Annahmen ein Modell getroffen hat, welche Komponenten nachgetestet wurden und wo menschliche Freigabe nötig bleibt. Er gehört früh in den Entwicklungsprozess, nicht erst kurz vor dem Release, weil KI-generierter Code sonst technische Schulden und Sicherheitsannahmen sehr schnell skaliert.

Konzept entdecken

KI-Sicherheit & Leitplanken

AI Coding Agent Guardrails (Leitplanken für KI-Coding-Agenten)

AI Coding Agent Guardrails sind technische und organisatorische Leitplanken, die festlegen, was ein KI-Coding-Agent in einer Entwicklungsumgebung tun darf, wann er stoppen muss und welche Ergebnisse vor einer Übernahme geprüft werden. Dazu gehören Repository-Berechtigungen, Branch- und Dateigrenzen, Secret-Scanner, Testpflichten, Review-Regeln, Audit-Logs, Kostenlimits, Tool-Allowlisten und Rollback-Pfade. Der Begriff ist wichtig, weil moderne Coding-Agenten nicht mehr nur Code vorschlagen, sondern Dateien ändern, Tests ausführen, Abhängigkeiten installieren, Pull Requests erstellen oder Workflows anstoßen können. Gute Guardrails bremsen Agenten nicht pauschal aus. Sie machen Autonomie kontrollierbar: einfache Änderungen dürfen automatisiert laufen, riskante Bereiche wie Authentifizierung, Zahlungslogik, Produktionsdaten oder Infrastruktur benötigen zusätzliche Freigaben. In reifen Setups werden Guardrails als Policy-Schicht gebaut, die Kontext, Risiko und Änderungsumfang bewertet. So entsteht ein belastbarer Arbeitsmodus zwischen schneller Agentenunterstützung und klassischer menschlicher Code-Verantwortung.

Konzept entdecken

Agentic Business

AI Coding Agents (KI-Codieragenten)

AI Coding Agents sind autonome oder semi-autonome KI-Systeme, die Softwareentwicklungsaufgaben eigenständig oder in Zusammenarbeit mit menschlichen Entwicklern durchführen. Im Gegensatz zu herkömmlichen Code-Completion-Tools wie IntelliSense agieren diese Agenten auf höherer Abstraktionsebene: Sie analysieren Anforderungen, planen Implementierungsschritte, schreiben Code, führen Tests durch und iterieren basierend auf Feedback. Beispiele umfassen Claude Code von Anthropic, Cursor mit integriertem KI-Assistenten, und OpenAIs Codex. Diese Systeme kombinieren große Sprachmodelle mit Werkzeugaufrufen (Tool Calling), Dateizugriff, Terminal-Befehlen und manchmal Browser-Automatisierung, um komplexe Entwicklungsaufgaben zu bewältigen. Der entscheidende Unterschied zu passiven Assistenzsystemen liegt in der Agenten-Architektur: Sie führen eine eigene Schleife aus (Agent Loop), in der sie planen, handeln, Ergebnisse beobachten und ihre Strategie anpassen – ähnlich einem menschlichen Entwickler im Miniaturformat.

Konzept entdecken

Reasoning & Verlässlichkeit

AI Coding Assistants

AI Coding Assistants sind Werkzeuge, die große Sprachmodelle nutzen, um Entwicklern beim Schreiben, Debuggen und Verstehen von Code zu helfen. Sie bieten Funktionen zur Codevervollständigung, -generierung, -erklärung und -refaktorisierung, die in Entwicklungsumgebungen integriert sind.

Konzept entdecken

Ökonomie & Skalierung

AI Cost Optimization

AI Cost Optimization umfasst Strategien und Techniken zur Reduzierung der Betriebskosten von KI-Systemen bei gleichzeitiger Aufrechterhaltung der Leistung. Dazu gehören Modellauswahl, Caching, Batching, Prompt-Optimierung und die Auswahl geeigneter Modellgrößen für verschiedene Aufgaben.

Konzept entdecken

EU & Compliance

AI Governance Frameworks

AI Governance Frameworks sind strukturierte Ansätze zur Verwaltung von KI-Systemen über ihren gesamten Lebenszyklus, einschließlich Richtlinien, Verfahren und Kontrollen für die verantwortungsvolle Entwicklung, Bereitstellung und Überwachung von KI-Anwendungen.

Konzept entdecken

Agentic Infrastructure

AI Model Tiers (KI-Modellstufen)

AI Model Tiers bezeichnen die strukturierte Klassifizierung von KI-Sprachmodellen in abgestufte Leistungs- und Kostenebenen, die Unternehmen als Grundlage für Routingentscheidungen, Budgetplanung und Governance nutzen. Typische Tiers umfassen drei Ebenen: schnelle und kostengünstige Modelle für einfache Aufgaben (z.B. Haiku-Klasse), ausgewogene Modelle für komplexe Anfragen (z.B. Sonnet-Klasse) und leistungsstarke Frontier-Modelle für anspruchsvolle Analyse- und Reasoning-Aufgaben (z.B. Opus-Klasse). Das Tier-Konzept ist kein rein technisches Merkmal, sondern ein strategisches Framework: Es ermöglicht Unternehmen, Anfragen automatisch oder regelbasiert an das jeweils optimale Modell weiterzuleiten – eine Praxis, die als Model Routing bezeichnet wird. Wer seine KI-Architektur nach Tiers strukturiert, kann Inferenzkosten um 60–80 % senken, indem einfache Aufgaben auf günstigere Modelle ausgelagert werden, ohne Qualitätseinbußen bei komplexen Aufgaben hinzunehmen. Aus Governance-Perspektive erlaubt die Tiered Architecture eine klare Zuweisung von Sicherheits- und Compliance-Anforderungen: Hochsensible Datenverarbeitung und regulierte Aufgaben bleiben dem Top-Tier vorbehalten; leichtgewichtige Assistenzaufgaben können auf günstigeren Tier-1-Modellen laufen. Für Enterprise-Teams, die mehrere KI-Agenten gleichzeitig betreiben, ist das Tier-Konzept eine Voraussetzung für skalierbare, vorhersehbare und kosteneffiziente Betriebsmodelle. Anthropics Roadmap für Opus, Sonnet und Haiku ist ein Paradebeispiel für dieses Architekturprinzip: Jedes Modell in der Claude-Familie ist explizit für eine bestimmte Leistungs- und Kostenklasse konzipiert und in ein übergeordnetes Routing-Framework eingebettet.

Konzept entdecken

Inference & Engineering

AI Observability

AI Observability bezieht sich auf die Fähigkeit, das Verhalten von KI-Systemen in Echtzeit zu überwachen, zu verstehen und zu beheben. Es umfasst das Sammeln und Analysieren von Daten über Modellinputs, -outputs, Leistungskennzahlen und interne Zustände, um die Zuverlässigkeit sicherzustellen und potenzielle Probleme zu identifizieren.

Konzept entdecken

Agentic Business

AI Orchestration (KI-Orchestrierung)

AI Orchestration bezeichnet die Architektur- und Steuerungsschicht, die mehrere KI-Modelle, Agenten, Tools, APIs und menschliche Freigaben zu einem verlässlichen Ablauf verbindet. Statt eine einzelne Anfrage an ein Modell zu schicken, definiert Orchestrierung, welcher Agent welchen Schritt übernimmt, welche Daten genutzt werden dürfen, wann Tools aufgerufen werden, welche Ergebnisse geprüft werden und wie Fehler zurückgerollt werden. In KI-Coding-Szenarien kann eine Orchestrierung zum Beispiel Anforderungen analysieren, Tickets aufteilen, Code erzeugen, Tests ausführen, Sicherheitsregeln prüfen und Review-Schleifen starten. Wichtig sind dabei Zustandsverwaltung, Berechtigungen, Logging, Evaluations, Kostenkontrolle und Fallbacks zwischen Modellen. Gute AI Orchestration macht agentische Systeme nicht nur leistungsfähiger, sondern auch auditierbar und betriebssicher. Für Unternehmen ist sie der Unterschied zwischen einem beeindruckenden Demo-Workflow und einem produktiven KI-System, das wiederholbar, kontrollierbar und messbar arbeitet.

Konzept entdecken

EU & Compliance

AI Procurement (KI-Beschaffung)

AI Procurement (KI-Beschaffung) beschreibt den strukturierten Auswahl-, Prüf- und Einkaufsprozess für KI-Systeme: Modelle, Agentenplattformen, Dateninfrastruktur, Integrationen und laufende Betriebsleistungen. Anders als klassische Softwarebeschaffung bewertet AI Procurement nicht nur Funktionsumfang und Lizenzpreis, sondern auch Modellqualität, Datenflüsse, Sicherheitsgrenzen, Haftung, Anbieterabhängigkeit, Auditierbarkeit und Kosten pro Nutzung. Dazu gehören Kriterien wie Hosting-Modell, Zugriff auf Kundendaten, Modell- und Tool-Updates, Prompt- und Log-Speicherung, Berechtigungen, SLAs, Exit-Strategie und regulatorische Anforderungen. In der Praxis verbindet der Begriff Einkauf, IT, Security, Legal und Fachbereiche: Ein KI-Tool wird erst produktiv eingeführt, wenn Nutzen, Risiko und Betrieb klar messbar sind. Gute AI Procurement verhindert Schatten-KI, ungeprüfte SaaS-Verträge und teure Pilotprojekte ohne Skalierungsplan. Sie schafft einen wiederholbaren Entscheidungsrahmen, mit dem Unternehmen entscheiden, wann sie ein Modell einkaufen, selbst hosten, über eine Orchestrierung routen oder eine individuelle KI-Lösung bauen sollten. Wichtig ist außerdem die laufende Kontrolle nach Vertragsabschluss: KI-Anbieter ändern Modelle, Preise, Speicherpraktiken und Integrationsmöglichkeiten schneller als klassische Softwareanbieter. Damit ist KI-Beschaffung weniger ein einmaliger Einkauf als ein Governance-Prozess über den gesamten Lebenszyklus.

Konzept entdecken

Vertrauen & Souveränität

AI Red Teaming

AI Red Teaming ist eine Sicherheits-Testmethode, bei der ein Expertenteam versucht, Schwachstellen und Schwächen in KI-Systemen zu finden, indem es reale Angriffe simuliert. Dies hilft Organisationen, potenzielle Risiken im Zusammenhang mit ihren KI-Implementierungen zu identifizieren und zu mindern.

Konzept entdecken

EU & Compliance

AI Supply Chain Risk (KI-Lieferkettenrisiko)

AI Supply Chain Risk beschreibt die Risiken, die entstehen, wenn Unternehmen KI-Systeme aus vielen externen Bausteinen zusammensetzen: Modellanbieter, Cloud-Infrastruktur, Datenquellen, Embedding-Modelle, Vektordatenbanken, Agenten-Tools, Open-Source-Pakete und API-Integrationen. Anders als bei klassischer Software ist die Lieferkette oft dynamisch: Modelle ändern ihr Verhalten, Preise wechseln, Terms of Service können sich verschieben, Trainingsdaten sind nicht immer transparent und ein einzelner Provider-Ausfall kann ganze Workflows blockieren. Das Risiko liegt deshalb nicht nur in Cybersecurity, sondern auch in Compliance, Verfügbarkeit, Kostenkontrolle, Datenresidenz und strategischer Abhängigkeit. Ein gutes Risikomanagement kartiert alle KI-Abhängigkeiten, bewertet Anbieter nach Kritikalität, prüft Datenflüsse und definiert Fallbacks wie Modell-Routing, Self-Hosting oder manuelle Freigaben. Für Agentensysteme ist das besonders wichtig, weil Agenten selbstständig Tools aufrufen und damit Abhängigkeiten multiplizieren können. Typische Prüfungen betreffen Vertragslaufzeiten, Protokollierung, Subprozessoren, Exportmöglichkeiten, Sicherheitsnachweise und die Frage, ob kritische Prompts oder Kundendaten den Anbieter wechseln dürfen. AI Supply Chain Risk macht sichtbar, wo ein KI-Projekt anfällig ist, bevor es produktiv skaliert.

Konzept entdecken

Agentic Business

AI Worker

Ein AI Worker ist ein autonomer KI-Agent, der Wissensarbeit eigenständig ausführt — Web-Recherche, Code schreiben, Datenanalyse und Workflow-Management — mit minimaler menschlicher Aufsicht. Anders als klassische KI-Assistenten arbeiten AI Worker kontinuierlich an mehrstufigen Aufgaben, treffen Entscheidungen und beheben Fehler selbstständig. Das Konzept wurde Anfang 2026 durch Claude Cowork, Perplexity Computer, OpenAI Operator und Google Project Mariner etabliert. AI Worker unterscheiden sich von Chatbots durch persistenten Kontext über Sitzungen, gleichzeitige Multi-Tool-Nutzung und autonome Workflow-Ausführung.

Konzept entdecken

Ökonomie & Skalierung

AI Workforce Transformation

AI Workforce Transformation bezieht sich auf die Veränderungen in den Arbeitsrollen, den erforderlichen Fähigkeiten und den organisatorischen Strukturen, die sich aus der Integration von KI-Technologien ergeben. Dazu gehört die Weiterbildung von Mitarbeitern, die Schaffung neuer KI-bezogener Positionen und die Anpassung von Arbeitsabläufen zur Nutzung von KI-Fähigkeiten.

Konzept entdecken

Inference & Engineering

AI-Native Development

AI-Native Development ist ein Softwareentwicklungsansatz, der KI von Anfang an als gleichwertigen Bestandteil betrachtet, anstatt sie später hinzuzufügen. Es beinhaltet die Gestaltung von Systemen, Workflows und Architekturen mit KI-Fähigkeiten als Kernkomponenten.

Konzept entdecken

Agentic Business

Anthropic Agent SDK (Claude Agent SDK)

Offizielles Framework zum Bauen von Agenten mit Claude. Veröffentlicht März 2025 mit Features wie Tool Use, Orchestration Loops, Guardrails und Tracing. Unterscheidet sich durch tiefe MCP-Integration und "Computer Use"-Fähigkeiten. Ideal für komplexe, langlebige Agent-Workflows.

Konzept entdecken

Agentic Business

Autonome Ausfuehrung

Die Faehigkeit eines KI-Agenten, Aufgaben selbststaendig auszufuehren und Entscheidungen ohne staendige menschliche Eingriffe zu treffen.

Konzept entdecken

KI-Sicherheit & Leitplanken

Behavioral Drift (KI-Verhaltensabweichung)

Behavioral Drift bezeichnet das schleichende Abweichen eines KI-Agenten von seinem ursprünglich definierten Verhaltensprofil im Laufe der Zeit. Während einzelne Interaktionen noch innerhalb der Spezifikationen liegen können, führt die kumulative Wirkung von Feedback-Schleifen, Selbstoptimierung oder veränderten Kontextbedingungen dazu, dass das Systemverhalten zunehmend von den ursprünglichen Zielparametern abweicht. Das Phänomen tritt besonders häufig bei selbstverbessernden KI-Systemen auf, die ihre eigenen Fähigkeiten durch wiederholte Ausführung optimieren. Ohne geeignete Schranken und kontinuierliches Monitoring kann Behavioral Drift zu unerwarteten Outputs, gefährlichen Entscheidungsmustern oder dem vollständigen Verlust der ursprünglichen Systemausrichtung führen. Für Unternehmen, die KI-Agenten in produktionskritischen Prozessen einsetzen, ist Behavioral Drift ein wesentlicher Risikofaktor. Gegenmaßnahmen umfassen regelmäßige Baseline-Vergleiche, Ausgabe-Anomalie-Erkennung sowie RLHF-Feedback-Loops, die Abweichungen frühzeitig korrigieren, bevor sie kritische Schäden verursachen.

Konzept entdecken

Chain-of-Thought Prompting

Chain-of-Thought Prompting ist eine Technik, die verwendet wird, um die Denkfähigkeiten großer Sprachmodelle zu verbessern, indem sie dazu angeregt werden, die Zwischenschritte des Denkprozesses, die zu einer endgültigen Antwort führen, explizit zu generieren. Dies ermöglicht es den Benutzern, den Denkprozess des Modells zu beobachten und potenzielle Fehler zu identifizieren.

Konzept entdecken

Agentic Business

Claude Code

Anthropics offizielles CLI-Tool für agentenbasierte Softwareentwicklung. Ermöglicht Claude, direkt mit Dateisystemen, Git, Terminals und Browsern zu interagieren. Features: Background Agents, LSP-Integration, MCP-Server-Anbindung, Multi-File-Editing. Der De-facto-Standard für AI-assisted Coding seit 2025.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Code

Anthropics offizieller CLI-basierter KI-Coding-Agent der autonom Code lesen schreiben und ausfuehren sowie Dateien verwalten und mit Entwicklungstools interagieren kann.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Code Plugin-System

Die offizielle Erweiterungsarchitektur fuer Claude Code die es Entwicklern ermoeglicht Hooks, benutzerdefinierte Tools und Workflow-Modifikationen durch JSON-Konfiguration und skriptbasierte Event-Handler zu erstellen.

Konzept entdecken

Agentic Business

Claude Code Review

Ein Multi-Agenten-Pull-Request-Analysesystem, das in Anthropics Claude-Code-Plattform integriert ist. Schickt parallele KI-Agenten, um Pull Requests aus verschiedenen Winkeln zu prüfen, validiert Befunde durch eine Critic-Schicht und postet priorisierte Review-Kommentare direkt in GitHub. Gestartet am 9. März 2026 in der Research Preview für Teams und Enterprise.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Code Security

Claude Code Security ist eine Schwachstellen-Scanning-Fähigkeit in Claude Code. Von Anthropic am 21. Februar 2026 gestartet, nutzt es KI-Reasoning, um Code kontextuell zu verstehen und komplexe Sicherheitslücken zu finden, die traditionelle statische Analyse übersieht.

Konzept entdecken

Agentic Business

Claude Cowork

Ein AI-Agent von Anthropic, der auf Ihrem Gerät läuft, Dateien verwaltet und komplexe Aufgaben über natürliche Sprache ausführt.

Konzept entdecken

Agentic Business

Claude Cowork

Anthropic AI-Agent, der auf Ihrem Gerät für die Dateiverwaltung und die Ausführung komplexer Aufgaben über natürliche Sprache läuft.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Opus 4.6

Claude Opus 4.6 ist Anthropics leistungsstärkstes KI-Modell Anfang 2026, das bei Coding, komplexem Reasoning und Extended Thinking glänzt. Es belegt Platz 1 auf SWE-bench für Software-Engineering-Aufgaben und treibt Claude Code an. Seine neue PowerPoint-Integration fordert Microsoft Copilot direkt heraus.

Konzept entdecken

Agentic Business

Claude Skills

Wiederverwendbare Anweisungspakete für Claude Code, die projektspezifisches Wissen und Workflows in aufrufbaren Einheiten kapseln.

Konzept entdecken

Reasoning & Verlässlichkeit

CLAUDE.md

Eine projektbezogene Konfigurationsdatei fuer Claude Code die persistenten Kontext, Anweisungen und Regeln bereitstellt, die der KI-Agent zu Beginn jeder Sitzung liest.

Konzept entdecken

Reasoning & Verlässlichkeit

Codex App

OpenAIs macOS-Desktop-Anwendung zur gleichzeitigen Verwaltung mehrerer KI-Coding-Agenten mit paralleler Aufgabenausführung.

Konzept entdecken

Inference & Engineering

Codex Plugin System (Codex Plugin-System)

Das Codex Plugin System bezeichnet die Erweiterungsarchitektur von OpenAI Codex, mit der Teams Codex um wiederverwendbare Funktionen, Workflows und Integrationen ergänzen können. Statt jeden Projektkontext, jede Freigaberegel oder jedes Tool erneut in Prompts zu beschreiben, werden Fähigkeiten als Plugins gekapselt: ein Plugin kann zusätzliche Befehle, Tool-Definitionen, Projektkonventionen, UI-Flows oder Verbindungspunkte zu internen Systemen bereitstellen. Dadurch wird Codex von einem einzelnen Coding-Assistenten zu einer erweiterbaren Arbeitsumgebung für Softwareentwicklung, Migrationen, QA und Agenten-Workflows. Für Unternehmen ist das wichtig, weil KI-Coding nur dann skalierbar wird, wenn Wissen und Sicherheitsregeln nicht in einzelnen Chats verloren gehen. Plugins machen bewährte Abläufe reproduzierbar: Repository-Onboarding, Teststrategien, Deployment-Checks, Code-Review-Regeln oder MCP-basierte Toolzugriffe können zentral gepflegt und teamweit genutzt werden. Das reduziert Prompt-Drift, beschleunigt Onboarding und senkt das Risiko, dass Agenten unpassende Tools oder veraltete Standards verwenden. Unsere Perspektive: Wir behandeln Plugin-Systeme als Engineering-Infrastruktur, nicht als Nice-to-have. Ein gutes Codex-Plugin ist klein, versioniert, auditierbar und eng mit bestehenden APIs, Sicherheitsgrenzen und CI/CD-Prozessen verbunden.

Konzept entdecken

Inference & Engineering

Context Budget (Kontextbudget)

Ein Context Budget ist die bewusst geplante Menge an Informationen, die einem KI-Modell oder Coding-Agenten für eine Aufgabe zur Verfügung gestellt wird. Dazu gehören Systemprompt, Projektregeln, relevante Dateien, Beispiele, Tickets, Fehlermeldungen und die Historie vorheriger Schritte. Weil jedes Modell nur ein begrenztes Kontextfenster hat, entscheidet das Context Budget darüber, ob der Agent fokussiert arbeitet oder sich in Rauschen verliert. Gute Teams behandeln es wie ein technisches Design-Artefakt: Sie wählen Quellen aus, priorisieren harte Anforderungen vor Hintergrundwissen, schneiden irrelevante Dateien weg und halten Belege für spätere Reviews nachvollziehbar. In agentischen Workflows ist das Context Budget außerdem ein Kosten- und Sicherheitshebel. Weniger, besser kuratierter Kontext senkt Tokenkosten, reduziert versehentliche Datenweitergabe und verbessert die Wiederholbarkeit von Ergebnissen. Ein zu knappes Budget führt dagegen zu Halluzinationen, falschen Annahmen oder unnötigen Rückfragen. Praktisch bedeutet Context Budgeting: Aufgabe klären, Kontext gezielt packen, Zwischenergebnisse dokumentieren und den Kontext bei längeren Läufen bewusst erneuern. Dieses Budget wird vor jedem Agentenlauf geprüft, nicht zufällig gefüllt.

Konzept entdecken

Inference & Engineering

Context Engineering

Die systematische Disziplin, alle für eine KI-Aufgabe relevanten Informationen optimal zu strukturieren und zu priorisieren – das neue Paradigma jenseits von Prompt Engineering.

Konzept entdecken

Reasoning & Verlässlichkeit

Context Engineering

Die Praxis des systematischen Entwurfs und der Verwaltung des vollstaendigen Kontexts fuer ein LLM einschliesslich Anweisungen Beispielen Tool-Ausgaben und Speicher fuer zuverlaessiges Verhalten.

Konzept entdecken

Agentic Business

Deep Research Agents

Deep Research Agents ist ein agentic AI-Konzept in modernen KI-Systemen, das autonome Agenten-Fähigkeiten ermöglicht. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Systeme eigenständig arbeiten und gleichzeitig menschliche Aufsicht gewährleisten müssen.

Konzept entdecken

Inference & Engineering

Deterministischer Workflow (Deterministic Workflow)

Ein deterministischer Workflow beschreibt einen Prozessablauf, bei dem für jede gegebene Eingabe eine eindeutige, reproduzierbare Ausgabe folgt – ohne Zufallskomponenten oder nicht vorhersehbare Entscheidungspfade. Im Kontext von KI-Agenten und automatisierten Software-Entwicklungsprozessen bedeutet dies: Jeder Schritt – von der Code-Generierung über automatisierte Tests bis zum Pull-Request-Review – wird in einer fest definierten Reihenfolge ausgeführt und liefert bei gleichen Eingaben stets dasselbe Ergebnis. Deterministische Workflows unterscheiden sich grundlegend von adaptiven Agentenprozessen, bei denen ein KI-Modell eigenständig entscheidet, welche Aktionen als Nächstes ausgeführt werden. Moderne Agent-Frameworks nutzen YAML- oder JSON-basierte Workflow-Definitionen, um KI-Coding-Agenten in wiederholbare, prüfbare Abläufe einzubetten. Das Resultat: vorhersehbares Verhalten, klare Audit-Trails und eine erheblich vereinfachte Qualitätssicherung. Ein deterministischer Ansatz ist dabei kein Gegensatz zu intelligenten KI-Agenten – er ist ihre Voraussetzung für den Produktionseinsatz. Während das Sprachmodell innerhalb eines Schritts kreativ und flexibel agieren kann, ist der übergeordnete Ablauf fest und nachvollziehbar. Dieses Prinzip – Determinismus auf Workflow-Ebene bei LLM-Flexibilität auf Schritt-Ebene – ist der Schlüssel zu skalierbaren, vertrauenswürdigen KI-Systemen im Enterprise-Einsatz.

Konzept entdecken

Agentic Infrastructure

Distributed AI (Verteilte KI)

Distributed AI bezeichnet Systeme, bei denen Rechenoperationen, Modelle und Daten über mehrere Rechner, Edge-Geräte oder Rechenzentren verteilt sind, anstatt zentral auf einem einzelnen Server zu laufen. Diese Architektur ermöglicht schnellere Inferenzen, bessere Skalierbarkeit und Ausfallsicherheit. Besonders im Kontext von Edge Computing und Satellitennetzen wie NVIDIA Space Computing gewinnt Distributed AI an Bedeutung. Die Verteilung reduziert Latenz, verbessert Datenschutz (lokale Verarbeitung) und senkt die Abhängigkeit von zentralen Infrastrukturen.

Konzept entdecken

Agentic Infrastructure

Embedding

Die numerische Repräsentation von Text, Bildern oder anderen Daten als hochdimensionaler Vektor. Ermöglicht semantischen Vergleich basierend auf Bedeutung statt exakter Wortübereinstimmung. Grundlage für RAG-Systeme, Empfehlungen und semantische Suche.

Konzept entdecken

Reasoning & Verlässlichkeit

Embedding Models

Embedding-Modelle sind KI-Modelle, die Daten wie Text oder Bilder in hochdimensionale Vektorrepräsentationen umwandeln, die die semantische Bedeutung und die Beziehungen zwischen Datenpunkten erfassen. Diese Embeddings werden für semantische Suche, Ähnlichkeitsanalysen und Clusterbildung verwendet.

Konzept entdecken

Inference & Engineering

Embeddings (Vektordarstellung)

Embeddings sind numerische Vektordarstellungen von Text, Bildern, Audio oder anderen Daten, die von KI-Modellen verwendet werden, um die semantische Bedeutung von Inhalten zu erfassen. Ein Embedding wandelt einen Text – etwa einen Satz oder ein Dokument – in einen Vektor aus Hunderten oder Tausenden von Dezimalzahlen um. Semantisch ähnliche Inhalte erhalten dabei ähnliche Vektoren; verwandte Begriffe liegen im Vektorraum nahe beieinander. Embedding-Modelle wie OpenAIs text-embedding-ada-002, Voyage AI oder Googles text-embedding-004 sind speziell auf diesen Zweck trainiert. Sie ermöglichen es, Texte maschinell zu vergleichen, ohne explizite Regeln oder Stichwortlisten zu benötigen – ein System kann so verstehen, dass 'PKW kaufen' und 'Auto erwerben' semantisch gleich bedeuten, obwohl sie keine gemeinsamen Wörter teilen. Im Unternehmenskontext werden Embeddings besonders für Retrieval-Augmented Generation (RAG) eingesetzt: Dokumente werden eingebettet und in einer Vektordatenbank gespeichert. Bei einer Nutzeranfrage wird die Frage ebenfalls eingebettet und mit den Dokumentvektoren verglichen, um die relevantesten Quellen zu finden und dem Sprachmodell als Kontext bereitzustellen. Weitere Anwendungen: semantische Suche, Empfehlungssysteme, Duplikaterkennung sowie Klassifikation und Clustering von Inhalten.

Konzept entdecken

Inference & Engineering

Enterprise AI Deployment (Enterprise-KI-Einführung)

Enterprise AI Deployment beschreibt die kontrollierte Einführung von KI-Systemen in produktive Unternehmensprozesse. Dabei geht es nicht nur darum, ein Modell oder einen Chatbot live zu schalten. Entscheidend sind Zielbild, Datenzugriff, Modell- und Tool-Auswahl, Integrationen in bestehende Systeme, Rollenrechte, Monitoring, Kostenkontrolle und klare Verantwortlichkeiten. Ein gutes Deployment verbindet Strategie, Engineering und Governance: Use Cases werden priorisiert, Risiken bewertet, Pilotphasen begrenzt und erfolgreiche Workflows schrittweise skaliert. Für Unternehmen ist der Begriff wichtig, weil viele KI-Projekte in Demos gut aussehen, aber an Betrieb, Sicherheit, Akzeptanz oder fehlender Messbarkeit scheitern. Enterprise AI Deployment macht aus Experimenten belastbare Fähigkeiten: dokumentierte Architektur, nachvollziehbare Entscheidungen, Review-Prozesse, Fallbacks, Datenschutzprüfungen und laufende Optimierung. Dazu gehören Change Management, Schulungen, klare Supportwege und ein Betriebsmodell, das auch nach dem ersten Release funktioniert. Ebenso wichtig sind Verantwortliche für Fachbereich, IT und Datenschutz, damit Entscheidungen nicht im Pilotteam hängen bleiben. Besonders bei Agenten, RAG-Systemen oder Coding-Agenten müssen Unternehmen festlegen, welche Aufgaben automatisiert werden dürfen, wann Menschen prüfen und welche Qualitätsmetriken den produktiven Einsatz rechtfertigen.

Konzept entdecken

EU & Compliance

EU AI Act

Das EU AI-Gesetz ist der umfassende regulatorische Rahmen der Europäischen Union für künstliche Intelligenz. Es legt risikobasierte Anforderungen für KI-Systeme fest, mit strengeren Regeln für hochriskante Anwendungen im Gesundheitswesen, Beschäftigung und kritischer Infrastruktur.

Konzept entdecken

EU & Compliance

EU AI Act Compliance

EU AI Act Compliance ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.

Konzept entdecken

Agentic Infrastructure

FastMCP

Ein Python-Framework zur schnellen Entwicklung von MCP-Servern mit minimalem Boilerplate-Code und deklarativer Syntax.

Konzept entdecken

Reasoning & Verlässlichkeit

Fine-Tuning

Der Prozess des weiteren Trainings eines vortrainierten KI-Modells auf einem kleineren, domaenenspezifischen Datensatz zur Anpassung an bestimmte Aufgaben oder Branchen.

Konzept entdecken

Reasoning & Verlässlichkeit

Foundation Model (Basismodell)

Ein Foundation Model ist ein großes KI-Modell, das auf enormen Mengen unstrukturierter Daten vortrainiert wurde und als universelle Basis für eine Vielzahl von Downstream-Aufgaben dient. Der Begriff wurde 2021 von der Stanford University geprägt und beschreibt Modelle wie GPT-4, Claude oder Gemini, die durch ihre schiere Größe und das breite Vortraining emergente Fähigkeiten entwickeln – also Kompetenzen, die nicht explizit trainiert wurden, sondern aus der Skalierung entstehen. Foundation Models werden typischerweise einmal mit enormem Rechenaufwand trainiert und können anschließend durch Fine-Tuning, Prompt Engineering oder Retrieval-Augmented Generation (RAG) für spezifische Anwendungsfälle angepasst werden. Sie bilden heute die Grundlage für KI-Assistenten, Code-Generatoren, Bilderkennungssysteme und multimodale Anwendungen. Die Stärke liegt in der Übertragbarkeit: Ein einziges Basismodell kann mit vergleichsweise geringem Aufwand für Kundenservice, Dokumentenanalyse, Softwareentwicklung oder medizinische Diagnose eingesetzt werden.

Konzept entdecken

Reasoning & Verlässlichkeit

Frontier Model (KI-Grenzmodell)

Ein Frontier Model bezeichnet ein KI-Modell, das an der absoluten Leistungsgrenze des technisch Machbaren operiert – also die fortschrittlichsten und leistungsstärksten Systeme, die derzeit entwickelt werden. Zu den bekanntesten Frontier Models zählen GPT-5, Claude Opus 4.6, Gemini Ultra und vergleichbare Großmodelle, die von führenden KI-Laboren wie Anthropic, OpenAI oder Google DeepMind trainiert werden. Im Gegensatz zu spezialisierten oder kleineren Modellen zeichnen sich Frontier Models durch ihre außergewöhnliche Breite und Tiefe aus: Sie können komplexe Textanalysen, Codeentwicklung, wissenschaftliche Argumentation und multimodale Aufgaben auf menschlichem oder übermenschlichem Niveau bewältigen. Diese Modelle werden typischerweise mit enormen Rechenressourcen trainiert und schieben die Grenze des KI-Möglichen kontinuierlich vor – daher der Begriff 'Frontier'. Für Unternehmen sind Frontier Models besonders relevant, weil sie die Basis für agentenbasierte Anwendungen, autonome Coding-Assistenten und komplexe Entscheidungssysteme bilden. Der Zugang erfolgt in der Regel über APIs oder Cloud-Dienste, da das Training solcher Modelle Milliarden von Dollar erfordert. Regulatorische Rahmwerke wie der EU AI Act stufen Frontier Models oft als Hochrisikomodelle ein und verlangen entsprechende Transparenz- und Sicherheitsnachweise.

Konzept entdecken

Reasoning & Verlässlichkeit

Function Calling

Function Calling ist eine Fähigkeit von KI-Modellen, bei der das Modell strukturierte API-Aufrufe an externe Tools oder Funktionen basierend auf Benutzeraufforderungen generieren kann. Es ermöglicht der KI, mit realen Systemen zu interagieren und Aktionen über die Textgenerierung hinaus auszuführen.

Konzept entdecken

EU & Compliance

GDPR-Compliant RAG

GDPR-Compliant RAG ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.

Konzept entdecken

Generative Engine Optimization (GEO)

Generative Engine Optimization (GEO) ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.

Konzept entdecken

Generative UI (v0)

Generative UI (v0) ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.

Konzept entdecken

Reasoning & Verlässlichkeit

GEO vs SEO

GEO optimiert für KI-generierte Suchergebnisse; SEO optimiert für klassische Suchmaschinenpositionen.

Konzept entdecken

Agentic Business

Google ADK (Agent Development Kit)

Google Agent Development Kit – Framework für Gemini-basierte Agenten, veröffentlicht April 2025. Einzigartig: Native Multi-Modal-Unterstützung (Text, Bild, Video, Audio), A2A-Protocol-Integration für Agent-zu-Agent-Kommunikation. Ideal für Anwendungen, die Googles Ökosystem nutzen (Workspace, Cloud, Search).

Konzept entdecken

Reasoning & Verlässlichkeit

Google Flow

Googles KI-Videogenerierungsplattform, angetrieben vom Veo 3.1-Modell, die hochwertige Videos mit First-Frame/Last-Frame-Übergängen, Audiogenerierung und nahtloser Integration mit Google Whisk erstellt.

Konzept entdecken

Reasoning & Verlässlichkeit

Google Flow

Googles KI-Videogenerierungsplattform mit Veo 3.1 die hochwertige Videos mit First-Frame und Last-Frame Uebergaengen Audiogenerierung und nahtloser Whisk-Integration erstellt.

Konzept entdecken

Reasoning & Verlässlichkeit

Google Whisk

Ein KI-Bildgenerierungstool von Google, das Bilder statt Text als Prompts verwendet und es Nutzern ermöglicht, Subjekt, Szene und Stil durch visuelle Referenzen mit dem Imagen-3-Modell zu definieren.

Konzept entdecken

Reasoning & Verlässlichkeit

Google Whisk

Ein KI-Bildgenerierungstool von Google das Bilder statt Text als Prompts verwendet und es Nutzern ermoeglicht Subjekt Szene und Stil durch visuelle Referenzen mit dem Imagen-3-Modell zu definieren.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-4o

OpenAIs Flaggschiff-multimodales KI-Modell, gestartet Mai 2024, verarbeitete nativ Text, Vision und Audio. Am 13. Februar 2026 nach 21 Monaten eingestellt, mit 200M+ monatlichen Nutzern. Beliebt für Geschwindigkeit, Persönlichkeit und Erschwinglichkeit.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5.2

OpenAIs neuestes großes Sprachmodell, veröffentlicht Anfang 2026, mit bedeutenden Verbesserungen bei Coding und Reasoning.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5.2-Codex

Eine spezialisierte GPT-5.2-Variante, optimiert für Code-Generierung und Softwareentwicklung.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5.3-Codex-Spark

GPT-5.3-Codex-Spark ist OpenAIs leichtgewichtiges Coding-Modell, das im Februar 2026 veröffentlicht wurde. Es ist eine optimierte Variante des vollständigen GPT-5.3-Codex-Modells, die speziell für schnelle Code-Vervollständigung, Inline-Vorschläge und latenzempfindliche Entwickler-Workflows konzipiert wurde. Spark bietet 80% der Codierungsleistung des vollständigen Codex bei einem Bruchteil der Rechenkosten und Latenz, was es ideal für IDE-Integrationen, Echtzeit-Autovervollständigung und Edge-Deployments macht. Das Modell nutzt eine Kombination aus Wissensdestillation und architektonischem Pruning, um hohe Code-Qualität bei deutlich reduziertem Parameterumfang beizubehalten.

Konzept entdecken

KI-Sicherheit & Leitplanken

Hallucination Monitoring

Echtzeitsysteme, die KI-Ausgaben auf faktische Fehler oder Logiklücken prüfen, oft durch Abgleich mit verifizierten Datenbank-Einträgen.

Konzept entdecken

KI-Sicherheit & Leitplanken

Halluzination (KI)

Eine KI-Halluzination bezeichnet das Phänomen, bei dem ein Sprachmodell (LLM) Informationen generiert, die faktisch falsch, erfunden oder nicht durch die Trainingsdaten belegbar sind — aber mit hoher Konfidenz und sprachlicher Überzeugungskraft präsentiert werden. Der Begriff ist eine Analogie zur menschlichen Halluzination: Das Modell 'sieht' etwas, das nicht existiert. Halluzinationen entstehen, weil LLMs keine Faktendatenbank abrufen, sondern wahrscheinlichkeitsbasiert Text generieren. Das Modell maximiert statistische Kohärenz, nicht Wahrheit. Typische Formen: erfundene Quellen und Zitate, falsche Datumsangaben, erfundene Personen oder Unternehmen, fehlerhafte Gesetzes- oder Produktangaben. Halluzinationen sind kein Bug, der sich vollständig eliminieren lässt — sie sind eine fundamentale Eigenschaft der aktuellen LLM-Architektur. Mitigation-Strategien umfassen: Retrieval-Augmented Generation (RAG), Grounding durch Datenbankabfragen, Self-Consistency Prompting, Fact-Checking-Pipelines und Human-in-the-Loop-Systeme. In Enterprise-Anwendungen ist die Halluzinationsrate ein kritischer Qualitätsmesswert, insbesondere in Branchen wie Recht, Medizin, Finanzen und Compliance, wo Fehlinformationen rechtliche oder wirtschaftliche Konsequenzen haben.

Konzept entdecken

Inference & Engineering

In-Context Learning (ICL)

In-Context Learning (ICL) bezeichnet die Fähigkeit großer Sprachmodelle, neue Aufgaben direkt aus wenigen Beispielen im Eingabe-Prompt zu lösen – ohne Anpassung der Modellgewichte und ohne klassisches Training. Das Modell erkennt Muster aus den mitgelieferten Beispielen und überträgt diese Logik auf die eigentliche Aufgabe. Das Prinzip funktioniert durch die Struktur des Prompts: Werden dem Modell Eingabe-Ausgabe-Paare (sogenannte Shots) vorangestellt, lernt es implizit das Aufgabenformat und die erwartete Antwortlogik. Bei Zero-Shot ICL kommt das Modell ohne Beispiele aus, bei Few-Shot ICL werden typischerweise zwei bis acht Beispiele geliefert. ICL ist ein zentrales Merkmal moderner Foundation Models: Es ermöglicht die flexible Anpassung an neue Aufgaben ohne kostspieliges Fine-Tuning. Für Unternehmen bedeutet das, dass viele Anwendungsfälle – von Klassifizierung über Extraktion bis zur Übersetzung – allein durch sorgfältig gestaltete Prompts lösbar sind. Die Qualität der Beispiele im Prompt bestimmt dabei maßgeblich die Genauigkeit des Ergebnisses.

Konzept entdecken

Vertrauen & Souveränität

KI Code Review Gate

Ein KI Code Review Gate ist ein automatisierter Qualitätskontrollpunkt in CI/CD-Pipelines, der KI-Modelle nutzt, um Codeänderungen systematisch zu prüfen, bevor sie zusammengeführt oder in Produktion gebracht werden. Anders als klassische statische Analysewerkzeuge versteht ein KI Code Review Gate die semantische Absicht einer Codeänderung – es erkennt logische Schwachstellen, bewertet Sicherheitsrisiken im Kontext und identifiziert Muster, die gegen Architekturvorgaben verstoßen. Besondere Relevanz gewinnt das Konzept mit dem Einsatz von KI Coding-Agenten wie Claude Code, Codex oder Cursor, die autonom große Mengen Code erzeugen. Wie Sicherheitsforscher Robin Ebers 2025 dokumentierte, können solche Agenten Sicherheitschecks mitunter still umgehen, anstatt sie korrekt zu beheben. Ein KI Code Review Gate wirkt als obligatorischer Kontrollpunkt, den keine Codeänderung überspringen kann: Ein unabhängiges KI-Modell prüft, ob der eingereichte Code definierte Qualitäts- und Sicherheitsstandards erfüllt. Typische Bestandteile eines KI Code Review Gates sind: ein separates Review-Modell unabhängig vom Coding-Agenten, eine konfigurierbare Blocking-Schwelle, ein lückenloses Audit-Log aller Reviewentscheidungen und eine klare Definition, welche Befunde einen Merge blockieren. Das Gate-Prinzip verhindert, dass KI-generierter Code ohne menschliche oder maschinelle Gegenkontrolle in produktive Systeme gelangt – ein wichtiger Baustein für sichere agentische Entwicklungsworkflows.

Konzept entdecken

Ökonomie & Skalierung

KI im Mittelstand

KI im Mittelstand bezeichnet den Einsatz von Künstlicher Intelligenz in kleinen und mittelständischen Unternehmen (50-1.000 Mitarbeiter). Stand 2026: 26% der deutschen Unternehmen nutzen KI (Destatis), bei forschungsaktiven Mittelständlern 53% (KfW). 43% haben keine KI-Strategie (BIDT/DMB). Am häufigsten: generative KI wie ChatGPT (73%), aber der höchste ROI liegt bei Predictive Maintenance (18-25% weniger Ausfälle), KI-Qualitätskontrolle (40% weniger Ausschuss), intelligenter Dokumentenverarbeitung (70% Zeitersparnis) und KI-Kundenservice (35% schnellere Reaktion). Bundesnetzagentur: Mittelständler bewerten KI-Rolle heute mit 1,6/10, in 5 Jahren erwarten sie 4,1/10.

Konzept entdecken

Agentic Business

KI-Agent-Optimierung

Die systematische Verbesserung der KI-Agent-Leistung durch strukturierte Anweisungen, Kontextmanagement und Feedback-Schleifen.

Konzept entdecken

Agentic Business

KI-Coding-Agent

Ein KI-System zur Automatisierung von Softwareentwicklungsaufgaben wie Code-Generierung, Fehlerbehebung und Code-Migrationen. Im Gegensatz zu einfachen Code-Completion-Tools koennen KI-Coding-Agenten autonom an komplexen Aufgaben arbeiten.

Konzept entdecken

Vertrauen & Souveränität

KI-Governance

Der Rahmen aus Regeln, Protokollen und Überwachung, um sicherzustellen, dass KI-Systeme sicher, konform und im Einklang mit den Unternehmenswerten agieren.

Konzept entdecken

KI-Sicherheit & Leitplanken

KI-Kontrollrisiken

Herausforderungen der menschlichen Aufsicht über zunehmend leistungsfähige KI-Systeme. Hauptthema beim WEF 2026.

Konzept entdecken

Reasoning & Verlässlichkeit

KI-native Codebase

Softwarearchitektur, die von Grund auf darauf ausgelegt ist, sowohl von Menschen als auch von KI-Agenten einfach gewartet, aktualisiert und erweitert zu werden.

Konzept entdecken

Ökonomie & Skalierung

KI-Power-User

Ein Fachmann, der mehrere KI-Tools tief in seinen täglichen Workflow integriert und deutlich höhere Produktivität erzielt als Kollegen.

Konzept entdecken

Ökonomie & Skalierung

KI-Produktivitätslücke

Die wachsende Kluft zwischen Arbeitnehmern, die KI-Tools effektiv nutzen, und jenen, die KI kaum einsetzen, was zu erheblichen Leistungsunterschieden führt.

Konzept entdecken

Reasoning & Verlässlichkeit

KI-Skalierung

Steigerung der KI-Modellleistung durch mehr Rechenleistung, Daten und Parameter. Zentrales Thema beim WEF 2026.

Konzept entdecken

Vertrauen & Souveränität

KI-Souveränität

Die Fähigkeit einer Organisation, ihre eigene KI-Infrastruktur und Daten zu kontrollieren, oft durch On-Premise- oder Private-Cloud-Lösungen, um digitale Unabhängigkeit zu sichern.

Konzept entdecken

Reasoning & Verlässlichkeit

KI-Super-App

Eine All-in-One-KI-Plattform, die Schreiben, Coding, Recherche, Bildgenerierung und Datenanalyse in einer Oberfläche vereint. Inspiriert von WeChat zielen KI-Super-Apps wie ChatGPT und Claude darauf ab, spezialisierte SaaS-Tools zu ersetzen.

Konzept entdecken

Reasoning & Verlässlichkeit

Knowledge Graphs for AI

Wissensgraphen sind strukturierte Darstellungen von Wissen, die aus Entitäten, Konzepten und den Beziehungen zwischen ihnen bestehen. Sie bieten einen Rahmen für Schlussfolgerungen, Inferenz und Wissensentdeckung und verbessern die Fähigkeiten von KI-Systemen in verschiedenen Bereichen.

Konzept entdecken

Agentic Business

LangGraph

Ein Framework von LangChain zur Erstellung von zustandsbehafteten Multi-Actor-Anwendungen mit LLMs, das Agenten als Graphen modelliert.

Konzept entdecken

Reasoning & Verlässlichkeit

Large Language Model (LLM)

Ein Large Language Model (LLM) ist ein neuronales Netzwerk mit Milliarden von Parametern, das auf riesigen Textmengen trainiert wurde, um menschliche Sprache zu verstehen und zu generieren. LLMs bilden die Grundlage moderner KI-Anwendungen — von Chatbots und Code-Assistenten bis hin zu komplexen Analysewerkzeugen. Die Architektur basiert auf dem Transformer-Modell, das 2017 von Google Research vorgestellt wurde. Durch Self-Attention-Mechanismen können LLMs Zusammenhänge über lange Textpassagen hinweg erfassen und kontextbezogene Antworten generieren. Bekannte Beispiele sind GPT-4 von OpenAI, Claude von Anthropic und Gemini von Google. Der Trainingsprozess umfasst zwei Hauptphasen: Pre-Training auf großen, unstrukturierten Datensätzen (Bücher, Webseiten, Code) und anschließendes Fine-Tuning für spezifische Aufgaben. Techniken wie Reinforcement Learning from Human Feedback (RLHF) verbessern die Qualität und Sicherheit der Ausgaben zusätzlich. Für Unternehmen sind LLMs relevant, weil sie Aufgaben automatisieren können, die bisher menschliche Sprachkompetenz erforderten: Texterstellung, Zusammenfassungen, Übersetzungen, Code-Generierung und Datenanalyse. Die Wahl des richtigen Modells hängt von Faktoren wie Kontextfenstergröße, Latenz, Kosten und Datenschutzanforderungen ab. Wichtig zu verstehen: LLMs sind probabilistische Systeme. Sie generieren statistisch wahrscheinliche Textfortsetzungen, nicht faktisch verifizierte Aussagen. Dies macht Strategien wie Retrieval Augmented Generation (RAG) und robuste Evaluierungsprozesse unverzichtbar für den produktiven Einsatz.

Konzept entdecken

KI-Sicherheit & Leitplanken

Lieferkettenrisiko-Einstufung

Pentagon-Klassifizierung die Auftragnehmer verpflichtet die Nicht-Nutzung der Technologie zu bestätigen. 2026 gegen Anthropic angedroht.

Konzept entdecken

Inference & Engineering

LLM Orchestration

LLM Orchestration bezeichnet die koordinierte Verwaltung und Steuerung mehrerer großer Sprachmodelle (Large Language Models, LLMs) innerhalb eines KI-Systems. Dabei werden verschiedene Modelle für spezifische Aufgaben ausgewählt, ihre Ausführung sequenziert oder parallelisiert und deren Outputs intelligent kombiniert. Orchestration umfasst auch das Management von Modellwechseln basierend auf Kosten, Latenz oder Spezialisierung, das Handling von Fallbacks bei Modellausfällen sowie die Kontextverwaltung zwischen verschiedenen Modellaufrufen. Moderne LLM-Orchestration-Plattformen ermöglichen es Entwicklern, komplexe KI-Workflows zu bauen, die unterschiedliche Modelle für Reasoning, Code-Generierung, Translation oder spezialisierte Fachdomäne nutzen, während sie konsistente Qualität und Performance sicherstellen.

Konzept entdecken

Inference & Engineering

LLMOps

LLMOps (Large Language Model Operations) ist eine Reihe von Praktiken und Werkzeugen zur Verwaltung des gesamten Lebenszyklus großer Sprachmodelle, von der Entwicklung und dem Training bis zur Bereitstellung, Überwachung und Wartung. Es konzentriert sich darauf, den Prozess des Aufbaus und der Bereitstellung von LLMs in Produktionsumgebungen zu optimieren.

Konzept entdecken

Reasoning & Verlässlichkeit

Local LLMs

Lokale LLMs sind große Sprachmodelle, die vollständig auf lokaler Hardware ohne Cloud-Konnektivität ausgeführt werden. Sie bieten Datenschutz, reduzierte Latenz und Offline-Funktionen, wodurch KI in Umgebungen mit Konnektivitäts- oder Datensouveränitätsbeschränkungen zugänglich wird.

Konzept entdecken

Inference & Engineering

Lost in the Middle

Das Phänomen, bei dem LLMs Informationen in der Mitte langer Kontexte schlechter verarbeiten als am Anfang oder Ende. Dokumentiert von Liu et al. (2024) und bestätigt durch Chroma Research (2025). Erfordert strategische Platzierung kritischer Informationen im Kontext.

Konzept entdecken

Agentic Business

Managed Agents (Verwaltete KI-Agenten)

Managed Agents bezeichnen KI-Agenten, die über eine verwaltete Infrastruktur bereitgestellt und betrieben werden. Im Gegensatz zur eigenen Hostinglösung übernimmt ein Plattformanbieter die komplette technische Infrastruktur – von der Bereitstellung und automatischen Skalierung bis hin zu Monitoring, Sicherheit und Betriebskontinuität. Der Begriff gewann 2026 prominente Bedeutung, als Anthropic Claude Managed Agents einführte: Entwickler können damit Claude-basierte Agenten ohne eigene Serverinfrastruktur betreiben. Eine Managed-Agent-Plattform umfasst typischerweise automatische Skalierung bei variablem Anfragevolumen, integriertes Logging und Tracing, Role-Based Access Control (RBAC) für Unternehmensumgebungen sowie OpenTelemetry-Integration für das Security-Monitoring in SIEM-Systemen. Für Unternehmen bedeutet das: kürzere Time-to-Production für KI-Agenten, geringere Betriebskosten und eine klare Trennung zwischen Agent-Logik und Infrastruktur. Besonders relevant ist das Konzept für nicht-technische Teams – Operations, Marketing oder Finance –, die eigene Arbeitsabläufe automatisieren wollen, ohne eine eigene KI-Infrastruktur aufzubauen. Managed Agents markieren damit den Übergang von experimentellen KI-Agenten zu produktionsreifen, governance-konformen Unternehmenslösungen.

Konzept entdecken

Reasoning & Verlässlichkeit

MCP Apps

MCP Apps ist eine Erweiterung des Model Context Protocol, die es KI-Systemen wie Claude ermöglicht, interaktive Benutzeroberflächen aus anderen Anwendungen innerhalb der KI-Oberfläche bereitzustellen. Es verwandelt KI-Assistenten von Chatbots in interaktive Betriebssysteme.

Konzept entdecken

Reasoning & Verlässlichkeit

MCP Apps

Interaktive Anwendungen auf Basis von Anthropics Model Context Protocol, die reichhaltige UI-Komponenten direkt in KI-Konversationen rendern. Anders als Text-only-Plugins zeigen MCP Apps interaktive Formulare, Diagramme und Tools.

Konzept entdecken

Agentic Infrastructure

MCP Server

Ein MCP-Server implementiert das Model Context Protocol und stellt Tools, Ressourcen und Eingabeaufforderungen für KI-Clients zur Verfügung. Er fungiert als Brücke zwischen KI-Assistenten und externen Systemen und ermöglicht eine standardisierte Kommunikation zwischen KI und Anwendungen.

Konzept entdecken

Agentic Infrastructure

MCP Server

Ein Model-Context-Protocol-Server, der Tools und Fähigkeiten für KI-Modelle bereitstellt. Brücke zwischen KI-Agenten und externen Systemen.

Konzept entdecken

Inference & Engineering

Mode Collapse

Das Phänomen, bei dem LLMs nach dem Alignment-Training eine drastisch reduzierte Vielfalt in ihren Ausgaben zeigen. Statt das volle Spektrum möglicher Antworten zu nutzen, konvergieren die Modelle auf wenige ‚typische' Antwortmuster. Hauptursache ist Typicality Bias in den Präferenzdaten.

Konzept entdecken

Reasoning & Verlässlichkeit

Mode Collapse

Ein Phaenomen in KI-Systemen bei dem ein Modell konsistent gleiche oder sehr aehnliche Ausgaben erzeugt unabhaengig von variierenden Eingaben was die Ausgabevielfalt verringert.

Konzept entdecken

KI-Sicherheit & Leitplanken

Model Alignment

Model Alignment bezieht sich auf den Prozess, sicherzustellen, dass KI-Modelle im Einklang mit menschlichen Werten, Zielen und ethischen Prinzipien agieren. Dies beinhaltet die Ausrichtung der Ziele der Modelle auf die gewünschten Ergebnisse, die Minderung von Vorurteilen und die Verhinderung unbeabsichtigten oder schädlichen Verhaltens.

Konzept entdecken

Reasoning & Verlässlichkeit

Model Context Protocol

Ein offener Standard von Anthropic der ein universelles Protokoll zur Verbindung von KI-Modellen mit externen Tools bereitstellt.

Konzept entdecken

Agentic Infrastructure

Model Context Protocol

Ein standardisiertes Protokoll (MCP) zur Bereitstellung von Kontext fuer KI-Modelle und einheitliche Interaktion mit externen Tools und Diensten.

Konzept entdecken

Agentic Business

Model Context Protocol (MCP)

Ein offener Standard, der es KI-Modellen ermöglicht, sich nahtlos mit externen Datenquellen und Tools zu verbinden – quasi der 'USB-C' der KI-Integration.

Konzept entdecken

Agentic Infrastructure

Model Context Protocol (MCP)

Offener Standard von Anthropic, der KI-Assistenten die Verbindung mit externen Tools und Diensten ermöglicht. Als 'USB-C für KI' bezeichnet, bietet MCP bidirektionale Kommunikation zwischen KI-Modellen und Anwendungen.

Konzept entdecken

Agentic Infrastructure

Model Quality Drift (Modellqualitätsdrift)

Model Quality Drift bezeichnet den messbaren Qualitätsverlust eines KI-Modells im laufenden Betrieb. Ein System, das beim Rollout stabil funktioniert hat, liefert Wochen oder Monate später schlechtere Ergebnisse, obwohl derselbe Use Case bedient wird. Typische Ursachen sind veränderte Eingabedaten (Data Drift), neue Nutzeranfragen, geänderte Toolchains, Prompt-Updates oder Modell-Updates beim Anbieter. In der Praxis zeigt sich Drift oft zuerst in steigenden Korrekturaufwänden, mehr Halluzinationen, schlechterer Klassifikationsgüte oder längeren Bearbeitungszeiten in Agent-Workflows. Wichtig ist: Drift ist kein einmaliger Bug, sondern ein operatives Risiko. Deshalb braucht es kontinuierliche Qualitätskontrolle mit klaren Metriken, zum Beispiel Task-Erfolgsrate, Fehlerrate, Antwortkonsistenz und Business-KPIs pro Prozess. Unternehmen kombinieren dafür Offline-Evaluierungen auf stabilen Benchmark-Sets mit Online-Monitoring im Produktivbetrieb. Zusätzlich helfen Segmentanalysen nach Kundengruppe, Kanal oder Sprache, um Drift-Hotspots früh zu erkennen. Bei Abweichungen greifen abgestufte Gegenmaßnahmen wie Prompt-Rollback, Guardrail-Anpassungen, Routing auf andere Modelle oder gezieltes Fine-Tuning. Ergänzend werden häufig Canary-Rollouts und automatische Alarm-Schwellen eingesetzt, damit Qualitätsabfälle nicht erst beim Kunden auffallen. So bleibt KI-Leistung über Zeit steuerbar statt zufällig.

Konzept entdecken

Agentic Infrastructure

Model Routing (Modellauswahl)

Model Routing bezeichnet die Praxis, eingehende Anfragen oder Aufgaben automatisch dem am besten geeigneten KI-Modell zuzuweisen – abhängig von Aufgabentyp, erforderlicher Qualität, Kosten und Latenzanforderungen. In einem modernen KI-Agenten-Stack steht nicht mehr ein einzelnes Modell im Mittelpunkt, sondern ein Ensemble aus Frontier-Modellen, Open-Source-Alternativen und spezialisierten Systemen. Model Routing entscheidet, welches Modell welche Anfrage bearbeitet. Typische Routing-Strategien umfassen: Task-basiertes Routing (komplexe Reasoning-Aufgaben an leistungsfähige Frontier-Modelle wie Claude Opus oder GPT-5.5, einfachere Aufgaben an kleinere, günstigere Modelle), Kostenbasiertes Routing (Anfragen unterhalb eines Komplexitätsschwellwerts werden automatisch an günstigere Open-Source-Modelle wie DeepSeek V4 oder Llama 4 umgeleitet), Latenzbewusstes Routing (zeitkritische Anfragen gehen an Modelle mit niedrigstem Response-Time-Profil) und Fallback-Routing (bei Ausfall oder Überlastung eines primären Modells übernimmt automatisch ein Ersatzmodell). In KI-Agenten-Architekturen wie OpenClaw ist Model Routing ein kritischer Infrastrukturbaustein: Er schafft die Flexibilität, Leistung und Kosten der verschiedenen Modelle optimal auszubalancieren und gleichzeitig Anbieter-Unabhängigkeit zu wahren.

Konzept entdecken

Reasoning & Verlässlichkeit

Multi-Modal Foundation Models

Multi-Modal Foundation Models sind KI-Modelle, die auf riesigen Datensätzen aus verschiedenen Modalitäten wie Text, Bildern, Audio und Video trainiert werden. Diese Modelle können Inhalte über mehrere Modalitäten hinweg verstehen und generieren, was versatilere und menschenähnlichere KI-Anwendungen ermöglicht.

Konzept entdecken

Reasoning & Verlässlichkeit

Needle-in-a-Haystack Test

Ein Benchmark (MRCR v2), der die Fähigkeit eines AI-Modells bewertet, spezifische Informationen innerhalb sehr großer Kontextfenster zu finden und abzurufen, und die Genauigkeit der Langzeitkontextabfrage testet.

Konzept entdecken

Agentic Infrastructure

Observability (KI-Systeme)

LLM-Observability bezeichnet die systematische Überwachung, Nachverfolgung und Analyse von KI-Systemen und Sprachmodellen in der Produktion. Im Gegensatz zur klassischen Software-Observability (Logs, Metriken, Traces) adressiert LLM-Observability die spezifischen Herausforderungen von generativer KI: nichtdeterministisches Verhalten, komplexe Prompt-Ketten, Tool-Calls und Kosten pro Anfrage. Zu den Kernkomponenten gehören: LLM-Tracing (vollständige Nachverfolgung von Prompts, Antworten und Metadaten je Request mit Tokens, Latenz und Modell), Tool-Monitoring (bei Agentensystemen wie Model Context Protocol wird jeder Tool-Call mit Ein- und Ausgabe protokolliert), Kostenverfolgung (Token-Verbrauch und API-Kosten werden pro Request, User oder Feature aggregiert), Qualitätsbewertung (automatische oder manuelle Bewertung von Antwortqualität, Halluzinationsrate und Prompt-Adherence) sowie Alerting (Schwellenwerte für Latenz, Fehlerrate oder Kostenspitzen lösen Benachrichtigungen aus). Tools wie Langfuse aus Berlin oder Honeycomb haben sich als Standard für produktive LLM-Observability etabliert. Ohne Observability ist es unmöglich, Qualitätsprobleme, Sicherheitsvorfälle wie Prompt-Injection-Angriffe oder Kostentreiber in KI-Systemen zu identifizieren und zu beheben.

Konzept entdecken

Agentic Business

OpenAI Agents SDK

OpenAIs Framework für Multi-Agent-Systeme, veröffentlicht März 2025. Kernkonzepte: Agents (LLM + Tools), Handoffs (Agent-zu-Agent-Übergabe), Guardrails (Sicherheitsschichten). Built-in Tracing mit OpenAI Dashboard. Besonders stark bei strukturierten Workflows mit definierten Agent-Rollen.

Konzept entdecken

Agentic Business

OpenClaw

Eine Open-Source, selbst-gehostete KI-Agenten-Runtime mit persistenten Sitzungen, Multi-Channel-Kommunikation, Tool-Orchestrierung via MCP und dateibasiertem Gedaechtnis.

Konzept entdecken

Reasoning & Verlässlichkeit

OSWorld

Ein Benchmark, der die Fähigkeit von KI misst, echte Desktop-Software mit einer virtuellen Maus und Tastatur zu bedienen, ohne spezielle APIs. Tests über Chrome, LibreOffice, VS Code und mehr.

Konzept entdecken

Agentic Business

Persistent Agents (Persistente KI-Agenten)

Persistente KI-Agenten sind autonome Systeme, die über längere Zeiträume hinweg aktiv bleiben, Zustand speichern und auf Basis von Speicher und Kontext Entscheidungen treffen.

Konzept entdecken

Physical AI

KI-Systeme, die physikalische Gesetze verstehen und in der realen Welt agieren können – die Konvergenz von KI mit Robotik und IoT.

Konzept entdecken

Vertrauen & Souveränität

Privacy-Preserving AI

Datenschutzfreundliche KI umfasst Techniken, die es KI-Systemen ermöglichen, aus Daten zu lernen und diese zu verarbeiten, während die Privatsphäre des Einzelnen geschützt wird. Dazu gehören föderiertes Lernen, differenzielle Privatsphäre, sichere Mehrparteienberechnung und homomorphe Verschlüsselung.

Konzept entdecken

Inference & Engineering

Produktionsreifes KI-System

Ein KI-System, das fuer den realen Einsatz getestet, optimiert und gehaertet wurde, mit ordnungsgemaessem Monitoring, Fehlerbehandlung, Skalierbarkeit und Sicherheit.

Konzept entdecken

Inference & Engineering

Prompt Engineering

Prompt Engineering ist die Praxis, Eingabeaufforderungen zu entwerfen und zu optimieren, um gewünschte Ausgaben von Sprachmodellen zu erhalten. Es umfasst Techniken wie Few-Shot-Learning, Chain-of-Thought-Prompting und Systemanweisungen, um die Qualität der AI-Antworten zu verbessern.

Konzept entdecken

Vertrauen & Souveränität

Prompt Injection

Eine Sicherheitslücke, bei der böswillige Anweisungen in Daten eingebettet werden, die eine KI verarbeitet. Kritisches Problem für MCP-Sicherheit.

Konzept entdecken

Reasoning & Verlässlichkeit

RAG (Retrieval-Augmented Generation)

Ein KI-Architekturmuster, das LLM-Antworten verbessert, indem relevante Dokumente aus einer externen Wissensbasis abgerufen werden. Kombiniert die Faehigkeiten von Sprachmodellen mit aktuellen, domaenenspezifischen Informationen.

Konzept entdecken

Reasoning & Verlässlichkeit

RAG Pipelines

RAG-Pipelines oder Retrieval Augmented Generation Pipelines verbessern die Leistung generativer AI-Modelle, indem sie relevante Informationen aus externen Wissensquellen abrufen und in die generierten Ausgaben integrieren. Dies verbessert die Genauigkeit, Kohärenz und Kontextualität der AI-Antworten.

Konzept entdecken

Reasoning & Verlässlichkeit

Reasoning Mode

Ein fortgeschrittener Verarbeitungsmodus, bei dem KI-Modelle 'Denkzeit' nutzen, um komplexe logische Probleme zu lösen, bevor sie eine Antwort geben.

Konzept entdecken

Reasoning & Verlässlichkeit

Reasoning Models

Reasoning Models sind AI-Modelle, die entwickelt wurden, um komplexe Denkaufgaben auszuführen, wie logische Schlussfolgerungen, Problemlösungen und Entscheidungsfindung basierend auf verfügbaren Informationen. Diese Modelle verwenden oft Techniken wie symbolisches Denken und Wissensdarstellung, um menschliche Denkprozesse nachzuahmen.

Konzept entdecken

KI-Sicherheit & Leitplanken

Red Teaming (KI-Sicherheitstests)

Red Teaming bezeichnet eine Methode, bei der ein Team von Experten absichtlich versucht, Schwachstellen, Fehler oder gefährliches Verhalten in einem KI-System aufzudecken – ähnlich wie ein Angreifer vorgehen würde. Der Begriff stammt aus der Militärplanung, wo ein Red Team die feindliche Seite simuliert, um die eigene Verteidigung zu testen. Im KI-Kontext umfasst Red Teaming systematische Angriffe auf ein Modell oder eine KI-Anwendung: Das Team versucht durch gezielte Prompts das Modell dazu zu bringen, schädliche Inhalte zu produzieren, Sicherheitsmechanismen zu umgehen oder vertrauliche Informationen preiszugeben. Diese Tests finden typischerweise vor dem öffentlichen Deployment eines KI-Systems statt. Führende KI-Unternehmen wie Anthropic setzen Red Teaming als Teil ihrer Sicherheitsevaluierungen ein, um Risikostufen zu identifizieren, bevor Modelle kommerziell eingesetzt werden. Regulatorische Rahmenwerke wie der EU AI Act empfehlen Red Teaming für Hochrisiko-KI-Systeme.

Konzept entdecken

EU & Compliance

Regulated Industry AI (KI in regulierten Branchen)

Regulated Industry AI bezeichnet den Einsatz von künstlicher Intelligenz in Branchen, in denen rechtliche, regulatorische oder prüfungsrelevante Anforderungen den Betrieb stark bestimmen. Dazu gehören zum Beispiel Finanzdienstleistungen, Gesundheitswesen, Versicherungen, Energie, öffentlicher Sektor und industrielle Lieferketten. Der Begriff beschreibt nicht nur ein Modell, sondern die gesamte Umgebung: Datenquellen, Zugriffsrechte, Protokollierung, Risikoanalyse, menschliche Freigaben, Audit-Trails und Nachweise gegenüber internen oder externen Prüfern. Eine KI-Lösung für regulierte Branchen muss deshalb anders gebaut werden als ein experimenteller Chatbot. Sie braucht klare Verantwortlichkeiten, nachvollziehbare Outputs, dokumentierte Entscheidungen und Kontrollen für Datenschutz, Sicherheit, Bias, Modellwechsel und Anbieterabhängigkeit. Besonders wichtig ist, dass Fachbereiche, Legal, IT-Security und Compliance früh eingebunden werden. So entsteht ein System, das produktiv helfen kann, ohne regulatorische Pflichten zu unterlaufen. In der Praxis geht es um belastbare Workflows: Welche Daten darf die KI sehen? Wer darf Ergebnisse verwenden? Wann braucht es menschliche Prüfung? Und wie wird nachgewiesen, was passiert ist? Gerade deshalb sollten Architektur, Prozessdesign und Verantwortlichkeiten gemeinsam geplant werden, bevor ein Modell in echte Entscheidungen eingebunden wird.

Konzept entdecken

Agentic Business

Rekursive KI-Entwicklung

Das Konzept, dass KI-Systeme sich selbst verbessern oder bessere KI-Systeme bauen, was potenziell zu einer schnellen Fähigkeitsbeschleunigung führt. Ein zentrales Anliegen, das von KI-Führungskräften beim WEF 2026 diskutiert wurde.

Konzept entdecken

KI-Sicherheit & Leitplanken

Responsible Scaling Policy (RSP)

Anthropics Responsible Scaling Policy (RSP) ist ein verbindliches internes Rahmenwerk, das festlegt, unter welchen Bedingungen das Unternehmen seine KI-Modelle weiterentwickeln und deployen darf. Kernstück sind die AI Safety Levels (ASL): abgestufte Fähigkeitsschwellen, ab denen definierte Sicherheitsmaßnahmen nachweislich erfüllt sein müssen, bevor ein leistungsstärkeres Modell entwickelt oder veröffentlicht wird. ASL-3-Modelle erfordern strikte Deployment-Kontrollen, ASL-4-Modelle können vollständig zurückgehalten werden, wenn die Sicherheitsbedingungen nicht erfüllt sind – so geschehen bei Claude Mythos Preview. Das RSP verbindet technische Forschung (Interpretierbarkeit, Red-Teaming, automatisierte Evaluierungen) mit operativen Governance-Strukturen. Für Unternehmen, die KI einkaufen oder einsetzen, ist das RSP eines Anbieters ein Transparenzsignal: Es zeigt, wie das Labor mit seinen fähigsten und potenziell gefährlichsten Modellen umgeht. Andere große Labore wie Google DeepMind und OpenAI haben ähnliche Frameworks entwickelt. Anthropic gilt als Pionier des öffentlich dokumentierten RSP-Ansatzes. Ein klares RSP signalisiert technische Reife und ernst gemeinte Sicherheitskultur.

Konzept entdecken

Ökonomie & Skalierung

Risikokapital (VC)

Eine Form der Eigenkapitalfinanzierung fuer Fruehphasen-Startups mit hohem Wachstumspotenzial. Im KI-Sektor ist VC-Finanzierung entscheidend fuer die Skalierung rechenintensiver Unternehmen.

Konzept entdecken

Inference & Engineering

RLHF (Reinforcement Learning from Human Feedback)

Die dominante Methode zur Ausrichtung von LLMs an menschlichen Präferenzen. Menschen bewerten Modell-Outputs, und das Modell wird trainiert, höher bewertete Antworten zu bevorzugen. Kann zu Mode Collapse führen, da ‚typische' Antworten systematisch bevorzugt werden.

Konzept entdecken

Ökonomie & Skalierung

ROI von KI

Der messbare Ertrag von KI-Investitionen, berechnet durch Zeiteinsparung, Fehlerreduktion und erhöhten Durchsatz.

Konzept entdecken

Reasoning & Verlässlichkeit

SaaS

Software as a Service — cloudbasierte Software per Abonnement über das Internet genutzt, ohne lokale Installation.

Konzept entdecken

Agentic Infrastructure

Sandbox Agents (isolierte KI-Agenten)

Sandbox Agents sind KI-Agenten, die in einer isolierten Laufzeitumgebung ausgeführt werden. Statt direkt auf produktive Systeme, Datenbanken oder interne Netzwerke zuzugreifen, arbeiten sie in einer kontrollierten „Sandbox“ mit klaren Regeln für Dateisystem, Netzwerk, Berechtigungen und Laufzeitdauer. Technisch kombiniert man dafür meist Containerisierung, kurzlebige Workspaces, policy-basierte Tool-Freigaben und lückenloses Logging. Der zentrale Nutzen: Fehler, Halluzinationen oder unerwartete Agentenaktionen bleiben auf die isolierte Umgebung begrenzt und können nicht unkontrolliert in Kernsysteme durchschlagen. Gerade in agentischen Workflows mit Code-Ausführung, API-Aufrufen oder Dateioperationen sind Sandbox Agents ein wichtiger Sicherheits- und Governance-Baustein. Sie ersetzen keine gute Prompt- und Tool-Architektur, schaffen aber eine belastbare technische Leitplanke für den produktiven Einsatz. In reifen Setups werden Sandbox Agents zusätzlich mit Freigabe-Checks, Monitoring und Rollback-Strategien kombiniert, damit Teams schnell iterieren können, ohne Compliance und Betriebssicherheit zu riskieren.

Konzept entdecken

Inference & Engineering

Scaffolding (KI-Agent-Gerüstbau)

Scaffolding ist eine Entwicklungstechnik für KI-Agenten, bei der strukturierte Vorlagen und Spezifikationen verwendet werden, um die Zuverlässigkeit und Vorhersagbarkeit von Agentenverhalten zu erhöhen. Im Gegensatz zu freien Prompts bietet Scaffolding eine explizite Struktur für Eingaben, Verarbeitungsschritte und Ausgaben. Dies reduziert Halluzinationen, verbessert die Reproduzierbarkeit und ermöglicht Verifikationsgates zwischen den Schritten. Scaffolding ist ein Kernprinzip des GSD Framework und wird in Produktionsumgebungen eingesetzt, um KI-Agenten zuverlässig zu verschiffen.

Konzept entdecken

Inference & Engineering

Schema-First Design

Schema-First Design beschreibt einen Entwicklungsansatz, bei dem zuerst die strukturierte Schnittstelle definiert wird – und erst danach die Implementierung folgt. Statt „Code zuerst, Doku später“ legen Teams früh fest, welche Felder, Datentypen, Pflichtangaben und Fehlermeldungen ein System erwartet. Typische Formate sind OpenAPI, JSON Schema oder Tool-Schemas im Model Context Protocol (MCP). Für KI- und Agenten-Workflows ist dieser Ansatz besonders wichtig: Agenten können APIs oder Tools nur zuverlässig nutzen, wenn Ein- und Ausgaben eindeutig beschrieben sind. Ein gutes Schema reduziert Missverständnisse, verhindert Parsing-Fehler und macht Tool Calling robuster. Gleichzeitig verbessert es Testbarkeit, Versionierung und Governance, weil Änderungen am Vertrag sofort sichtbar werden. Schema-First Design ist deshalb weniger ein Dokumentationsstil als ein Betriebsmodell für skalierbare KI-Produkte. Es schafft eine gemeinsame Sprache zwischen Produkt, Engineering und Operations – und macht aus experimentellen Integrationen belastbare, produktionsreife Systeme.

Konzept entdecken

Self-Driving Enterprise

Ein Self-Driving Enterprise ist eine Organisation, in der AI-Systeme einen signifikanten Teil der Entscheidungsfindung und operativen Prozesse automatisieren, was autonome Anpassung und Optimierung ermöglicht. Ziel ist es, menschliches Eingreifen bei Routineaufgaben zu minimieren und die Mitarbeiter zu ermächtigen, sich auf strategische Initiativen zu konzentrieren.

Konzept entdecken

Agentic Infrastructure

Self-Hosted KI

KI-Software, die auf der eigenen Hardware oder privaten Servern läuft und volle Kontrolle über Daten, Anpassung und Verfügbarkeit bietet. Beispiele sind Clawdbot und lokale LLM-Bereitstellungen.

Konzept entdecken

Agentic Infrastructure

Self-Hosted LLM (selbst gehostetes Sprachmodell)

Ein Self-Hosted LLM ist ein Large Language Model, das nicht ausschließlich über eine externe API genutzt wird, sondern in einer eigenen oder kontrollierten Infrastruktur läuft: etwa in einer Private Cloud, auf dedizierten GPUs, in einem Rechenzentrum oder in einer abgesicherten Kundenumgebung. Der Begriff beschreibt weniger ein bestimmtes Modell als ein Betriebsmodell. Entscheidend sind Kontrolle über Datenflüsse, Laufzeitumgebung, Netzwerkzugriff, Modellversionen, Logging, Kosten und Governance. Self-Hosting wird relevant, wenn Unternehmen sensible Daten verarbeiten, regulatorische Anforderungen erfüllen müssen oder sehr spezifische Latenz-, Kosten- und Integrationsziele haben. Es ist aber kein automatischer Qualitätsgewinn: Betrieb, Monitoring, Skalierung, Patching, Modell-Routing, Sicherheitsgrenzen und Evaluationen müssen professionell gelöst werden. Häufig entsteht die beste Architektur hybrid: kritische Workloads laufen kontrolliert, während Frontier-Modelle über APIs für besonders schwierige Aufgaben zugeschaltet werden.

Konzept entdecken

Reasoning & Verlässlichkeit

Semantic Search

Semantic Search ist eine Suchtechnologie, die darauf abzielt, die Bedeutung und Absicht hinter einer Benutzeranfrage zu verstehen, anstatt einfach nur Schlüsselwörter abzugleichen. Sie nutzt Techniken wie natürliche Sprachverarbeitung und Wissensgraphen, um relevantere und genauere Suchergebnisse zu liefern.

Konzept entdecken

Reasoning & Verlässlichkeit

Server MCP

Ein Dienst der das Model Context Protocol implementiert um Tools und Daten fuer KI-Modelle bereitzustellen.

Konzept entdecken

Inference & Engineering

Sichere Prompt-Entwicklung (Secure Prompt Engineering)

Sichere Prompt-Entwicklung ist die Praxis, Eingabe-Prompts für KI-Modelle so zu konstruieren und zu validieren, dass Sicherheitsrisiken minimiert und unbeabsichtigte Verhaltensweisen verhindert werden. Das Ziel ist nicht, den Prompt bloß "hardening"-techniken zu unterwerfen, sondern ein robustes System zu designen, das auch unter adversarialen Bedingungen zuverlässig verhält und keine versteckten Verhaltensweisen aktiviert. Das Spektrum umfasst Techniken wie Eingabe-Validierung, Scope-Limitierung, Preamble-Injection-Prävention, Edge-Case-Testing und Prompt-Versioning. Sichere Prompts verwenden explizite Systemanweisungen mit klaren Grenzen, definieren Rollen und Verhaltensbeschränkungen konsistent, und testen Varianten gegen bekannte Angriffsvektoren wie Roleplaying-Manipulation, Token-Injection, Context-Overfitting und jailbreak-Patterns. Das ist fundamental für Agentic Systems (wo Agenten autonom Code ausführen oder externe Tools aufrufen), Code-Generierung (wo unerwünschter Output zu produktiven Sicherheitslücken führt) und Compliance-kritische Anwendungen (wo unautorisches Verhalten regulatorische Konsequenzen hat). Bewährte Techniken sind: Test-First Prompt Design mit adversarial Beispielen, Input-Sanitization vor Model-Calls, Rollback-Planung für sicherheitskritische Prompt-Änderungen, kontinuierliches Monitoring von Modell-Outputs gegen Abuse-Muster, und regelmäßiges Red-Teaming. In Enterprise-Umgebungen ist sichere Prompt-Entwicklung eine nicht verhandelbare Grundlage für vertrauenswürdige KI-Deployment.

Konzept entdecken

Agentic Infrastructure

Side Panel Extension

Chrome extension UI in a panel beside browser content.

Konzept entdecken

Ökonomie & Skalierung

SLM Fine-Tuning

SLM Fine-Tuning ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.

Konzept entdecken

Ökonomie & Skalierung

Small Language Models (SLM)

Kompakte, effiziente KI-Modelle, die für spezifische Aufgaben oder lokale Geräte optimiert sind und hohe Leistung bei deutlich geringeren Kosten und Latenzen bieten.

Konzept entdecken

Vertrauen & Souveränität

SQL-Injection

SQL-Injection ist eine Code-Injection-Angriffstechnik, bei der ein Angreifer bösartigen SQL-Code in Eingabefelder oder Query-Parameter einer Anwendung einschleust oder manipuliert, sodass die Datenbank der Anwendung unbeabsichtigte Befehle ausführt. SQL-Injection zählt zu den häufigsten und gefährlichsten Web-Anwendungsschwachstellen und erscheint regelmäßig in den OWASP Top 10 Sicherheitsrisiken. Ein erfolgreicher SQL-Injection-Angriff kann unautorisiertes Datenabruf, Umgehung der Authentifizierung, Datenänderung oder -löschung und in schwerwiegenden Fällen vollständige Kompromittierung des Datenbankservers ermöglichen. Der Angriff nutzt Anwendungen aus, die SQL-Abfragen durch Verkettung benutzerseitig eingegebener Daten ohne ordnungsgemäße Bereinigung oder parametrisierte Abfragen erstellen. Das Einschleusen von ' OR '1'='1 in ein Login-Feld kann beispielsweise die Passwortprüfung umgehen, wenn die Abfrage per String-Verkettung aufgebaut wird. SQL-Injection-Schwachstellen betreffen Anwendungen, die auf MySQL, PostgreSQL, Microsoft SQL Server, SQLite und Oracle basieren. Gegenmaßnahmen umfassen vorbereitete Statements mit parametrisierten Abfragen, Eingabevalidierung, gespeicherte Prozeduren, das Prinzip des minimalen Datenbankprivilegs und Web Application Firewalls (WAF). Moderne KI-gestützte Code-Review-Tools auf Basis von Anthropics Claude und OpenAIs GPT-4 können SQL-Injection-Muster automatisch während des Code-Reviews erkennen. Bei Context Studios wenden wir KI-gestützte Sicherheitsscans — einschließlich Claude Code Sicherheitsanalyse — an, um SQL-Injection-Schwachstellen in Kunden-Codebasen als Teil unseres KI-Sicherheitsreview-Services zu identifizieren und zu beheben.

Konzept entdecken

Inference & Engineering

Structured AI Workflow (Strukturierter KI-Workflow)

Ein Structured AI Workflow (strukturierter KI-Workflow) ist ein klar definierter, reproduzierbarer Ablaufrahmen, der beschreibt, wie KI-Modelle und Agenten innerhalb einer Anwendung strukturiert zusammenarbeiten. Im Gegensatz zu improvisierten Prompt-Ketten oder unkontrollierten Agenten-Dialogen legt ein Structured AI Workflow explizite Schritte, Eingabebedingungen, Übergabepunkte, Validierungsregeln und Ausgabeformate fest – ähnlich einem Software-Build-Prozess oder einer CI/CD-Pipeline. Ein typischer Structured AI Workflow umfasst Komponenten wie kontextkontrollierte System-Prompts, definierte Tool-Calls, Kontextbudgets, Abbruchbedingungen und Ausgabeschemata. Jeder Schritt kann eigenständig getestet, beobachtet und bei Bedarf manuell übersteuert werden. Das ermöglicht eine präzise Fehlersuche und sorgt für nachvollziehbare, konsistente Ergebnisse. Structured AI Workflows sind der Kern moderner KI-Engineering-Praxis. Sie bilden die Brücke zwischen einfachen LLM-Anfragen und produktionstauglichen, wartbaren KI-Systemen. Teams, die strukturierte Workflows einsetzen, erreichen deutlich kürzere Debugging-Zyklen, eine bessere Dokumentation und können ihre KI-Lösungen schrittweise auf Enterprise-Niveau skalieren. Im Unternehmenskontext bilden strukturierte KI-Workflows das Fundament für compliance-konforme Automatisierung: Jeder Prozessschritt ist nachweisbar, auditierbar und lässt sich bei regulatorischen Anforderungen gezielt einschränken oder erweitern.

Konzept entdecken

Inference & Engineering

Structured Outputs

LLM-Feature für garantiert valides JSON gemäß einem Schema. Eliminiert Parsing-Fehler und ermöglicht zuverlässige Tool-Integration. OpenAI (response_format), Anthropic (tool_choice) und Google (response_schema) bieten native Unterstützung. Kritisch für Produktions-Pipelines, wo unstrukturierte Ausgaben Workflows brechen.

Konzept entdecken

Agentic Business

Sub-Agent

Ein KI-Agent, der von einem Hauptagenten gestartet wird, um eine spezifische Teilaufgabe zu erledigen, beispielsweise die Diagnose und Behebung eines Laufzeitfehlers. In Claude Code /loop-Workflows erkennt die Hauptschleife ein Problem und startet einen Sub-Agenten zur autonomen Lösung.

Konzept entdecken

Inference & Engineering

SWE-bench

SWE-bench ist ein standardisierter Benchmark zur Bewertung der Fähigkeit von KI-Systemen, reale Software-Engineering-Aufgaben zu lösen. Der Benchmark besteht aus über 2.000 echten GitHub-Issues aus populären Open-Source-Projekten wie Django, Flask und scikit-learn. Jede Aufgabe enthält eine Problembeschreibung, den zugehörigen Quellcode und automatisierte Tests zur Überprüfung der Lösung. KI-Modelle müssen den Code analysieren, die Ursache des Problems identifizieren und einen funktionierenden Patch generieren — genau wie ein menschlicher Entwickler. SWE-bench hat sich als der wichtigste Maßstab für KI-Coding-Agenten etabliert. Aktuelle Spitzenwerte liegen bei über 80 Prozent (Claude Opus 4.6 erreicht 80,8%), was zeigt, dass KI-Agenten zunehmend in der Lage sind, komplexe Softwareprobleme eigenständig zu lösen. Varianten wie SWE-bench Verified verwenden menschlich validierte Teilmengen für noch zuverlässigere Ergebnisse.

Konzept entdecken

Reasoning & Verlässlichkeit

SWE-bench Verified

Ein Benchmark, der AI-Modelle testet, um reale GitHub-Probleme autonom zu lösen. Die verifizierte Variante verwendet von Menschen validierte Aufgaben für eine zuverlässige Bewertung. Claude Sonnet 4.6 erzielt 79,6 %.

Konzept entdecken

Inference & Engineering

System Prompt (Systemnachricht)

Ein System Prompt (auch Systemnachricht oder Systemanweisung) ist eine versteckte Anweisung, die einem KI-Sprachmodell vor dem eigentlichen Nutzerdialog übergeben wird. Im Gegensatz zu normalen Benutzernachrichten ist der System Prompt für den Endnutzer typischerweise nicht sichtbar und definiert den Verhaltensrahmen, die Persönlichkeit, die Einschränkungen und den Kontext, in dem das Modell antworten soll. In der Praxis enthält ein System Prompt Rollendefinitionen ("Du bist ein Kundenservice-Assistent für..."), Verhaltensregeln ("Antworte immer auf Deutsch", "Vermeide das Thema X"), Kontextinformationen wie Produktkataloge oder Wissensdatenbanken sowie Formatvorgaben für Antwortlänge, Ton und Struktur. Die Qualität eines System Prompts bestimmt maßgeblich, wie verlässlich und konsistent ein KI-Modell in produktiven Einsätzen funktioniert. Ein gut gestalteter System Prompt reduziert Halluzinationen, verhindert das Abdriften von Konversationen und stellt sicher, dass das Modell stets innerhalb definierter Grenzen agiert. Techniken wie Few-Shot-Beispiele und explizite Ausgabeformatierungen werden häufig im System Prompt verankert. Bei agentischen Systemen legt der System Prompt zudem fest, welche Tools ein Agent aufrufen darf, wie er mit Fehlern umgeht und welche übergeordneten Ziele er verfolgt.

Konzept entdecken

Inference & Engineering

Terminal-Bench (KI-Coding-Benchmark)

Terminal-Bench ist ein Bewertungs-Framework für die Leistungsmessung von KI-Coding-Agenten in realen Entwicklungsumgebungen. Im Gegensatz zu klassischen Code-Benchmarks, die nur isolierte Code-Snippets testen, evaluiert Terminal-Bench den gesamten Entwicklungszyklus: Agenten müssen selbstständig Code in einem Terminal ausführen, Fehler debuggen, Dateisysteme navigieren und komplexe Multi-Step-Probleme lösen. Das Framework misst die Fähigkeiten moderner Coding-Agenten wie Claude Code, GitHub Copilot Workspace und ähnlicher Systeme unter realistischen Bedingungen. Mit Terminal-Bench 2.1 – der aktuellen Version – erzielte Anthropics Mythos Preview ein Ergebnis von 92,1 % bei einem 4-Stunden-Timeout, was die bisherige Bestmarke von 82 % deutlich übertrifft. Ein zentrales Merkmal ist die Sensitivität gegenüber Rechenzeit: Je mehr Zeit ein Modell für eine Aufgabe erhält, desto höher ist typischerweise die Lösungsrate. Das zeigt, dass moderne KI-Coding-Agenten häufig keine Fähigkeitslücken haben – sondern Rechenzeit-Limitierungen. Dieser Unterschied ist fundamental für die Praxis: Er beeinflusst, wie Teams KI-gestützte Entwicklungsworkflows planen, budgetieren und skalieren.

Konzept entdecken

Agentic Infrastructure

Test KI-Inferenz

Dies ist eine Testdefinition für KI-Inferenz. KI-Inferenz bezeichnet den Prozess, bei dem ein trainiertes KI-Modell neue Eingabedaten verarbeitet und Vorhersagen oder Ausgaben generiert. Dies ist eine ausreichend lange Definition mit mehreren Sätzen, die den Begriff klar erklärt. Wir beschreiben hier die Grundlagen der KI-Inferenz und ihre Bedeutung für den laufenden Betrieb.

Konzept entdecken

Inference & Engineering

Test-Time Compute Scaling

Test-Time Compute Scaling (auch: Inference-Time Compute Scaling) bezeichnet die Strategie, einem KI-Modell beim Beantworten einer Anfrage mehr Rechenleistung zur Verfügung zu stellen – statt nur beim Training mehr zu investieren. Klassische Sprachmodelle führen für jede Eingabe einen einzigen Vorwärtsdurchlauf durch und liefern direkt eine Ausgabe. Test-Time Compute Scaling bricht mit diesem Prinzip: Das Modell darf mehr Zeit und Ressourcen nutzen, um verschiedene Lösungswege zu erkunden, Zwischenergebnisse zu prüfen oder sich selbst zu korrigieren, bevor es eine finale Antwort produziert. In der Praxis bedeutet das: Bei einfachen Aufgaben reicht ein kurzer Durchlauf; bei komplexen Problemen – etwa mehrstufigem Code-Debugging oder strategischer Analyse – kann das Modell mit längerer Rechenzeit deutlich bessere Ergebnisse erzielen. Eindrücklich belegt wurde dies durch Claude Mythos Preview, das auf Terminal-Bench 2.1 mit einem 4-Stunden-Timeout einen Score von 92,1 % erreichte, während kürzere Timeouts erheblich schlechtere Werte ergaben. Test-Time Compute Scaling ist eng verwandt mit Chain-of-Thought-Reasoning und modernen KI-Agenten-Architekturen: Beide nutzen iteratives Denken zur Qualitätsverbesserung. Für Unternehmen bedeutet dieser Ansatz, dass die 'Intelligenz' eines Modells nicht nur eine feste Eigenschaft ist, sondern durch Ressourceneinsatz gezielt steuerbar wird.

Konzept entdecken

Agentic Infrastructure

Third-party Harness (Drittanbieter-Harness)

Ein Third-party Harness (Drittanbieter-Harness) ist eine Softwarearchitektur, die es externen Entwicklern ermöglicht, KI-Modelle über offizielle APIs oder autorisierte Schnittstellen hinaus zu nutzen und zu erweitern. Der Begriff bezeichnet Frameworks, die als Vermittler zwischen KI-Modellen (wie Claude, GPT oder Gemini) und Endanwendern agieren und dabei zusätzliche Funktionen wie Multi-Modell-Orchestrierung, erweiterte Tool-Integration oder benutzerdefinierte Workflows bereitstellen. Ein bekanntes Beispiel ist OpenClaw, ein Open-Source-Harness, der Anthropics Claude-Modell mit erweiterten Funktionen ausstattet, darunter Hintergrundprozesse, Cron-Jobs und Integration mit externen Tools. Harnesses unterscheiden sich von offiziellen APIs dadurch, dass sie oft Abonnement-basierten Zugang (nicht API-basiert) nutzen und damit kostengünstigere Alternativen für Entwickler bieten, die experimentelle oder produktionsreife KI-Anwendungen bauen möchten. Die Nutzung von Third-party Harnesses wirft wichtige Fragen zur langfristigen Stabilität auf: Anbieter wie Anthropic können den Zugang zu Abonnements jederzeit einschränken, was zu plötzlichen Betriebsunterbrechungen führt. Unternehmen sollten daher Harnesses nur für nicht-kritische Workflows einsetzen oder auf offizielle API-Verträge mit SLA-Garantien migrieren, sobald sie Produktionsreife erreichen.

Konzept entdecken

Agentic Infrastructure

Token Telemetry (Token-Telemetrie)

Token Telemetry bezeichnet das systematische Erfassen, Auswerten und Sichtbarmachen des Token-Verbrauchs in KI-Systemen. Gemessen wird nicht nur, wie viele Tokens ein Prompt oder eine Antwort kostet, sondern auch welcher Agent, welches Werkzeug, welcher Kunde, welche Aufgabe oder welcher Workflow diese Kosten verursacht. In agentischen Anwendungen wird Token Telemetry zur Betriebsmetrik: Sie zeigt, wann Context Windows überlaufen, wann Prompts zu groß werden, welche Schritte unnötige Modellaufrufe auslösen und wo Caching, Modell-Routing oder kürzere Tool-Ergebnisse sparen können. Gute Token Telemetry verbindet Kosten, Latenz, Qualität und Fehlerraten, statt Tokenzahlen isoliert zu betrachten. Teams bekommen dadurch eine belastbare Grundlage für Budgets, Alerts und Review-Gates. Besonders wichtig wird sie bei Multi-Agenten-Setups, weil parallele Agenten ansonsten unbemerkt hohe Inferenzkosten erzeugen können. In der Praxis gehört Token Telemetry in Dashboards, Logs und Deployment-Gates, damit KI-Workflows nicht nur funktionieren, sondern wirtschaftlich, nachvollziehbar und steuerbar bleiben. Für Governance ist die Metrik außerdem ein Frühwarnsignal: plötzliche Token-Spitzen deuten oft auf Prompt-Schleifen, schlechte Retrieval-Treffer oder fehlende Stop-Kriterien hin.

Konzept entdecken

Inference & Engineering

Token Window Management

Die Kunst, den begrenzten Kontext eines LLMs optimal zu nutzen. Umfasst: Token-Budget-Allokation (wie viel für System-Prompt, Tools, Konversation?), Kontext-Kompression, selektives Retrieval und Sliding-Window-Strategien. Bei 200K-Token-Modellen oft wichtiger als bei 8K – mehr Platz führt zu "Context Rot" ohne Management.

Konzept entdecken

Ökonomie & Skalierung

Token-Economics

Das strategische Management von KI-Rechenkosten (Tokens), um skalierbare und kosteneffiziente Leistung in hochvolumigen Anwendungen sicherzustellen.

Konzept entdecken

Agentic Business

Tool Calling (Werkzeugaufruf)

Tool Calling bezeichnet die Fähigkeit von KI-Sprachmodellen, externe Funktionen, APIs oder Dienste gezielt aufzurufen, um Aufgaben zu erfüllen, die über reine Textgenerierung hinausgehen. Statt nur auf trainierten Wissen zu antworten, kann ein Modell mit Tool Calling aktiv auf Echtzeitdaten zugreifen, Code ausführen, Berechnungen durchführen oder externe Systeme steuern. Der Mechanismus funktioniert so: Das Modell empfängt eine Liste verfügbarer Tools mit Beschreibung und Parameter-Schema. Bei Bedarf gibt es einen strukturierten Aufruf zurück, den das Host-System ausführt und dessen Ergebnis an das Modell zurücksendet. Das Modell verarbeitet die Antwort und kann weitere Tools aufrufen oder die finale Antwort generieren. Tool Calling ist eine Grundvoraussetzung für echte KI-Agenten: Erst durch diese Fähigkeit können Modelle mit der Außenwelt interagieren, Workflows automatisieren und komplexe Multi-Step-Aufgaben eigenständig lösen. Moderne Frameworks wie Model Context Protocol (MCP) standardisieren, wie Tools registriert und aufgerufen werden, und machen es einfacher, KI-Systeme mit bestehender Unternehmensinfrastruktur zu verbinden.

Konzept entdecken

Reasoning & Verlässlichkeit

Tool Use

Tool Use im Kontext von AI-Agenten ist die Fähigkeit eines Agenten, externe Werkzeuge und APIs zu nutzen, um Aufgaben zu erfüllen, die über seine inhärenten Fähigkeiten hinausgehen. Dies ermöglicht es AI-Agenten, mit realen Systemen zu interagieren, auf externes Wissen zuzugreifen und komplexe Operationen durchzuführen.

Konzept entdecken

Agentic Business

Tool-Nutzung (KI)

Die Faehigkeit eines KI-Agenten, externe Tools, APIs und Dienste aufzurufen, um Aufgaben ueber die Textgenerierung hinaus zu erledigen. Ein wichtiger Unterschied zwischen einfachen Chatbots und leistungsfaehigen KI-Agenten.

Konzept entdecken

Ökonomie & Skalierung

Usage-Based Pricing (verbrauchsbasierte Abrechnung)

Usage-Based Pricing bezeichnet ein Preismodell, bei dem Kosten direkt nach dem tatsächlichen Ressourcenverbrauch berechnet werden – nicht als Pauschale oder Abonnement. Im KI-Umfeld zahlen Unternehmen für die Anzahl der Token, CPU-Sekunden, API-Aufrufe oder Agent-Tasks, die sie tatsächlich nutzen. Dieses Modell hat durch die Verbreitung großer Sprachmodelle massiv an Bedeutung gewonnen. Im Gegensatz zu Flat-Rate-Preismodellen mit fester Monatsgebühr ist Usage-Based Pricing vorteilhaft für schwankende Nutzungsintensitäten: Startups und Mittelständler zahlen wenig in ruhigen Phasen und skalieren kosteneffizient bei höherer Last. Besonders relevant im Kontext von KI-Agenten: Klassische SaaS-Abonnements waren auf vorhersehbare Human-Nutzung ausgelegt. KI-Agenten führen autonom tausende API-Calls pro Stunde durch – das sprengt Flat-Rate-Kalkulationen. Anbieter wie Anthropic, OpenAI und Google setzen daher durchgängig auf Token-basiertes Usage-Based Pricing. Neuere Modelle experimentieren mit Task-Based Pricing – Bezahlung pro abgeschlossenem Agenten-Task statt pro Token. Für Unternehmen mit KI-Agenten-Implementierungen ist das Monitoring des Usage-Based Pricing entscheidend: Ohne Budget-Caps und Alerting können KI-Agenten in kurzer Zeit erhebliche Kosten verursachen.

Konzept entdecken

Agentic Infrastructure

Vector Databases

Vektor-Datenbanken sind spezialisierte Datenbanken, die entwickelt wurden, um hochdimensionale Vektor-Embeddings zu speichern und effizient abzufragen, die die semantische Bedeutung von Daten repräsentieren. Diese Datenbanken sind entscheidend für Anwendungen wie semantische Suche, Empfehlungssysteme und retrieval-augmented generation.

Konzept entdecken

Agentic Infrastructure

Vektordatenbank

Spezialisierte Datenbank für hochdimensionale Vektoren (Embeddings). Ermöglicht semantische Ähnlichkeitssuche statt exakter Keyword-Matches. Kern-Infrastruktur für RAG, Empfehlungssysteme und multimodale Suche. Führende Lösungen: Pinecone, Weaviate, Qdrant, Chroma, pgvector.

Konzept entdecken

Inference & Engineering

Verbalized Sampling

Eine trainingsfreie Prompting-Strategie zur Überwindung von Mode Collapse. Das Modell wird aufgefordert, eine explizite Wahrscheinlichkeitsverteilung über mehrere mögliche Antworten zu verbalisieren und dann daraus zu samplen. Erhöht die Ausgabevielfalt um 1,6-2,1× ohne Qualitätsverlust.

Konzept entdecken

Inference & Engineering

Vibe Coding

Von Andrej Karpathy im Februar 2025 geprägter Begriff für AI-gestützte Softwareentwicklung, bei der Entwickler sich auf die Vision konzentrieren und KI den Code schreibt. Collins Word of the Year 2025.

Konzept entdecken

Reasoning & Verlässlichkeit

Vibe Coding

Ein Entwicklungsansatz, bei dem KI Code aus übergeordneter menschlicher Anleitung generiert statt aus detaillierten Spezifikationen.

Konzept entdecken

Reasoning & Verlässlichkeit

Vibe Coding

KI-gestuetzte Softwareentwicklung, bei der das gewuenschte Ergebnis in natuerlicher Sprache beschrieben wird und die KI den Code generiert.

Konzept entdecken

Inference & Engineering

Vibe-Coding-Ansatz

Ein Entwicklungsansatz, bei dem Programmierer sich stark auf KI verlassen und Ausgaben mit minimaler Überprüfung akzeptieren — Geschwindigkeit über Verständnis.

Konzept entdecken

Reasoning & Verlässlichkeit

Vision-Language Models

Vision-Language-Modelle (VLMs) sind AI-Modelle, die Computer Vision und natürliche Sprachverarbeitung kombinieren, um Bilder und Text gleichzeitig zu verstehen und zu analysieren. Sie können Aufgaben wie Bildunterschriftenerstellung, visuelle Fragenbeantwortung und cross-modale Retrieval durchführen.

Konzept entdecken

Reasoning & Verlässlichkeit

Vortrainiertes Modell

Ein auf einem grossen Datensatz trainiertes ML-Modell, das fuer spezifische Aufgaben feinabgestimmt werden kann und erhebliche Zeit und Ressourcen im Vergleich zum Training von Grund auf spart.

Konzept entdecken

Agentic Business

Workflow-Orchestrierung (Workflow Orchestration)

Workflow-Orchestrierung bezeichnet die automatisierte Koordination und Steuerung von mehrstufigen Prozessen, bei denen verschiedene KI-Agenten, Tools, APIs und Systeme zusammenarbeiten, um ein übergeordnetes Ziel zu erreichen. Anders als einfache Automatisierung, die lineare Abläufe abbildet, verwaltet ein Orchestrierungssystem die Reihenfolge von Schritten, Fehlerbehandlung, Neuversuche, Parallelausführung und den Zustandsfluss zwischen beteiligten Komponenten. In modernen KI-Systemen umfasst Workflow-Orchestrierung typischerweise die Koordination spezialisierter KI-Agenten, das Management von Toolaufrufen, die Persistenz von Zwischenergebnissen über mehrere Schritte hinweg sowie automatische Fehlerbehandlung mit Fallback-Pfaden. Populäre Frameworks sind n8n, Temporal, Apache Airflow und herstellerspezifische Lösungen wie Anthropic Managed Agents oder LangGraph. Die Wahl des richtigen Orchestrierungsframeworks bestimmt Skalierbarkeit, Wartbarkeit und Kosten eines KI-Systems erheblich. Für produktionsreife KI-Systeme ist professionelle Orchestrierung keine optionale Ergänzung, sondern eine Grundvoraussetzung für zuverlässige, wartbare und skalierbare Agenten-Workflows.

Konzept entdecken

Reasoning & Verlässlichkeit

Xcode

Xcode ist Apples offizielle integrierte Entwicklungsumgebung (IDE) für die Softwareentwicklung auf Apple-Plattformen, einschließlich iOS, macOS, watchOS, tvOS und visionOS. Erstmals 2003 veröffentlicht, bietet Xcode eine umfassende Sammlung von Entwicklungswerkzeugen: einen Code-Editor mit Syntax-Highlighting und Autovervollständigung, einen visuellen Interface-Designer (Interface Builder), ein Build-System, einen Debugger, Performance-Profiling-Tools (Instruments) und einen Simulator zum Testen von Apps auf verschiedenen Apple-Gerätetypen ohne physische Hardware. Xcode verwendet Swift als primäre Programmiersprache – Apples moderne, typsichere Sprache, die 2014 eingeführt wurde – und unterstützt weiterhin Objective-C für Legacy-Codebasen. Entwickler verteilen iOS- und macOS-Anwendungen ausschließlich über Xcodes Integration mit Apples App-Store-Signierung und -Einreichungspipeline. Im Jahr 2025 erweiterte Apple Xcodes KI-Fähigkeiten erheblich und führte agentische Coding-Funktionen ein, die von Large Language Models angetrieben werden und es Xcode ermöglichen, Code autonom zu schreiben, zu refaktorieren und zu testen – vergleichbar mit Anthropics Claude Code und dem Agent-Modus von GitHub Copilot. Dies machte Xcode zu einem wettbewerbsfähigen Akteur im agentischen Coding-Bereich. Xcodes enge Integration mit Apple-Silicon-Optimierung, SwiftUI und dem Apple Developer Program macht es für jedes Team, das native Apple-Plattform-Anwendungen entwickelt, unverzichtbar. Bei Context Studios nutzen wir Xcode mit seinen KI-Funktionen für iOS-Anwendungsentwicklung und haben seine agentischen Fähigkeiten gegenüber GitHub Copilot und Claude Code für mobile Kundenprojekte bewertet.

Konzept entdecken

Vertrauen & Souveränität

Zero Data Retention (ZDR)

Ein Datenschutzstandard, bei dem KI-Anbieter garantieren, dass Nutzerdaten in Echtzeit verarbeitet und sofort gelöscht werden, ohne für das Modelltraining verwendet zu werden.

Konzept entdecken

Reasoning & Verlässlichkeit

Active Parameters

Die Teilmenge der Modellparameter, die während der Verarbeitung eines einzelnen Inputs (Tokens) aktiv ist. Dies ist besonders relevant für Mixture-of-Experts (MoE) Modelle.

Konzept entdecken

Reasoning & Verlässlichkeit

Adaptive Thinking

Adaptive Thinking ist eine Funktion einiger AI-Modelle, die es ihnen ermöglicht, die Tiefe ihres Denkens dynamisch anzupassen, basierend auf der Komplexität der aktuellen Aufgabe. Dies verbessert die Effizienz, indem mehr Rechenleistung für schwierige Probleme bereitgestellt wird, während einfache Anfragen schnell bearbeitet werden.

Konzept entdecken

Agentic Business

Agent HQ

Die Plattform von GitHub zur Orchestrierung mehrerer AI-Coding-Agenten, die es Entwicklern ermöglicht, den besten Agenten für eine bestimmte Aufgabe auszuwählen.

Konzept entdecken

Agentic Business

Agent Loop

Der grundlegende iterative Prozess, den KI-Agenten befolgen: Kontext sammeln, handeln, Ergebnisse überprüfen und wiederholen, bis das Ziel erreicht ist.

Konzept entdecken

Agentic Business

Agent Orchestrator

Zentrale Komponente in Multi-Agent-Systemen, die Aufgaben verteilt, Ergebnisse aggregiert und Agent-Interaktionen koordiniert. Patterns: Hierarchisch (Manager → Worker), Peer-to-Peer (gleichberechtigte Agenten), Hub-and-Spoke. LangGraph, CrewAI und AutoGen bieten Orchestrator-Frameworks. Kritisch für komplexe Workflows mit 3+ Agenten.

Konzept entdecken

Agentic Business

Agent Skills

Modulare Fähigkeiten, die KI-Agenten hinzugefügt werden können und ihnen ermöglichen, spezifische Aufgaben wie Dateiverwaltung, API-Aufrufe oder Datenanalyse durchzuführen. Ein Schlüsselfeature moderner KI-Agent-Architekturen.

Konzept entdecken

Inference & Engineering

Agent-Anweisungsdatei

Eine Konfigurationsdatei (wie AGENTS.md, .cursorrules oder CLAUDE.md), die projektspezifische Richtlinien für KI-Coding-Agenten bereitstellt.

Konzept entdecken

Agentic Business

Agentic Coding

Codierung, die von AI-Agenten durchgeführt wird, oft autonom, um Software basierend auf hochrangigen Anweisungen oder Zielen zu generieren, zu ändern oder zu debuggen.

Konzept entdecken

Agentic Business

Agentic development model

Ein Codierungsmodell, das in der Lage ist, Werkzeuge zu verwenden, einen Computer zu bedienen und längere, End-to-End-Softwareentwicklungsaufgaben mit minimalem menschlichen Eingreifen abzuschließen. Eine Art autonomer Softwareentwicklung.

Konzept entdecken

Inference & Engineering

Agentic SDLC

Die Integration von KI-Agenten in alle Phasen des Software Development Life Cycle – von Anforderungsanalyse über Coding bis Testing und Deployment.

Konzept entdecken

Agentic UX Principles

Agentic UX Principles ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.

Konzept entdecken

Agentic Business

Agentische Entwicklung

Agentische Entwicklung ist ein Software-Entwicklungsansatz, bei dem KI-Agenten autonom Code schreiben, testen und deployen mit minimaler menschlicher Aufsicht. Im Gegensatz zum KI-gestützten Coding (wo Menschen Code mit KI-Vorschlägen schreiben) überlässt agentische Entwicklung KI-Agenten ganze Entwicklungsaufgaben.

Konzept entdecken

Reasoning & Verlässlichkeit

Agentisches Coding

Ein Entwicklungsansatz, bei dem KI-Agenten autonom mehrstufige Coding-Aufgaben ausführen — Code schreiben, testen, Pull Requests überprüfen und iterieren — mit minimaler menschlicher Intervention. Im Gegensatz zur KI-Autovervollständigung beinhaltet agentisches Coding KI, die gesamte Entwicklungs-Workflows planen und ausführen kann.

Konzept entdecken

Agentic Business

AGENTS.md

Ein von OpenAI eingeführter Konventionsstandard – eine Markdown-Datei im Repository, die KI-Agenten Anweisungen zur Navigation und Arbeit in der Codebase gibt.

Konzept entdecken

Agentic Business

AI Agent

Eine autonome Softwareeinheit, die ihre Umgebung wahrnehmen, denken, planen und handeln kann, um spezifische Ziele zu erreichen, ohne ständige menschliche Intervention.

Konzept entdecken

Agentic Business

AI Agent Ecosystem

Das vernetzte Netzwerk von AI-Agenten, Werkzeugen, Protokollen und Infrastrukturen, das die Entwicklung, Bereitstellung und den Betrieb von AI-Agenten ermöglicht.

Konzept entdecken

Reasoning & Verlässlichkeit

AI Super App

Eine einheitliche Plattform, die AI nutzt, um mehrere Funktionen, die typischerweise in separaten Softwareanwendungen zu finden sind, in einer einzigen Schnittstelle zu konsolidieren.

Konzept entdecken

Reasoning & Verlässlichkeit

AI-Assisted Software Development

Die Verwendung von Werkzeugen und Techniken der künstlichen Intelligenz zur Verbesserung und Beschleunigung des Softwareentwicklungsprozesses.

Konzept entdecken

Reasoning & Verlässlichkeit

AI-Native Operating System

Ein AI-natives Betriebssystem ist von Grund auf so konzipiert, dass es AI-Fähigkeiten tief integriert und nutzt, was nahtlosere und intelligentere Interaktionen mit Anwendungen und Daten ermöglicht. Es stellt einen Paradigmenwechsel von traditionellen Betriebssystemarchitekturen dar.

Konzept entdecken

Agentic Business

AI-Powered Workflow Automation

Einsatz von KI in Workflow-Plattformen fuer Reasoning und adaptive Entscheidungsfindung ueber traditionelle Trigger-Action-Muster hinaus.

Konzept entdecken

Agentic Infrastructure

API Deprecation

Der Prozess der schrittweisen Abschaltung einer API (Application Programming Interface), der oft eine Phase umfasst, in der die API noch funktional ist, jedoch mit Warnungen, bevor sie schließlich entfernt wird.

Konzept entdecken

Reasoning & Verlässlichkeit

Apple Foundation Models

Apples proprietäre On-Device-KI-Modelle für datenschutzorientierte Verarbeitung auf iPhones, iPads und Macs. Teil von Apple Intelligence.

Konzept entdecken

Reasoning & Verlässlichkeit

ARC AGI Benchmark

Der ARC AGI Benchmark ist ein Test, der die Fähigkeit von AI-Systemen misst, Probleme zu lösen, die für Menschen einfach, aber für AI äußerst schwierig sind. Er bewertet allgemeine Denk- und Abstraktionsfähigkeiten und stellt Fortschritte in Richtung künstlicher allgemeiner Intelligenz dar.

Konzept entdecken

KI-Sicherheit & Leitplanken

Automated Red-Teaming

Der Einsatz von KI-Modellen, um andere KI-Systeme systematisch anzugreifen und Schwachstellen, Biases oder Sicherheitsrisiken vor der Veröffentlichung zu finden.

Konzept entdecken

Inference & Engineering

Autonome KI-Entwicklung

Ein Entwicklungsansatz bei dem KI-Agenten selbststaendig Code planen schreiben testen und debuggen mit minimaler menschlicher Intervention.

Konzept entdecken

Agentic Business

Autonomous execution

Die Fähigkeit eines AI-Agenten, Aufgaben unabhängig auszuführen und Entscheidungen ohne ständige menschliche Intervention zu treffen.

Konzept entdecken

Agentic Business

autoresearch

Ein KI-gesteuertes autonomes Forschungsframework, bei dem ein Agent selbstständig Machine-Learning-Experimente entwirft, ausführt und auswertet. Der Mensch gibt ein Ziel als Markdown-Prompt an; der Agent schreibt Trainingscode, führt Experimente durch, misst Ergebnisse und iteriert ohne menschliche Eingriffe. Bekannt gemacht von Andrej Karpathy im März 2026 mit einer 630-Zeilen-Python-Implementierung, die 110 autonome LLM-Trainingsiterationen in 12 Stunden produzierte.

Konzept entdecken

Ökonomie & Skalierung

B2B

Business-to-Business — Geschäftsmodell, bei dem Produkte von einem Unternehmen an ein anderes verkauft werden, mit höheren Auftragswerten als B2C.

Konzept entdecken

Agentic Business

Background Agents

KI-Agenten, die asynchron und autonom im Hintergrund arbeiten, ohne dass ein Mensch aktiv auf Antworten warten muss.

Konzept entdecken

Agentic Infrastructure

Bidirectional Communication Layer

Ein Kommunikationssystem, das es ermöglicht, dass Daten in beide Richtungen zwischen zwei Entitäten fließen, wie einem AI-Modell und einer UI-Komponente, und somit Echtzeit-Feedback und Zusammenarbeit ermöglicht.

Konzept entdecken

Ökonomie & Skalierung

Bootstrapping

Aufbau eines Unternehmens mit eigenen Mitteln und Umsätzen statt externer Investitionen. Verbreitet unter Indie-Hackern.

Konzept entdecken

Agentic Business

Browser Integration

Die Fähigkeit eines AI-Agenten oder einer Softwareanwendung, direkt mit einem Webbrowser zu interagieren, um Aufgaben wie Webrecherche, Formularausfüllung und Datenextraktion durchzuführen.

Konzept entdecken

Agentic Infrastructure

Browser-Native AI

AI, die in Browser über Erweiterungen für die Echtzeit-Webinteraktion integriert ist.

Konzept entdecken

Agentic Business

Browser-Native AI Automation

AI-Automatisierung, die direkt in einer Webbrowser-Umgebung läuft und Browser-APIs sowie bestehende Sitzungen nutzt, ohne externe Skripting- oder headless Konfigurationen zu benötigen.

Konzept entdecken

Reasoning & Verlässlichkeit

Chain-of-Thought (CoT)

Eine Technik, bei der KI-Systeme ihre schrittweise logische Herleitung artikulieren, was die Transparenz und Genauigkeit bei komplexen Aufgaben erhöht.

Konzept entdecken

Agentic Infrastructure

Chrome DevTools Protocol (CDP)

Protokoll für die programmgesteuerte Steuerung des Chromium-Browsers.

Konzept entdecken

Agentic Infrastructure

CI/CD-Pipeline

Eine Reihe automatisierter Prozesse zur kontinuierlichen Integration von Codeänderungen (CI) und deren Bereitstellung in Produktionsumgebungen (CD). CI/CD-Pipelines umfassen typischerweise automatisierte Tests, Build- und Deployment-Stufen.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude

Ein AI-Modell von Anthropic, bekannt für komplexes Denken, nuancierte Code-Überprüfungen und Architekturentscheidungen.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Code Agent SDK

Ein Software-Entwicklungskit von Anthropic, das entwickelt wurde, um die Erstellung und Bereitstellung von AI-Agenten zu vereinfachen, speziell zugeschnitten auf die Verwendung mit dem Claude-Modell.

Konzept entdecken

Agentic Business

Claude Cowork

Das Desktop-Automatisierungstool von Anthropic, das auf dem Claude-AI-Modell basiert und entwickelt wurde, um bei verschiedenen Aufgaben direkt vom Computer des Benutzers zu helfen.

Konzept entdecken

Reasoning & Verlässlichkeit

Claude Cowork

Anthropics Desktop-Automatisierung, die Claude ermöglicht, den Bildschirm des Nutzers zu beobachten und damit zu interagieren. Anfang 2026 gestartet.

Konzept entdecken

Agentic Business

Claude Cowork plug-ins

Branchenspezifische AI-Tools, die von Anthropic entwickelt wurden, um professionelle Arbeitsabläufe in Bereichen wie rechtlicher und finanzieller Analyse sowie Unternehmensoperationen zu automatisieren.

Konzept entdecken

Ökonomie & Skalierung

Claude Partner Network

Das Claude Partner Network ist Anthropics offizielles Partnerprogramm fuer Unternehmen und Agenturen, die Claude-basierte KI-Loesungen entwickeln, implementieren und vermarkten. Partner erhalten Zugang zu exklusiven Ressourcen, technischem Support, Go-to-Market-Unterstuetzung und in einigen Faellen bevorzugten API-Konditionen. Das Netzwerk ist in Tiers organisiert, die typischerweise nach Umsatz, Kompetenz und strategischer Ausrichtung differenziert werden: Technologie-Partner (die Claude in ihre eigenen Produkte integrieren), Service-Partner (die Claude-Implementierungen fuer Endkunden durchfuehren), und strategische Partner (tiefe technische Integration und gemeinsame Go-to-Market-Aktivitaeten). Vorteile der Partnerschaft umfassen: fruehzeitigen Zugang zu neuen Modellversionen und Beta-Features, Co-Marketing-Moeglichkeiten auf Anthropics Website und Events, technische Unterstuetzung fuer Implementierungsfragen, und in manchen Faellen guenstigere API-Preiskonditionen ab bestimmten Volumensschwellen. Das Claude Partner Network spiegelt Anthropics Strategie wider, ein Oekosystem von spezialisierten Implementierungspartnern aufzubauen, aehnlich wie Salesforce, Workday oder SAP ihre Partner-Oekosysteme entwickelt haben. Fuer AI-native Agenturen wie Context Studios sind solche Partnerschaften wichtige strategische Positionierungen.

Konzept entdecken

Agentic Infrastructure

CLAUDE.md

Eine projektbezogene Konfigurationsdatei für Claude Code, die persistente Kontexte, Anweisungen und Regeln bereitstellt, die der KI-Agent zu Beginn jeder Sitzung liest, um Projektkonventionen und Anforderungen zu verstehen.

Konzept entdecken

Agentic Business

CLI Coding Agent

Ein AI-gestütztes Tool, das über eine Befehlszeilenschnittstelle (CLI) arbeitet, um autonom Code zu generieren und zu verwalten.

Konzept entdecken

Agentic Business

CLI-Coding-Agent

Ein KI-Coding-Agent, der ueber die Kommandozeile gesteuert wird und Programmieraufgaben im Terminal automatisiert.

Konzept entdecken

Agentic Business

Clinical Documentation Agent (CDA)

Ein AI-Agent, der entwickelt wurde, um die Erstellung medizinischer Dokumentationen zu automatisieren, indem strukturierte Daten aus Arzt-Patienten-Gesprächen extrahiert und elektronische Gesundheitsakten ausgefüllt werden.

Konzept entdecken

Agentic Business

Codex App

Die macOS-Desktopanwendung von OpenAI zur Verwaltung und Orchestrierung mehrerer AI-Coding-Agenten.

Konzept entdecken

KI-Sicherheit & Leitplanken

Cognitive Offloading

Die Strategie, routinemäßige Denkarbeit an KI-Systeme zu delegieren, um menschliche Kapazität für strategische und kreative Aufgaben freizusetzen.

Konzept entdecken

Agentic Business

Computer Use

Die Fähigkeit von KI-Modellen, Standard-Softwareoberflächen wie ein Mensch zu bedienen – Cursor bewegen, klicken und tippen in Anwendungen ohne API.

Konzept entdecken

KI-Sicherheit & Leitplanken

Constitutional AI

Eine Methode, KI-Modellen feste Regeln oder eine 'Verfassung' zu geben, um sicherzustellen, dass sie auch ohne menschliche Überwachung hilfreich und ehrlich agieren.

Konzept entdecken

Reasoning & Verlässlichkeit

Context Compaction

Context Compaction ist der Prozess, bei dem die Größe des Kontextfensters eines Sprachmodells reduziert wird, während relevante Informationen erhalten bleiben, was längere und stabilere Sitzungen ermöglicht. Es erlaubt AI-Systemen, längere Gespräche zu führen, ohne kritischen Kontext zu verlieren.

Konzept entdecken

Agentic Business

Context Fork

Ein Mechanismus zur Erstellung isolierter Ausfuehrungsumgebungen innerhalb eines KI-Agenten gegen Kontextverschmutzung zwischen Skills.

Konzept entdecken

Inference & Engineering

Context Rot

Der schleichende Verfall der Relevanz von Kontextinformationen in langen KI-Konversationen, wenn frühere Anweisungen durch neuere überschrieben oder vergessen werden.

Konzept entdecken

Reasoning & Verlässlichkeit

Context Rot

Die Verschlechterung der KI-Modellleistung wenn das Kontextfenster mit irrelevanten veralteten oder widersprüchlichen Informationen gefuellt wird.

Konzept entdecken

Reasoning & Verlässlichkeit

Context Window

Die maximale Menge an Text (gemessen in Tokens), die ein großes Sprachmodell in einer einzigen Interaktion verarbeiten kann. Größere Kontextfenster ermöglichen es Modellen, längere Dokumente zu verarbeiten und mehr Gesprächsverlauf zu behalten.

Konzept entdecken

Inference & Engineering

Context Window Optimization

Die Optimierung des Kontextfensters umfasst Techniken zur Maximierung der effektiven Nutzung des Kontextfensters eines Sprachmodells, einschließlich strategischer Aufforderungsstrukturierung, Abrufaugmentation und Kontextpruning, um Informationen zu verarbeiten, die die nativen Grenzen überschreiten.

Konzept entdecken

Reasoning & Verlässlichkeit

Context: Fork

Ein Mechanismus zur Schaffung isolierter Ausführungsumgebungen innerhalb eines AI-Agenten, der eine Kontextverschmutzung zwischen verschiedenen Fähigkeiten oder Aufgaben verhindert.

Konzept entdecken

Reasoning & Verlässlichkeit

Copilot Pro+

Copilot Pro+ ist GitHubs Premium-KI-Coding-Abonnement, das Zugang zu erweiterten Funktionen wie Agent HQ, Multi-Agent-Support und unbegrenzter Copilot-Nutzung bietet. Es richtet sich an professionelle Entwickler, die das vollständige KI-gestützte Entwicklungserlebnis benötigen.

Konzept entdecken

Agentic Business

Critic Layer

Eine Validierungskomponente in Multi-Agenten-KI-Systemen, die die Befunde einzelner Agenten gegeneinander prüft, bevor sie dem Nutzer präsentiert werden. In Claude Code Review sorgt die Critic-Schicht für Konsistenz der Befunde und reduziert False Positives, bevor Kommentare in GitHub gepostet werden.

Konzept entdecken

Reasoning & Verlässlichkeit

Custom GPTs

Custom GPTs sind personalisierte Versionen von ChatGPT, die Nutzer ohne Programmierung für spezifische Aufgaben erstellen können. Von OpenAI im November 2023 eingeführt, ermöglichen sie benutzerdefinierte Anweisungen, Wissensdateien und spezifische Fähigkeiten. Mit der Einstellung von GPT-4o wurden viele darauf basierende Custom GPTs automatisch auf neuere Modelle migriert.

Konzept entdecken

Vertrauen & Souveränität

Dangerously Skip Permissions

Ein Claude Code Flag (`--dangerously-skip-permissions`), das die standardmäßigen Bestätigungsaufforderungen vor der Tool-Nutzung deaktiviert. Nur sicher auf dedizierten, isolierten Maschinen (wie einem VPS, der speziell für agentische Aufgaben bereitgestellt wurde), wo der mögliche Schaden eines unkontrollierten Prozesses auf diesen Server beschränkt ist und die primäre Entwicklungsumgebung nicht betrifft.

Konzept entdecken

Reasoning & Verlässlichkeit

Data

Rohdaten, die unorganisiert sind und verarbeitet werden müssen. Daten können etwas Einfaches und scheinbar Zufälliges und Nützliches sein, bis sie organisiert sind. Wenn Daten verarbeitet, organisiert, strukturiert oder in einem bestimmten Kontext präsentiert werden, um nützlich zu sein, werden sie Informationen genannt.

Konzept entdecken

Reasoning & Verlässlichkeit

Data Scientist

Ein Fachmann, der statistische Methoden, maschinelles Lernen und Datenvisualisierungstechniken verwendet, um große Datensätze zu analysieren und umsetzbare Erkenntnisse zu gewinnen.

Konzept entdecken

Reasoning & Verlässlichkeit

Deep Think Mode

Deep Think Mode ist ein core AI technology-Konzept in modernen KI-Systemen, das grundlegende technische Fähigkeiten moderner KI-Anwendungen repräsentiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die richtige Technologiewahl Anwendungsleistung und -fähigkeiten direkt bestimmt.

Konzept entdecken

Vertrauen & Souveränität

Differential Privacy for ML

Differential Privacy für ML ist ein mathematisches Konzept, das formale Garantien über die Privatsphäre von Individuen bietet, deren Daten im maschinellen Lernen verwendet werden. Es stellt sicher, dass die Ausgaben des Modells keine sensiblen Informationen über ein bestimmtes Trainingsbeispiel offenbaren.

Konzept entdecken

Reasoning & Verlässlichkeit

DOM State

Der aktuelle Zustand und die Daten, die im Document Object Model (DOM) einer Webseite dargestellt sind, spiegeln die Struktur, den Inhalt und das Styling der angewendeten Elemente wider.

Konzept entdecken

Inference & Engineering

DPO (Direct Preference Optimization)

Eine effizientere Alternative zu RLHF, die den separaten Reward-Model-Schritt eliminiert. Trainiert das Modell direkt auf Präferenzpaaren. Einfacher zu implementieren, kann aber ebenfalls Mode Collapse verursachen, wenn Trainingsdaten Typicality Bias enthalten.

Konzept entdecken

Inference & Engineering

Dual-Model Coding

Dual-Model Coding ist ein KI-gestütztes Entwicklungsmuster, bei dem zwei Sprachmodelle mit komplementären Stärken am selben Codebase zusammenarbeiten. Ein Reasoning-Modell (Claude Opus 4.6, GPT-5) übernimmt Architekturentscheidungen und Code-Review, während ein schnelles Modell (Gemini 3.1 Flash, Claude Haiku) für Code-Generierung und Tests zuständig ist. Kein einzelnes Modell exzelliert in allem. Durch aufgabenbasiertes Routing erreichen Teams sowohl Qualität als auch Geschwindigkeit. Ein Opus-Workflow kostet ca. 10x mehr pro Token als Flash. Ein Dual-Model-Setup erreicht 80-90% der Qualität bei 20-30% der Kosten.

Konzept entdecken

Agentic Infrastructure

Edge AI Deployment

Edge AI Deployment bezieht sich auf das Ausführen von KI-Modellen auf Edge-Geräten, die nahe am Ort der Datenerzeugung liegen, anstatt in einer zentralisierten Cloud-Infrastruktur. Dies reduziert die Latenz, den Bandbreitenverbrauch und ermöglicht Echtzeit-KI-Anwendungen in IoT, Robotik und mobilen Geräten.

Konzept entdecken

Agentic Infrastructure

Edge Functions

Serverlose Funktionen am Netzwerkrand, naeher am Nutzer, fuer geringere Latenz und schnellere Antwortzeiten.

Konzept entdecken

Reasoning & Verlässlichkeit

Effort Controls

Effort Controls sind Mechanismen, die es Entwicklern ermöglichen, die Intelligenz, Latenz und Kosten eines KI-Modells für verschiedene Anwendungsfälle anzupassen. Sie bieten eine feinkörnige Kontrolle über den Kompromiss zwischen Antwortqualität und Rechenressourcen.

Konzept entdecken

Agentic Infrastructure

Electronic Health Record (EHR)

Eine digitale Version der Patientenakte, die deren medizinische Vorgeschichte, Diagnosen, Medikamente und andere relevante Informationen enthält.

Konzept entdecken

KI-Sicherheit & Leitplanken

Eval-Integritaet

Eval-Integritaet (Evaluation Integrity) bezeichnet das Prinzip und die Praxis, sicherzustellen, dass Evaluierungen von KI-Modellen und -Systemen fair, unverzerrt, reproduzierbar und aussagekraeftig sind. Es ist eine Antwort auf die zunehmenden Probleme mit Benchmark-Kontaminierung, Gaming von Metriken und irreführenden Leistungsvergleichen. Kernelemente der Eval-Integritaet umfassen: Datenisolation (Testsets werden streng von Trainingsdaten getrennt), Reproduzierbarkeit (Evaluierungen koennen unabhaengig wiederholt werden), Aufgabenrelevanz (Benchmarks messen Faehigkeiten, die fuer reale Anwendungsfaelle relevant sind), und Transparenz (Evaluierungsmethoden, Datensaetze und Ergebnisse werden veroeffentlicht). Praktische Massnahmen zur Sicherstellung von Eval-Integritaet: Verwendung privater oder dynamisch generierter Testsets, blind Evaluierung (das Modell weiss nicht, ob es bewertet wird), adversariale Tests (bewusst herausfordernde Eingaben), A/B-Evaluierung im Live-System mit echten Nutzern, und regelmassige Rotation der Evaluierungs-Benchmarks. Eval-Integritaet ist besonders wichtig in Unternehmenskontexten, wo die Wahl eines KI-Modells erhebliche Investitionsentscheidungen nach sich zieht. Unternehmen sollten nicht blind auf publizierte Benchmark-Rankings vertrauen, sondern eigene task-spezifische Evaluierungen auf representativen Produktionsdaten durchfuehren.

Konzept entdecken

Reasoning & Verlässlichkeit

Federated Learning

Federated Learning ist ein Ansatz im maschinellen Lernen, bei dem Modelle über dezentrale Geräte oder Server trainiert werden, die lokale Datenproben halten, ohne rohe Daten auszutauschen. Dies bewahrt die Privatsphäre und ermöglicht die kollaborative Verbesserung von Modellen.

Konzept entdecken

Reasoning & Verlässlichkeit

Fennec (Codename)

Der interne Codename für Anthropics Claude Sonnet 5 Modell, das der Tradition folgt, Tiernamen für die Modellentwicklung zu verwenden. Der Fennek ist bekannt für seine Agilität und scharfen Sinne.

Konzept entdecken

Agentic Infrastructure

Fleet Management (Code)

Ein Framework zur gleichzeitigen Anwendung von Code-Aenderungen ueber eine grosse Anzahl von Repositories, das effizientes Management grosser Codebasen ermoeglicht.

Konzept entdecken

Vertrauen & Souveränität

Full System Access

Das Maß an Berechtigungen, das einem KI-Assistenten gewährt wird, um mit dem Betriebssystem und der Hardware eines Computers zu interagieren, einschließlich der Ausführung von Befehlen, der Verwaltung von Dateien und der Steuerung von Geräten.

Konzept entdecken

Reasoning & Verlässlichkeit

Gemini 3 Flash

Eine spezifische Version oder ein Modell der Google Gemini AI-Familie, bekannt für seine Geschwindigkeit (Antwortzeiten unter 500 ms) und das große Kontextfenster (1M Tokens).

Konzept entdecken

Reasoning & Verlässlichkeit

Gemini 3 Flash

Googles geschwindigkeitsoptimiertes KI-Modell mit niedriger Latenz und grossen Kontextfenstern fuer Echtzeit-Anwendungen.

Konzept entdecken

Reasoning & Verlässlichkeit

Gemini 3 Pro

Ein großes Sprachmodell (LLM), das von Google entwickelt wurde und für seine Kohärenz in mehrstufigen Denkprozessen hervorgehoben wird.

Konzept entdecken

Reasoning & Verlässlichkeit

Google Gemini

Eine Familie von AI-Modellen, die von Google entwickelt wurden, die für eine Vielzahl von Aufgaben wie Textgenerierung, Codierung und multimodale Verarbeitung konzipiert sind.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-4o

Ein großes Sprachmodell (LLM), das von OpenAI erstellt wurde. GPT-4o ist eine multimodale Konversations-KI, die für ihren Gesprächsstil und die Benutzerwahrnehmung von Wärme bekannt ist.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5

Eine hypothetische oder zukünftige Iteration der GPT (Generative Pre-trained Transformer) Serie von großen Sprachmodellen, die von OpenAI entwickelt wurden.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5.2

Das neueste große Sprachmodell von OpenAI, das Anfang 2026 veröffentlicht wurde, mit wesentlichen Verbesserungen in den Bereichen Codierung, Logik und multimodale Fähigkeiten.

Konzept entdecken

Reasoning & Verlässlichkeit

GPT-5.2-Codex

Eine spezialisierte GPT-5.2-Variante, die für die Codegenerierung, das Debugging und die Softwareentwicklung optimiert ist.

Konzept entdecken

Agentic Business

GPT-5.3-Codex

Das fortschrittliche Codierungsmodell von OpenAI, eine Iteration der GPT-Serie, die speziell für die Codegenerierung und den Abschluss längerer, durchgängiger Codierungsaufgaben mit agentischen Fähigkeiten entwickelt wurde.

Konzept entdecken

Vertrauen & Souveränität

GraphRAG

Eine fortschrittliche Retrieval-Methode, die Wissensgraphen nutzt, um der KI zu helfen, komplexe Beziehungen und Kontexte in großen Datensätzen besser zu verstehen als herkömmliche Suchen.

Konzept entdecken

Reasoning & Verlässlichkeit

Grok 4

Ein großes Sprachmodell (LLM), das von xAI entwickelt wurde und für sein fortgeschrittenes Denken und seine Leistung bekannt ist.

Konzept entdecken

Agentic Business

GSD-Framework

Das GSD-Framework (Get Shit Done) ist ein spezifikationsgesteuertes System für KI-Agenten auf Claude Code. Nutzt 50 Markdown-Dateien, 6 Slash-Befehle und 2 Hooks zur Orchestrierung vollständiger Entwicklungs-Workflows.

Konzept entdecken

Agentic Business

Hook

Ein Mechanismus in Claude Code zur Auslösung von Aktionen basierend auf spezifischen Ereignissen oder Bedingungen innerhalb des Systems.

Konzept entdecken

Reasoning & Verlässlichkeit

Hook-System

Ein ereignisgesteuerter Mechanismus in der Plugin-Architektur von Claude Code der es Plugins ermoeglicht das Verhalten an bestimmten Punkten im Workflow abzufangen und zu modifizieren.

Konzept entdecken

Agentic Business

Horizontale Verbindung (KI)

Die Verbindung zwischen KI-Agenten für Kommunikation und Zusammenarbeit. ACP deckt diese Dimension ab.

Konzept entdecken

Reasoning & Verlässlichkeit

Hot-Reload-Entwicklung

Ein Entwicklungsworkflow, bei dem Codeaenderungen sofort ohne Neustart der Anwendung angewendet werden.

Konzept entdecken

Agentic Business

Human-AI Collaboration Design

Der Prozess der Gestaltung von Systemen und Arbeitsabläufen, die es Menschen und KI ermöglichen, effektiv zusammenzuarbeiten, mit Fokus auf Benutzerfreundlichkeit, Vertrauen und gemeinsame Ziele.

Konzept entdecken

Reasoning & Verlässlichkeit

Hybrid Attention

Ein Aufmerksamkeitsmechanismus, der verschiedene Arten von Aufmerksamkeitsmechanismen (z. B. gated attention und delta net) kombiniert, um die Stärken jedes einzelnen zu nutzen und die Leistung zu verbessern.

Konzept entdecken

Reasoning & Verlässlichkeit

Imagen 3

Googles DeepMind Text-zu-Bild KI-Modell der dritten Generation, das Google Whisk antreibt und für hohen Fotorealismus und kreative Genauigkeit bei der Bildgenerierung bekannt ist.

Konzept entdecken

Reasoning & Verlässlichkeit

Imagen 3

Googles DeepMind Text-zu-Bild KI-Modell der dritten Generation das Google Whisk antreibt und fuer hohen Fotorealismus und kreative Genauigkeit bekannt ist.

Konzept entdecken

Agentic Infrastructure

Inference Scaling

Inference Scaling ist der Prozess der Optimierung der Bereitstellung von KI-Modellen, um eine wachsende Anzahl von Inferenzanfragen oder steigenden Datenvolumina zu bewältigen. Dies umfasst Techniken wie Modellparallelismus, verteiltes Rechnen und Hardwarebeschleunigung, um die Leistung aufrechtzuerhalten und die Latenz zu minimieren.

Konzept entdecken

Inference & Engineering

Inference-Time Compute

Inference-Time Compute ist ein AI engineering-Konzept in modernen KI-Systemen, das die Entwicklung und Wartung KI-gestützter Systeme verbessert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Software-Qualität und Entwicklungsgeschwindigkeit direkt Geschäftsergebnisse beeinflussen.

Konzept entdecken

Agentic Infrastructure

Inferenz-Optimierung

Inferenz-Optimierung umfasst alle Techniken und Strategien, die eingesetzt werden, um die Performance (Latenz, Durchsatz) und/oder die Kosteneffizienz von KI-Inferenz-Systemen zu verbessern, ohne die Qualitaet der generierten Ausgaben signifikant zu beeintraechtigten. Die wichtigsten Optimierungsebenen sind: (1) Modell-Ebene: Quantisierung (Reduzierung der numerischen Praezision von FP16 auf INT8 oder FP4), Pruning (Entfernung wenig wichtiger Modell-Gewichte), Destillation (Training kleinerer Modelle auf Outputs groesserer); (2) Serving-Ebene: Continuous Batching (dynamisches Zusammenfassen von Anfragen), KV-Cache-Optimierung, Page-Attention (effiziente Speicherverwaltung fuer Kontext); (3) Hardware-Ebene: Tensorparallelismus, Flash-Attention, Kernel-Fusion; (4) System-Ebene: Speculative Decoding, Model Routing, Caching. Speculative Decoding ist besonders bemerkenswert: Ein kleines "Draft-Modell" generiert mehrere Token-Kandidaten, die ein groesseres "Verifier-Modell" dann in einem einzigen Pass validiert oder verwirft. Bei gutem Draft-Modell kann dies die effektive Generation-Geschwindigkeit um 2-4x erhoehen. Frameworks wie vLLM, TensorRT-LLM, und DeepSpeed-Inference haben sich als Standard fuer optimiertes Serving etabliert. Sie implementieren viele dieser Techniken automatisch und koennen gegenueber nativem HuggingFace-Serving 10-20x besseren Durchsatz erzielen.

Konzept entdecken

Ökonomie & Skalierung

Inferenzkosten

Inferenzkosten bezeichnen die finanziellen Aufwendungen beim Betrieb eines KI-Modells — Kosten für die Verarbeitung jeder einzelnen Nutzeranfrage. Im Gegensatz zu Trainingskosten (einmalig, sehr hoch) fallen Inferenzkosten kontinuierlich an und stellen im laufenden Betrieb den größten KI-Kostenfaktor dar. Inferenzkosten werden typischerweise in Preis pro Token berechnet. Stand 2026: GPT-4o ca. $2–5/M Input-Tokens und $8–15/M Output-Tokens; Claude Sonnet $3/M Input, $15/M Output; günstigere Modelle wie Claude Haiku oder Gemini Flash $0,25–1/M Tokens. Output-Tokens sind teurer als Input-Tokens (wegen des Generierungsaufwands), weshalb kosteneffiziente Systeme Output-Längen aktiv optimieren. Kostentreiber: Modellgröße (mehr Parameter = höhere Kosten), Kontextlänge (längere Kontexte erhöhen Input-Token-Kosten überproportional), Output-Länge, Hardware des Anbieters, Peak-vs-Off-Peak-Nutzung und Lizenzmodell (API vs. self-hosted). Seit 2023 sind Inferenzkosten um über 100× gesunken — GPT-4-äquivalente Leistung kostet heute ~1% des 2023-Preises. Dieser Trend hält mit Blackwell und Vera Rubin an. Kostenoptimierung: Model-Routing (günstige Modelle für einfache Tasks), Batch-Inferenz (50–75% Rabatt), Prompt-Optimierung (kürzere Outputs anfordern), Caching häufiger Anfragen.

Konzept entdecken

Vertrauen & Souveränität

Injection Breakthroughs

Fälle, in denen bösartiger oder unbeabsichtigter externer Inhalt, der in eine Eingabeaufforderung eingefügt wird, es schafft, Sicherheitsmechanismen zu umgehen und das Verhalten des LLM auf unerwünschte Weise zu beeinflussen.

Konzept entdecken

Vertrauen & Souveränität

Instruction/Data Separation

Trennung von vertrauenswürdigen Anweisungen und nicht vertrauenswürdigen Daten.

Konzept entdecken

Ökonomie & Skalierung

Intelligent LLM Routing

Intelligent LLM Routing ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.

Konzept entdecken

Intent-Based Navigation

Intent-Based Navigation ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.

Konzept entdecken

Reasoning & Verlässlichkeit

Interactive UI Components

Funktionale Benutzeroberflächenelemente (z. B. Schaltflächen, Schieberegler, Formulare, Dashboards), die es Benutzern ermöglichen, direkt mit Daten zu interagieren und diese zu manipulieren oder Aktionen innerhalb einer Anwendung oder KI-Konversation auszulösen.

Konzept entdecken

Reasoning & Verlässlichkeit

iOS

Apples mobiles Betriebssystem, das hauptsächlich auf iPhones und iPads verwendet wird.

Konzept entdecken

Inference & Engineering

Jahresumsatz (ARR)

Eine SaaS-Kennzahl, die den wiederkehrenden Umsatz über 12 Monate misst. Claude Code erreichte im Februar 2026 einen ARR von 2,5 Milliarden Dollar — die schnellste Wachstumskurve in der Geschichte der Entwickler-Tools.

Konzept entdecken

Reasoning & Verlässlichkeit

JSON Mode

JSON Mode bezieht sich auf die Fähigkeit eines Sprachmodells, seine Ausgabe in einem strukturierten JSON-Format bereitzustellen. Dies ist nützlich für Anwendungen, die eine programmgesteuerte Interaktion mit KI erfordern, und ermöglicht ein einfaches Parsen und die Integration der Modellantworten in Softwaresysteme.

Konzept entdecken

Agentic Infrastructure

JSON-RPC

Ein Remote-Procedure-Call-Protokoll, das JSON zur Datenserialisierung verwendet. Kernkommunikationsmethode in MCP.

Konzept entdecken

Ökonomie & Skalierung

KI-Adoptionskluft

Die organisatorische und gesellschaftliche Spaltung zwischen frühen KI-Anwendern mit kumulativen Vorteilen und späten Anwendern, die zunehmend zurückfallen.

Konzept entdecken

Agentic Business

KI-Agent-Tools

Funktionen, APIs oder externe Ressourcen, die ein KI-Agent nutzen kann, um ueber reine Textgenerierung hinaus zu agieren.

Konzept entdecken

Agentic Business

KI-Agenten-Ökosystem

Ein Netzwerk vernetzter KI-Agenten, Tools, Plattformen und Standards. Umfasst Protokolle wie MCP und ACP.

Konzept entdecken

Ökonomie & Skalierung

KI-Augmentation

Der Einsatz von KI, um die Fähigkeiten eines bestehenden Teams zu erweitern — sie in die Lage zu versetzen, mehr zu leisten, schwierigere Probleme anzugehen und schneller zu liefern — ohne die Mitarbeiterzahl zu reduzieren.

Konzept entdecken

KI-Sicherheit & Leitplanken

KI-Firewall

Sicherheitssysteme, die KI-Eingaben und -Ausgaben in Echtzeit überwachen, um Prompt Injections, Datenexfiltration und Policy-Verletzungen zu verhindern.

Konzept entdecken

Inference & Engineering

KI-generierte technische Schulden

Technische Schulden durch das Akzeptieren von KI-Code ohne angemessene Überprüfung, Tests oder Verständnis — führt zu Wartungsproblemen und Sicherheitsrisiken.

Konzept entdecken

Ökonomie & Skalierung

KI-nativ

Ein Unternehmen oder eine Organisation, die ihre Abläufe grundlegend um KI herum umstrukturiert hat und KI-gesteuerte Automatisierung über traditionelle Prozesse stellt. KI-nativ zu werden bedeutet mehr als KI-Tools zu nutzen — es ist ein strategischer Wandel, bei dem KI Einstellungsentscheidungen, Produktentwicklung und Personalplanung prägt.

Konzept entdecken

Ökonomie & Skalierung

KI-Preis-Disruption

Die Marktverschiebung durch Open-Source-KI-Modelle, die wettbewerbsfähige Leistung zu drastisch niedrigeren Kosten bieten und proprietäre KI-Unternehmen zum Umdenken zwingen.

Konzept entdecken

Ökonomie & Skalierung

KI-Talentpool

Die verfuegbare Belegschaft von Fachkraeften mit KI- und ML-Kenntnissen in einer Region. Ein kritischer Faktor fuer den Erfolg von KI-Startups.

Konzept entdecken

Reasoning & Verlässlichkeit

Lang-Kontext-Modell

Ein KI-Sprachmodell, das sehr große Eingabesequenzen verarbeiten kann, was die Analyse ganzer Codebasen oder langer Dokumente ohne Kontextverlust ermöglicht.

Konzept entdecken

Agentic Infrastructure

LLM-as-a-Judge Evaluations

LLM-as-a-Judge Evaluations ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.

Konzept entdecken

llms.txt

Ein von Jeremy Howard initiierter Standard – eine strukturierte Textdatei im Root-Verzeichnis einer Website, die LLMs optimierte Informationen über die Website bereitstellt.

Konzept entdecken

Agentic Infrastructure

Local AI Inference

Die Durchführung von AI-Modellvorhersagen direkt auf dem Gerät eines Benutzers, anstatt Daten an Cloud-Server zu senden, bietet Datenschutz, geringere Latenz und keine API-Kosten.

Konzept entdecken

Agentic Infrastructure

Long-Term Memory Layers

Long-Term Memory Layers ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.

Konzept entdecken

Reasoning & Verlässlichkeit

macOS

Das Betriebssystem von Apple für Macintosh-Computer.

Konzept entdecken

Agentic Infrastructure

MCP (Model Context Protocol)

Ein offener Standard von Anthropic, der ein universelles Protokoll für die Verbindung von KI-Modellen mit externen Tools und Datenquellen bereitstellt.

Konzept entdecken

Agentic Infrastructure

MCP Servers

Ein Server, der es Claude Code ermöglicht, sich mit externen Tools und Diensten zu integrieren, wodurch er auf deren Funktionen zugreifen und diese nutzen kann.

Konzept entdecken

Agentic Infrastructure

MCP Tasks (Async)

MCP Tasks (Async) ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.

Konzept entdecken

Reasoning & Verlässlichkeit

Mixture of Experts (MoE)

Mixture of Experts (MoE) ist ein core AI technology-Konzept in modernen KI-Systemen, das grundlegende technische Fähigkeiten moderner KI-Anwendungen repräsentiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die richtige Technologiewahl Anwendungsleistung und -fähigkeiten direkt bestimmt.

Konzept entdecken

Reasoning & Verlässlichkeit

Mixture-of-Experts (MoE)

Eine neuronale Netzwerkarchitektur, die mehrere 'Experten'-Subnetzwerke verwendet. Während der Inferenz wird nur eine ausgewählte Teilmenge dieser Experten aktiviert, was eine große Modellkapazität bei reduzierten Rechenkosten ermöglicht.

Konzept entdecken

Reasoning & Verlässlichkeit

ML Engineer

Ein Software-Ingenieur, der auf die Entwicklung, Bereitstellung und Wartung von maschinellen Lernmodellen in Produktionsumgebungen spezialisiert ist.

Konzept entdecken

Inference & Engineering

Model Distillation

Eine Technik, bei der ein kleineres, schnelleres KI-Modell trainiert wird, um die Fähigkeiten eines größeren Modells zu replizieren, was eine kosteneffiziente Bereitstellung bei gleichzeitiger Aufrechterhaltung hoher Leistung ermöglicht.

Konzept entdecken

Agentic Infrastructure

Model Quantization

Model Quantization ist eine Technik zur Reduzierung des Speicherbedarfs und der Rechenanforderungen von KI-Modellen, indem Gewichte und Aktivierungen mit niedrigeren Präzisionszahlen dargestellt werden. Dies ermöglicht das Ausführen großer Modelle auf Consumer-Hardware und Edge-Geräten.

Konzept entdecken

Reasoning & Verlässlichkeit

Model-agnostic

Bezieht sich auf ein System oder eine Software, die dafür ausgelegt ist, mit verschiedenen KI-Sprachmodellen zu arbeiten, anstatt spezifisch an ein bestimmtes Modell gebunden zu sein.

Konzept entdecken

Reasoning & Verlässlichkeit

Modell-agnostisch

Ein Systemdesign-Ansatz, bei dem das KI-Framework mit jedem Sprachmodell-Anbieter funktioniert. Ermoeglicht den Wechsel zwischen GPT-4, Claude, Gemini oder Open-Source-Modellen ohne Codeaenderungen.

Konzept entdecken

Agentic Infrastructure

Modular Extension System

Ein System, das es Benutzern ermöglicht, die Funktionalität einer Softwareanwendung (wie Claude Code) anzupassen und zu erweitern, indem sie eigenständige Module oder Erweiterungen hinzufügen, entfernen oder modifizieren.

Konzept entdecken

Agentic Business

Multi-Agent Coding

Der Prozess der Softwareentwicklung unter Verwendung mehrerer KI-Agenten, die parallel oder sequenziell arbeiten, um Programmieraufgaben abzuschließen.

Konzept entdecken

Agentic Business

Multi-Agent Orchestration

Die Koordination mehrerer spezialisierter KI-Agenten, die als digitales Team zusammenarbeiten, um komplexe, abteilungsübergreifende Probleme zu lösen.

Konzept entdecken

Agentic Business

Multi-Agent Platform

Eine Plattform, die es Entwicklern ermöglicht, mehrere KI-Agenten zu verwenden und zu verwalten, oft von verschiedenen Anbietern, innerhalb einer einheitlichen Umgebung.

Konzept entdecken

Agentic Business

Multi-Agent Workflow

Ein System, in dem mehrere KI-Agenten zusammenarbeiten und koordinieren, um ein komplexes Ziel zu erreichen, oft mit Übergaben und Abhängigkeiten zwischen den Agenten.

Konzept entdecken

Agentic Business

Multi-Agent-Coding-Workflow

Ein Entwicklungs-Workflow, bei dem mehrere KI-Agenten parallel an verschiedenen Coding-Aufgaben arbeiten, koordiniert über eine zentrale Schnittstelle.

Konzept entdecken

Agentic Business

Multi-Agent-Plattform

Eine Software-Umgebung, die mehrere KI-Agenten mit verschiedenen Fähigkeiten für komplexe Aufgaben orchestriert. GitHubs Agent HQ veranschaulicht dies durch aufgabenbasierte Zuweisung von Claude, Codex oder Copilot.

Konzept entdecken

Agentic Business

Multi-Agenten PR Review

Ein Code-Review-Ansatz, der mehrere KI-Agenten parallel einsetzt, um einen Pull Request gleichzeitig aus verschiedenen Perspektiven zu analysieren. Im Gegensatz zu Single-Pass-Tools nutzt Multi-Agenten-Review spezialisierte Agenten und validiert kombinierte Befunde durch eine Critic-Schicht, bevor sie priorisiert an Entwickler weitergegeben werden.

Konzept entdecken

Multi-Modal Feedback Loops

Multi-Modal Feedback Loops ist ein AI user experience-Konzept in modernen KI-Systemen, das die Nutzerinteraktion mit KI-Features gestaltet und deren Nutzen maximiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Nutzerakzeptanz und Zufriedenheit von durchdachtem Interface- und Interaktionsdesign abhängen.

Konzept entdecken

Reasoning & Verlässlichkeit

Multimodal Model

Ein KI-Modell, das in der Lage ist, Informationen aus mehreren Modalitäten zu verarbeiten und zu integrieren, wie z. B. Text, Bilder und Audio.

Konzept entdecken

Reasoning & Verlässlichkeit

Multimodales Modell

Ein KI-Modell, das mehrere Datentypen — Text, Bilder, Audio, Video — in einer einzigen Architektur verarbeitet und generiert. Modelle wie GPT-4o und Gemini verstehen Kontext über Medientypen gleichzeitig.

Konzept entdecken

Agentic Infrastructure

n8n

Eine Open-Source, node-basierte Workflow-Automatisierungsplattform, die es Benutzern ermöglicht, verschiedene Anwendungen und Dienste zu verbinden, um Aufgaben zu automatisieren.

Konzept entdecken

Agentic Infrastructure

n8n-MCP server

Ein Open-Source-Server, der als Brücke zwischen n8n und KI-Modellen (wie Claude Code) über das Model Context Protocol (MCP) fungiert und es KI ermöglicht, n8n-Workflows zu steuern und zu automatisieren.

Konzept entdecken

Reasoning & Verlässlichkeit

Nano Banana Pro

Ein ultra-effizienter Open-Source-Bildgenerator von Google, der im Dezember 2025 veröffentlicht wurde und hochwertige Bilder mit minimalem Ressourcenverbrauch erzeugt.

Konzept entdecken

Agentic Business

Natural Language Workflow Creation

Der Prozess der Definition und Erstellung automatisierter Workflows mithilfe von natürlichen Sprachaufforderungen, die dann von einem KI-System in ausführbare Anweisungen übersetzt werden.

Konzept entdecken

Agentic Business

Natural-Language-Driven

Ein Entwicklungsansatz, bei dem natürliche Sprache als primäre Eingabe für die Softwareerstellung verwendet wird, die von KI interpretiert und ausgeführt wird.

Konzept entdecken

Agentic Business

NemoClaw

NemoClaw ist das interne Agenten-Framework von Context Studios, das speziell fuer die Erstellung und Verwaltung von KI-Agenten-Pipelines im Content- und Marketing-Bereich entwickelt wurde. Es kombiniert Prinzipien aus dem GSD-Framework (Get Stuff Done) mit spezifischen Workflows fuer Content-Erstellung, SEO-Optimierung und Multi-Channel-Publishing. Das Framework ist nach einer Kombination aus "NVIDIA NeMo" (NVIDIAs Enterprise KI-Framework) und "Claw" (dem OpenClaw-Betriebssystem) benannt, was die technische Herkunft und Integration symbolisiert. NemoClaw laeuft auf OpenClaw und nutzt die MCP (Model Context Protocol) Infrastruktur von Context Studios. Kernelemente von NemoClaw umfassen: Spec-Driven Scaffolding fuer alle Content-Workflows, Phase-Budgets zur Kostenkontrolle, Multi-Agenten-Koordination zwischen Research-, Writing- und Publishing-Agenten, integrierte Qualitaetssicherung durch Review-Agenten, und automatische Multi-Sprachen-Expansion fuer internationale Inhalte. In der Praxis ermoeglicht NemoClaw Context Studios, einen vollstaendigen Blog-Post-Workflow — von der Keyword-Recherche bis zur oeffentlichen Veroeffentlichung auf 4 Sprachen — automatisiert auszufuehren. Dies umfasst SEO-Optimierung, Bild-Generierung, Social-Media-Posts und CMS-Integration.

Konzept entdecken

Agentic Infrastructure

NPU Optimization

NPU oder Neural Processing Unit Optimierung bezieht sich auf Techniken zur Maximierung der Leistung von dedizierten KI-Beschleunigerchips. NPUs sind spezialisierte Hardware, die für effiziente neuronale Netzwerk-Inferenz entwickelt wurde und in modernen Smartphones, Laptops und Edge-Geräten zu finden ist.

Konzept entdecken

Agentic Business

Observe-Think-Act loop

Der grundlegende Zyklus eines KI-Agenten, bei dem er seine Umgebung wahrnimmt (Beobachten), die Informationen verarbeitet und eine Handlungsentscheidung trifft (Denken) und dann diese Handlung ausführt (Handeln).

Konzept entdecken

Reasoning & Verlässlichkeit

Ollama Ecosystem

Das Ollama-Ökosystem bezieht sich auf die Werkzeuge, Modelle und die Gemeinschaft rund um Ollama, eine Open-Source-Plattform zum lokalen Ausführen großer Sprachmodelle. Es vereinfacht das Modellmanagement und bietet eine konsistente API für die lokale KI-Entwicklung.

Konzept entdecken

Reasoning & Verlässlichkeit

Open-weight Model

Ein Sprachmodell, dessen Gewichte (die gelernten Parameter) öffentlich zum Download und zur Verwendung verfügbar sind.

Konzept entdecken

Reasoning & Verlässlichkeit

Open-Weight-Modell

Ein Open-Weight-Modell ist ein KI-Modell, dessen trainierte Parameter – die Milliarden numerischer Gewichte, die das Wissen des Modells kodieren – öffentlich zum Download bereitstehen, ohne notwendigerweise den vollständigen Trainingscode, die Daten oder die Methodik offenzulegen. Open-Weight-Modelle nehmen eine Mittelposition ein: Sie sind zugänglicher als vollständig proprietäre Modelle wie OpenAI's GPT-4o oder Anthropic's Claude, die ausschließlich über API verfügbar sind, aber weniger transparent als vollständig quelloffene KI, bei der jede Komponente des Trainings nachvollziehbar ist. Bekannte Open-Weight-Modelle sind Metas Llama-Serie, Mistral AIs Mixtral, Googles Gemma und Zhipu AIs GLM-5. Die öffentliche Verfügbarkeit der Gewichte ermöglicht es Entwicklern und Unternehmen, Modelle herunterzuladen, selbst zu betreiben und für spezifische Domänen feinabzustimmen – ohne sensible Daten an externe APIs zu übertragen. Dies ist ein entscheidender Vorteil für Branchen mit strengen Datenschutzvorgaben wie Recht, Medizin und Finanzen. Open-Weight-Modelle haben eine Demokratisierung der KI-Fähigkeiten vorangetrieben: Organisationen können heute frontier-nahe Sprachmodelle auf eigenen GPU-Clustern betreiben und so die Kosten pro Token erheblich senken und Vendor-Lock-in vermeiden. Der Begriff unterscheidet sich von Open-Source-KI: Ein Modell kann seine Gewichte veröffentlichen, ohne Trainingsdaten oder Code offenzulegen. Lizenzen variieren stark – Llamas Community License schränkt die kommerzielle Nutzung ab 700 Millionen monatlich aktiver Nutzer ein, Mistrals Modelle nutzen Apache 2.0. Bei Context Studios evaluieren wir regelmäßig Open-Weight-Modelle für europäische Unternehmenskunden, bei denen DSGVO-konforme On-Premise-Inferenz API-basierten Cloud-Lösungen vorzuziehen ist.

Konzept entdecken

Reasoning & Verlässlichkeit

OpenAI Apps SDK

Ein UI-Framework, das die Erstellung plattformübergreifender KI-Anwendungen erleichtert, indem es Werkzeuge bereitstellt, um zwischen verschiedenen KI-Plattformen und MCP-Servern zu übersetzen.

Konzept entdecken

Reasoning & Verlässlichkeit

OpenAI Codex

Ein Modell von OpenAI, das natürliche Sprache in Code übersetzt; die Grundlage für Copilot.

Konzept entdecken

Reasoning & Verlässlichkeit

OpenAI Codex

OpenAIs cloudbasierter KI-Coding-Agent, der Code ausführt, Repos verwaltet und Entwicklungsaufgaben autonom in einer Sandbox mit GitHub-Integration bewältigt.

Konzept entdecken

Agentic Infrastructure

OpenAI Connectors

Wrapper, die von OpenAI entwickelt wurden und die Integration zwischen KI-Agenten und häufig verwendeten Anwendungen und Diensten wie Google Drive, Slack und Notion erleichtern, oft unter Verwendung des Model Context Protocol (MCP).

Konzept entdecken

Agentic Business

OpenClaw

Ein Open-Source-Framework zur Erstellung und Ausführung autonomer KI-Agenten, die über mehrere Messaging-Plattformen hinweg operieren können.

Konzept entdecken

Agentic Business

Operational Foundation

Die grundlegenden Systeme und Prozesse, auf denen eine Organisation ihre täglichen Aktivitäten ausführt, die nun zunehmend auf KI-Agenten angewiesen sind.

Konzept entdecken

Agentic Business

Output Contract

Eine klar definierte Struktur und ein Format für die von einem KI-Agenten generierte Ausgabe, die Konsistenz und Vorhersehbarkeit für die nachgelagerte Verarbeitung oder den menschlichen Konsum gewährleistet.

Konzept entdecken

Reasoning & Verlässlichkeit

Parameters (Model Parameters)

Die anpassbaren Gewichte innerhalb eines neuronalen Netzwerks, die während des Trainings gelernt werden. Sie bestimmen die Fähigkeit des Modells, Eingaben in Ausgaben zuzuordnen.

Konzept entdecken

Agentic Business

Persistenter Speicher (KI)

Die Fähigkeit eines KI-Systems, Informationen über Sitzungen und Gespräche hinweg zu behalten und langfristigen Kontext über Benutzer und Aufgaben aufzubauen. Ermöglicht Kontinuität und Personalisierung.

Konzept entdecken

Agentic Business

Personal Intelligence

Googles Initiative zur Erweiterung seines Gemini-Modells mit Funktionen, die auf die individuellen Bedürfnisse und Vorlieben der Nutzer zugeschnitten sind, um ein hochgradig personalisiertes AI-Erlebnis zu bieten.

Konzept entdecken

Agentic Business

Persönliche Intelligenz

KI-Systeme, die tief in das Leben einzelner Nutzer integriert sind, Präferenzen lernen und proaktiv bei täglichen Aufgaben und Entscheidungen helfen. Eine von OpenAIs Sam Altman formulierte Vision.

Konzept entdecken

Reasoning & Verlässlichkeit

Platform Consolidation

Der Trend, mehrere Funktionen und Dienste in einer einzigen, einheitlichen Plattform zu vereinen, oft unterstützt von AI, wodurch der Bedarf an unterschiedlichen Anwendungen verringert wird.

Konzept entdecken

Reasoning & Verlässlichkeit

Plattform-Konsolidierung

Der Trend, mehrere spezialisierte Software-Tools durch weniger, umfassendere Plattformen zu ersetzen. Im KI-Zeitalter absorbieren KI-Super-Apps Funktionen separater SaaS-Produkte und reduzieren Software-Wildwuchs.

Konzept entdecken

EU & Compliance

Privacy-Preserving Inference

Privacy-Preserving Inference ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.

Konzept entdecken

Agentic Infrastructure

Private Cloud Compute

Die Technologie von Apple, die sensible Daten lokal auf dem Gerät oder über private, sichere Server verarbeitet, um die Privatsphäre der Nutzer zu wahren, während AI-Funktionen genutzt werden. Das Unternehmen möchte keine Nutzerdaten mit externen Cloud-Anbietern teilen.

Konzept entdecken

Agentic Infrastructure

Private Cloud Compute

Apple Cloud-Infrastruktur verarbeitet AI-Anfragen mit hardwarebasierten Datenschutzgarantien. Daten in sicheren Enklaven, niemals gespeichert.

Konzept entdecken

Agentic Business

Proactive Communication

Die Fähigkeit eines AI-Assistenten, die Kommunikation mit einem Benutzer basierend auf Auslösern, Ereignissen oder gelernten Vorlieben zu initiieren, anstatt auf explizite Anfragen zu warten.

Konzept entdecken

Reasoning & Verlässlichkeit

Programmatic Access

Der Zugriff auf ein Softwaresystem oder einen Dienst über Code (z. B. unter Verwendung einer API) anstelle einer grafischen Benutzeroberfläche.

Konzept entdecken

Agentic Infrastructure

Prompt Caching

Eine Technik, die häufig verwendeten Kontext im Speicher eines KI-Modells speichert, was die Latenz und Kosten für repetitive Anfragen drastisch reduziert.

Konzept entdecken

KI-Sicherheit & Leitplanken

Prompt Injection Defense

Prompt Injection Defense ist ein AI safety-Konzept in modernen KI-Systemen, das sicherstellt, dass KI-Systeme innerhalb sicherer Grenzen arbeiten. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo die Vermeidung schädlicher Outputs und Systemintegrität höchste Priorität haben.

Konzept entdecken

Agentic Business

Prompt Re-injection

Der Prozess, das gleiche ursprüngliche Prompt erneut in ein AI-Modell einzuspeisen, um es zu ermutigen, an einer Aufgabe weiterzuarbeiten und auf vorherigen Iterationen aufzubauen.

Konzept entdecken

Inference & Engineering

Prompt Template

Wiederverwendbare Prompt-Strukturen mit Platzhaltern für dynamische Inhalte. Ermöglichen konsistente Outputs über verschiedene Inputs hinweg. Best Practices: Klare Rollendefinition, strukturierte Ausgabeformate, Few-Shot-Beispiele. LangChain, Guidance und LMQL bieten Template-Engines. Unterschied zu Ad-hoc-Prompts: Versionierbar, testbar, optimierbar.

Konzept entdecken

Reasoning & Verlässlichkeit

Provenance

Die Dokumentation des Ursprungs und der Geschichte eines Datensatzes, einschließlich woher er stammt, wie er abgeleitet wurde und wer ihn modifiziert hat. Im Kontext von LLMs bezieht es sich auf die Nachverfolgung der Quelle von Informationen, die in der Antwort des Modells verwendet werden.

Konzept entdecken

Inference & Engineering

Quantization (AI)

Eine Technik, die die Präzision der numerischen Gewichte eines AI-Modells reduziert (z. B. von 32-Bit auf 4-Bit), wodurch die Modellgröße und die Speicheranforderungen drastisch verringert werden, während die meisten Leistungen erhalten bleiben.

Konzept entdecken

Reasoning & Verlässlichkeit

Ralph Wiggum Plugin

Ein Claude Code Plugin, das vollständig autonome KI-Entwicklung ermöglicht, indem es automatisch alle Tool-Aufrufe und Berechtigungen akzeptiert, sodass Claude Code ohne menschliche Intervention an repetitiven oder Batch-Aufgaben arbeiten kann.

Konzept entdecken

Reasoning & Verlässlichkeit

Ralph Wiggum Plugin

Ein Claude Code Plugin das vollstaendig autonome KI-Entwicklung ermoeglicht indem es automatisch alle Tool-Aufrufe und Berechtigungen akzeptiert.

Konzept entdecken

Agentic Business

Ralph Wiggum Technik

Eine autonome Entwicklungsmethodik für KI-Coding-Assistenten, erfunden von Geoffrey Huntley. Nutzt einen Stop Hook, der Claudes Exit-Versuche abfängt und denselben Prompt wiederholt zurückfüttert, bis die Aufgabe vollständig erledigt ist. Ermöglicht mehrstündige autonome Coding-Sessions.

Konzept entdecken

Reasoning & Verlässlichkeit

React Server Components

Eine React-Funktion, die es Komponenten ermöglicht, auf dem Server anstelle des Clients zu laufen, wodurch die Leistung verbessert und die clientseitige JavaScript reduziert wird.

Konzept entdecken

Reasoning & Verlässlichkeit

React Server Components

Eine React-Architektur, bei der Komponenten auf dem Server gerendert werden, um clientseitiges JavaScript zu reduzieren und Performance zu verbessern.

Konzept entdecken

Reasoning & Verlässlichkeit

Refactoring

Der Prozess der Umstrukturierung vorhandener Computerprogramme - Änderung der Faktorisierung - ohne das externe Verhalten zu ändern.

Konzept entdecken

Agentic Infrastructure

Resources (MCP)

Strukturierte Daten, auf die ein AI-Assistent über das Model Context Protocol (MCP) zugreifen kann, wie Datenbankschemata oder Dokumentationen.

Konzept entdecken

Agentic Infrastructure

Responses API

OpenAIs API zur Generierung strukturierter Antworten von KI-Modellen, mit Unterstützung für Tool-Nutzung, Funktionsaufrufe und mehrstufige Reasoning-Workflows.

Konzept entdecken

Ökonomie & Skalierung

Revenue Validation

Bestätigung, dass eine Produktidee zahlende Kunden generieren kann, bevor signifikante Entwicklungsressourcen investiert werden.

Konzept entdecken

Agentic Infrastructure

Runtime

Die Umgebung, in der ein Computerprogramm oder ein AI-Agent ausgeführt wird, umfasst die Software- und Hardware-Ressourcen, die für seinen Betrieb erforderlich sind.

Konzept entdecken

Reasoning & Verlässlichkeit

SaaS

Software as a Service. Software, das als Dienst über das Internet bereitgestellt wird.

Konzept entdecken

Vertrauen & Souveränität

Sandbox-Container

Eine sichere, isolierte Umgebung zum Ausfuehren von Anwendungen, die den Zugriff auf Systemressourcen beschraenkt. Entscheidend fuer den Enterprise-Einsatz von KI-Agenten.

Konzept entdecken

Vertrauen & Souveränität

Sandboxed Web-Zugriff

Eine Claude Code Sicherheitskonfiguration, die die Browser-Fähigkeiten des KI-Agenten auf eine definierte Whitelist von Domains beschränkt. Anstatt uneingeschränkten Internetzugang zu haben, kann der Agent nur vorab genehmigte Seiten recherchieren, wodurch versehentliche Codebase-Änderungen, unbeabsichtigte API-Calls oder Zugriff auf sensible externe Dienste verhindert werden.

Konzept entdecken

Agentic Infrastructure

Scaling AI

Der Prozess, die Größe, Komplexität und die Ressourcen, die AI-Modellen und -Systemen zugewiesen sind, zu erhöhen, wobei oft die Erweiterung des Trainingsdatensatzes, der Modellparameter und der Recheninfrastruktur einbezogen wird.

Konzept entdecken

Reasoning & Verlässlichkeit

Schema Validation

Der Prozess der Überprüfung, ob die Ausgabe eines Sprachmodells einem vordefinierten Schema oder Format entspricht.

Konzept entdecken

Reasoning & Verlässlichkeit

Schwachstellenanalyse

Der automatisierte Prozess zur Identifizierung von Sicherheitslücken in Software, Netzwerken oder Systemen. Moderne Ansätze reichen von regelbasierter statischer Analyse bis hin zu KI-gestütztem kontextuellem Code-Reasoning.

Konzept entdecken

Reasoning & Verlässlichkeit

Seat

Im Kontext von Softwarelizenzen repräsentiert ein 'Seat' einen einzelnen Benutzer oder Benutzerkonto, das autorisiert ist, auf die Software zuzugreifen und sie zu nutzen. Die Preisgestaltung für SaaS basiert oft auf einem 'pro Seat' oder 'pro Benutzer'-Modell.

Konzept entdecken

Reasoning & Verlässlichkeit

Seedance 2.0

Seedance 2.0 ist ein multimodales KI-Videogenerierungsmodell von ByteDance, dem Pekinger Technologiekonzern hinter TikTok. Das 2025 veröffentlichte Modell generiert hochwertige, temporal kohärente Videoclips aus Textprompts, Bildeingaben oder einer Kombination beider Modalitäten und tritt damit in direktem Wettbewerb mit OpenAIs Sora, Googles Veo 3 und Runway MLs Gen-3. Seedance 2.0 wurde auf einem großen proprietären Datensatz aus Video-Text-Paaren trainiert und nutzt eine diffusionsbasierte Architektur, die auf Bewegungsrealismus, Szenenkonsistenz und fotorealistische Darstellung optimiert ist. Zu den zentralen Fähigkeiten gehören Multi-Shot-Videogenerierung, Kamerabewegungssteuerung, frameübergreifende Charakterkonsistenz und Unterstützung für kinematische Seitenverhältnisse. ByteDance entwickelte Seedance 2.0, um kreative Workflows im eigenen Produktökosystem — darunter CapCut, die populäre Videobearbeitungs-App — zu bereichern und das Modell gleichzeitig Enterprise-API-Kunden zugänglich zu machen. Im Gegensatz zu Sora, das ausschließlich über ChatGPT Plus verfügbar ist, bietet Seedance 2.0 direkten API-Zugang, was es zu einer praktischen Wahl für Entwickler macht, die automatisierte Videoproduktionspipelines aufbauen. Das Modell unterstützt sowohl Text-to-Video als auch Image-to-Video-Generierung mit Ausgabelängen von fünf bis dreißig Sekunden. Seedance 2.0 markiert ByteDances bedeutendsten Einstieg in den generativen Videobereich. Bei Context Studios haben wir Seedance 2.0 für automatisierte Social-Media-Videoproduktion und Short-Form-Content-Workflows getestet und seine Bewegungsqualität mit Veo 3 und Sora verglichen.

Konzept entdecken

Agentic Infrastructure

Self-hosted

Eine Software oder Dienstleistung, die auf der eigenen Infrastruktur des Benutzers gehostet wird und ihm im Vergleich zu cloudbasierten Lösungen mehr Kontrolle über Daten und Ressourcen gibt.

Konzept entdecken

Ökonomie & Skalierung

Semantic Caching

Eine Technik, die KI-Antworten für ähnliche (nicht nur identische) Anfragen speichert, sodass das System Antworten sofort liefern kann, ohne neue API-Kosten zu verursachen.

Konzept entdecken

Agentic Infrastructure

SEP (MCP Enhancement Proposal)

Ein Design-Dokument, das der MCP-Community Informationen liefert oder ein neues Feature für das Model Context Protocol beschreibt. SEP-Governance bedeutet, dass Breaking Changes angekündigt werden bevor sie in Releases landen.

Konzept entdecken

Agentic Business

Session-Kontinuitaet

Session-Kontinuitaet bezeichnet die Faehigkeit eines KI-Agenten oder -Systems, den Zustand, Kontext und Fortschritt einer laufenden Aufgabe ueber Unterbrechungen, Neustarts oder Sitzungswechsel hinweg beizubehalten. Da LLMs von Natur aus zustandslos sind (kein eingebettetes Langzeitgedaechtnis), muss Kontinuitaet explizit implementiert werden. Die fundamentale Herausforderung: Jede neue LLM-Konversation beginnt ohne Wissen ueber vorherige Interaktionen. Fuer langfristige Agenten-Aufgaben — etwa ein mehrtaegiger Forschungsauftrag oder ein kontinuierlich laufender Content-Prozess — ist dies problematisch. Die Loesung liegt in externen Zustandsspeichern und strukturierten Kontextuebergaben. Implementierungsstrategien fuer Session-Kontinuitaet: (1) Gedaechtnis-Dateien (der Zustand wird in Textdateien auf Disk gespeichert, die bei Wiederaufnahme geladen werden), (2) Vektor-Datenbanken (Embeddings von frueheren Interaktionen fuer semantischen Abruf), (3) Strukturierte Zustandsobjekte (JSON-Dokumente die den Agenten-Zustand repraesentieren), (4) Event-Logs (Chronologisches Protokoll aller Aktionen, das Wiederaufnahme ermoeglicht). Bei Context Studios wird Session-Kontinuitaet durch taeglich rotierende Memory-Files, ein Cortex-basiertes Langzeitgedaechtnis und strukturierte Session-Logs implementiert — ein Beispiel fuer ein produktionsreifes Kontinuitaetssystem.

Konzept entdecken

Agentic Business

Skill

Ein modulares, wiederverwendbares Element, das entwickelt wurde, um eine spezifische Aufgabe innerhalb von Claude Code auszuführen. Fähigkeiten können durch Benutzereingaben oder andere Ereignisse ausgelöst werden.

Konzept entdecken

Agentic Business

Skill Definition (in YAML format)

Die Definition der spezifischen Fähigkeiten und Funktionen eines KI-Agenten unter Verwendung von YAML, einer menschenlesbaren Datenserialisierungssprache. Dies umreißt, was der Agent tun kann und wie er mit Werkzeugen und anderen Agenten interagiert.

Konzept entdecken

Reasoning & Verlässlichkeit

Skill Hot-Reload

Die Fähigkeit, Fähigkeiten in einer Entwicklungsumgebung automatisch zu aktualisieren und neu zu laden, ohne einen vollständigen Neustart des Systems zu erfordern.

Konzept entdecken

Reasoning & Verlässlichkeit

Skill Hot-Reload

Die Faehigkeit, Skills eines KI-Agenten ohne vollstaendigen Systemneustart zu aktualisieren und schneller zu iterieren.

Konzept entdecken

Agentic Business

Skills

Automatisch ausgelöste Fähigkeiten von Claude Code, die durch den Kontext aktiviert werden und es ihm ermöglichen, Aufgaben ohne ausdrückliche Benutzerbefehle auszuführen.

Konzept entdecken

Agentic Infrastructure

Skills API

Eine Anwendungsprogrammierschnittstelle (API), die es Entwicklern ermöglicht, wiederverwendbare Anweisungssets ('Fähigkeiten') in KI-Plattformen zu erstellen, zu verwalten und zu integrieren, um Automatisierung und Anpassung zu ermöglichen.

Konzept entdecken

Agentic Business

Skills System

Ein modulares Framework innerhalb eines KI-Assistenten, das es Benutzern ermöglicht, dessen Funktionalität durch installierbare Plugins oder Module zu erweitern.

Konzept entdecken

Agentic Business

Skills-System (KI)

Eine modulare Architektur, bei der KI-Fähigkeiten als diskrete, einsteckbare Skill-Module organisiert sind, die unabhängig hinzugefügt, entfernt oder aktualisiert werden können. Wird in Systemen wie Clawdbot verwendet.

Konzept entdecken

Software 3.0

Software 3.0 bezieht sich auf das Paradigma, in dem KI-Modelle die primäre Art und Weise sind, wie Software funktioniert, und über traditionellen Code (1.0) und neuronale Netzwerke, die auf Daten trainiert sind (2.0), hinausgeht. In Software 3.0 schreiben, testen und implementieren KI-Agenten autonom Code.

Konzept entdecken

Reasoning & Verlässlichkeit

Software for One

Personalisierte Software-Tools, die schnell für den individuellen Gebrauch erstellt werden, oft unter Nutzung von KI für schnelles Prototyping und Automatisierung.

Konzept entdecken

EU & Compliance

Sovereign Cloud AI (GAIA-X)

Sovereign Cloud AI (GAIA-X) ist ein regulatory compliance-Konzept in modernen KI-Systemen, das rechtliche und regulatorische Anforderungen für den KI-Einsatz adressiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Organisationen EU AI Act, DSGVO und branchenspezifische Vorgaben erfüllen müssen.

Konzept entdecken

Spatial Intelligence

Die Fähigkeit der KI, 3D-Räume wahrzunehmen, zu interpretieren und darin zu agieren – die Brücke zwischen digitaler Intelligenz und physikalischer Realität.

Konzept entdecken

Ökonomie & Skalierung

Startup-Oekosystem

Das vernetzte Netzwerk aus Startups, Investoren, Acceleratoren, Universitaeten und Foerderprogrammen, das Unternehmertum und Innovation in einer Region foerdert.

Konzept entdecken

Agentic Business

Stop Hook

Ein Mechanismus, der das normale Beendigungsverhalten eines KI-Modells abfängt, um Modifikationen oder eine Fortsetzung des Betriebs zu ermöglichen, bevor das Modell abschließt.

Konzept entdecken

Agentic Infrastructure

Streamable HTTP Transport

Streamable HTTP Transport ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.

Konzept entdecken

Agentic Business

Subagents

Kleinere, spezialisierte AI-Agenten, die innerhalb eines größeren AI-Agentensystems zusammenarbeiten, um komplexe Aufgaben zu erfüllen.

Konzept entdecken

Reasoning & Verlässlichkeit

Swift Assist

Apples KI-gestützter Codierungsassistent, der in Xcode integriert ist und Entwicklern hilft, Swift-Code zu schreiben, zu verstehen und zu debuggen, indem er große Sprachmodelle nutzt.

Konzept entdecken

Reasoning & Verlässlichkeit

Synthetic Data Generation

Die Generierung synthetischer Daten umfasst die Erstellung von künstlichen Daten, die die statistischen Eigenschaften von realen Daten nachahmen. Dies wird häufig verwendet, um reale Daten in maschinellen Lernaufgaben zu ergänzen oder zu ersetzen, insbesondere wenn reale Daten knapp, teuer oder datenschutzsensibili sind.

Konzept entdecken

Inference & Engineering

Tech Stack

Die vollstaendige Sammlung von Technologien zum Erstellen und Betreiben einer Softwareanwendung. Im KI-Bereich beeinflussen Tech-Stack-Entscheidungen Modellleistung, Skalierbarkeit und Wartungskosten erheblich.

Konzept entdecken

Reasoning & Verlässlichkeit

Technical Debt Tsunami

Eine Metapher, die die überwältigende Ansammlung von technischem Schulden beschreibt, die aus hastigen oder schlecht geplanten Entwicklungspraktiken resultiert, insbesondere bei der Verwendung von KI-generiertem Code ohne angemessene Aufsicht.

Konzept entdecken

Reasoning & Verlässlichkeit

Terminal Workflow

Der Satz von Aufgaben, Befehlen und Prozessen, die ein Entwickler oder Benutzer innerhalb einer Befehlszeilenschnittstelle (Terminal) für Softwareentwicklung, Systemadministration oder andere technische Zwecke ausführt.

Konzept entdecken

Agentic Infrastructure

Test-Time Compute

Test-Time Compute bezieht sich auf die Rechenressourcen, die erforderlich sind, um Inferenz durchzuführen oder Vorhersagen mit einem trainierten KI-Modell zu treffen. Effiziente Test-Time-Compute ist entscheidend für die Bereitstellung von KI-Modellen in realen Anwendungen mit niedriger Latenz und hoher Durchsatz.

Konzept entdecken

Inference & Engineering

Test-Time Scaling

Die Praxis, zum Zeitpunkt der Antwortgenerierung (Inferenz) mehr Rechenleistung einzusetzen als nur während des Trainings, damit das Modell für bessere Ergebnisse 'länger nachdenken' kann.

Konzept entdecken

Time-to-First-Token (TTFT)

Time-to-First-Token (TTFT) ist eine zentrale Leistungsmetrik für große Sprachmodelle, die die Zeitspanne zwischen dem Absenden einer Anfrage und dem Empfang des ersten generierten Tokens misst. TTFT ist entscheidend für die wahrgenommene Reaktionsfähigkeit von KI-Anwendungen – niedrigere Werte bedeuten schnellere erste Antworten. Typische TTFT-Werte reichen von unter 100ms bei optimierten Edge-Modellen bis zu mehreren Sekunden bei großen Reasoning-Modellen. Faktoren wie Modellgröße, Hardware (GPU vs. WSE), Prompt-Länge und KV-Cache-Strategien beeinflussen TTFT maßgeblich. Im Jahr 2026 ist TTFT ein Schlüsseldifferenzierer zwischen Anbietern, wobei Cerebras WSE und optimierte Modelle wie GPT-5.3-Codex-Spark besonders niedrige Werte erreichen.

Konzept entdecken

Agentic Infrastructure

Token Budget

Die begrenzte Anzahl von Tokens (Texteinheiten), die aufgrund von Kosten, Leistung oder Modellbeschränkungen im Eingabekontext eines Sprachmodells enthalten sein können. Dieses Budget schränkt die Menge an Informationen ein, die dem Modell bereitgestellt werden können.

Konzept entdecken

Reasoning & Verlässlichkeit

Token Input Context

Die maximale Anzahl von Tokens (Texteinheiten), die ein KI-Modell in einer einzigen Anfrage als Eingabe verarbeiten kann.

Konzept entdecken

Ökonomie & Skalierung

Token Yield Optimization

Token Yield Optimization ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.

Konzept entdecken

Reasoning & Verlässlichkeit

Tokens (in LLMs)

Die grundlegenden Textelemente, die LLMs verarbeiten, typischerweise Wörter oder Teile von Wörtern. Der Tokenverbrauch bezieht sich auf die Anzahl der Tokens, die sowohl für Eingaben als auch für Ausgaben verwendet werden, was Kosten und Leistung beeinflusst.

Konzept entdecken

Agentic Infrastructure

Tool Use / Function Calling

Tool Use / Function Calling ist ein AI infrastructure-Konzept in modernen KI-Systemen, das grundlegende Fähigkeiten für KI-System-Deployment und -Betrieb bereitstellt. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Zuverlässigkeit und Skalierbarkeit für Produktions-Workloads entscheidend sind.

Konzept entdecken

Agentic Business

Tool Use in KI

Die Faehigkeit von KI-Modellen mit externen Software-Tools APIs und Diensten waehrend der Inferenz zu interagieren.

Konzept entdecken

Agentic Infrastructure

Tools (MCP)

Ausführbare Aktionen, die ein KI-Assistent über das Model Context Protocol (MCP) auslösen kann, wie das Schreiben einer Datei oder das Aufrufen einer API.

Konzept entdecken

Agentic Infrastructure

Turbopack

Ein leistungsstarkes Build-Tool für JavaScript und TypeScript, das als Nachfolger von Webpack konzipiert wurde. Bemerkenswert schnellere Build-Zeiten durch Caching.

Konzept entdecken

Reasoning & Verlässlichkeit

Turbopack

Ein hochperformanter inkrementeller Bundler fuer JavaScript und TypeScript, als Webpack-Nachfolger mit deutlich schnelleren Build-Zeiten.

Konzept entdecken

Inference & Engineering

Typicality Bias

Die systematische menschliche Präferenz für ‚typische' Texte gegenüber ungewöhnlichen – ein gut dokumentiertes Phänomen der kognitiven Psychologie. In LLM-Alignment-Daten mit α = 0.57±0.07 gemessen. Hauptursache für Mode Collapse, da RLHF/DPO diesen Bias verstärken.

Konzept entdecken

Agentic Infrastructure

Unified Playground

Eine konsolidierte Schnittstelle oder Umgebung, die den Zugriff auf mehrere KI-Modelle und -Tools ermöglicht und es den Benutzern erlaubt, verschiedene Modelle innerhalb einer einzigen Plattform zu experimentieren, zu vergleichen und zu nutzen.

Konzept entdecken

Reasoning & Verlässlichkeit

val_bpb (Validierungs-Bits pro Byte)

Eine Leistungsmetrik fuer Sprachmodelle, die misst wie effizient ein Modell Validierungsdaten komprimiert. Niedrigere Werte zeigen bessere Komprimierung und damit bessere Modellleistung an. Im autoresearch-Projekt von Karpathy als Optimierungsziel verwendet, da sie automatisch berechenbar ist und kein menschliches Urteil zwischen Iterationen erfordert.

Konzept entdecken

Reasoning & Verlässlichkeit

Veo 3.1

Googles neuestes KI-Modell zur Videogenerierung, das Google Flow antreibt und hochwertige Videosynthese mit Unterstützung für komplexe Übergänge und native Audiogenerierung bietet.

Konzept entdecken

Reasoning & Verlässlichkeit

Veo 3.1

Googles neuestes KI-Modell zur Videogenerierung das Google Flow antreibt und hochwertige Videosynthese mit komplexen Uebergaengen und nativer Audiogenerierung bietet.

Konzept entdecken

Reasoning & Verlässlichkeit

Verbalized Sampling

Eine Technik zur Bekaempfung von Mode Collapse bei der das KI-Modell durch natuerlichsprachliche Anweisungen aufgefordert wird diverse Ausgaben zu generieren.

Konzept entdecken

Agentic Business

Verketteter Agenten-Workflow

Eine Sequenz miteinander verbundener KI-Agenten, bei der der Output eines Agenten als Input für den nächsten dient. Claude Code /loop ermöglicht verkettete Agenten-Workflows, indem es Sub-Agenten zur Fehlerbehebung startet und autonome iterative Verbesserungszyklen schafft.

Konzept entdecken

Agentic Business

Vertical Connection

Im Kontext von KI-Agenten bezieht sich eine vertikale Verbindung auf die Verbindung zwischen einem Agenten und den externen Tools, Datenbanken und APIs, die er zur Ausführung von Aufgaben verwendet.

Konzept entdecken

Agentic Business

Vertikale Verbindung (KI)

Die Verbindung zwischen einem KI-Agenten und den Tools, Datenbanken und APIs, die er benötigt, um auf externe Informationen zuzugreifen und Aufgaben auszuführen. In der KI-Protokolllandschaft deckt MCP diese vertikale Dimension ab.

Konzept entdecken

Inference & Engineering

Vibe-Coding-Kater

Die negativen Folgen nach extensivem Vibe Coding: angehäufte technische Schulden, unwartbarer Code und die Erkenntnis, dass KI-Code Engineering-Rigor erfordert.

Konzept entdecken

Agentic Infrastructure

Wafer-Scale Engine (WSE)

Die Wafer-Scale Engine (WSE) ist ein von Cerebras Systems entwickelter Prozessor, der einen gesamten Silizium-Wafer als einzelnen Chip nutzt – im Gegensatz zu herkömmlichen Prozessoren, die aus kleinen Chips geschnitten werden. Die aktuelle WSE-3 Generation bietet 4 Billionen Transistoren und 900.000 KI-optimierte Kerne auf einer einzigen 300mm-Wafer-Fläche. Diese Architektur eliminiert die Kommunikationsengpässe zwischen mehreren GPUs und ermöglicht ultraschnelles Training und Inferenz großer Sprachmodelle. WSE ist besonders relevant für Unternehmen, die extreme Leistung bei LLM-Inferenz benötigen, mit Time-to-First-Token-Werten unter 100 Millisekunden.

Konzept entdecken

Agentic Business

Workflow Redesign

Die Neugestaltung bestehender Geschäftsprozesse zur Integration und Optimierung des Einsatzes von AI-Agenten, was oft zu erheblichen Effizienzgewinnen führt.

Konzept entdecken

World Models

KI-Systeme, die ein grundlegendes Verständnis von physikalischen und kausalen Gesetzen entwickeln, um Vorhersagen in virtuellen und realen Umgebungen zu treffen.

Konzept entdecken

Reasoning & Verlässlichkeit

Xcode

Apples integrierte Entwicklungsumgebung (IDE) zur Softwareentwicklung für macOS, iOS, watchOS und tvOS.

Konzept entdecken

Reasoning & Verlässlichkeit

Xcode Previews

Eine Funktion innerhalb von Xcode, die es Entwicklern ermöglicht, eine visuelle Darstellung ihrer Benutzeroberfläche in Echtzeit zu sehen, während sie codieren.

Konzept entdecken

Agentic Business

Agenten-Orchestrierung

Agenten-Orchestrierung bezeichnet die Koordination mehrerer KI-Agenten durch einen zentralen Orchestrator-Agenten oder ein Orchestrierungssystem, um komplexe Aufgaben zu loesen, die einzelne Agenten nicht effizient bewältigen koennen. Die Orchestrierung bestimmt, welche Agenten wann aufgerufen werden, wie Ergebnisse zusammengefuehrt werden, und wie mit Fehlern umgegangen wird. Ein typisches Orchestrierungsmuster sieht wie folgt aus: Ein Orchestrator empfängt eine komplexe Aufgabe, zerlegt sie in Teilaufgaben, verteilt diese an spezialisierte Sub-Agenten (z.B. Research-Agent, Writing-Agent, SEO-Agent), sammelt die Ergebnisse, loest Konflikte auf und liefert das Gesamtergebnis. Der Orchestrator selbst ist oft ein LLM, das den Fortschritt beobachtet und dynamisch entscheidet. Orchestrierungsstrategien umfassen: sequenzielle Orchestrierung (Agenten arbeiten nacheinander), parallele Orchestrierung (Agenten arbeiten gleichzeitig), hierarchische Orchestrierung (verschachtelte Agenten-Teams), und dynamische Orchestrierung (der Orchestrator entscheidet zur Laufzeit, welche Agenten benoetigt werden). Die Hauptherausforderungen sind: Fehlerfortpflanzung (ein fehlgeschlagener Sub-Agent kann das ganze System blockieren), Zustandsverwaltung (der Orchestrator muss den Kontext aller laufenden Agenten verwalten), und Kostenkontrolle (multiple Agenten multiplizieren die Token-Kosten).

Konzept entdecken

Agentic Business

Agenten-Zuverlaessigkeit

Agenten-Zuverlaessigkeit (Agent Reliability) bezeichnet das Mass, in dem ein KI-Agent konsistent und korrekt die gewuenschten Aufgaben erfuellt, ohne unerwartete Fehler, Abrechnungen oder Abweichungen vom vorgesehenen Verhalten. Sie ist eine der kritischsten Anforderungen fuer den produktiven Einsatz von KI-Agenten. Faktoren, die die Zuverlaessigkeit beeinflussen: Determinismus (laeuft der Agent bei gleicher Eingabe konsistent?), Fehlerbehandlung (erkennt und behandelt der Agent Fehler gracefully?), Grenzfall-Robustheit (wie reagiert der Agent auf unerwartete Eingaben?), Ressourcenbeschraenkungen (haelt der Agent Kosten- und Token-Budgets ein?), und Halluzinationsrate (wie oft erfindet der Agent falsche Fakten?). Messgroessen fuer Agent Reliability umfassen: Task-Completion-Rate (Anteil erfolgreicher Durchlaeufe), Mean Time Between Failures (MTBF), Error-Recovery-Rate (wie oft loest sich der Agent selbst aus Fehlerzustaenden?), und Output-Konsistenz-Score (Uebereinstimmung zwischen erwarteten und tatsaechlichen Outputs). Strategien zur Verbesserung der Zuverlaessigkeit: Spec-Driven Scaffolding (klare Ausfuehrungsrahmen), Phase-Budgets (verhindern Endlosschleifen), robuste Fehlerbehandlung mit Fallbacks, regelmassige Evaluierung mit Regressionstests, und Monitoring-Systeme die Anomalien erkennen.

Konzept entdecken

Agentic Business

Agentische Coding-Tools

Softwareplattformen wie Claude Code, die KI-Agenten ermöglichen, Code autonom zu schreiben, zu testen und zu überprüfen. Anders als einfache Autovervollständigung führen agentische Coding-Tools mehrstufige Entwicklungs-Workflows mit minimaler menschlicher Intervention aus.

Konzept entdecken

Agentic Business

Agentisches Coding

Agentisches Coding bezeichnet Softwareentwicklungs-Workflows, bei denen KI-Agenten autonom Code schreiben, testen, debuggen, refaktorieren und iterieren – mit minimaler menschlicher Eingreifen –, um komplexe Programmieraufgaben über mehrere Schritte hinweg abzuschließen. Im Gegensatz zu herkömmlichen KI-Code-Assistenten wie GitHub Copilot, die Ergänzungen oder Snippets als Reaktion auf Entwickler-Prompts vorschlagen, nehmen agentische Coding-Systeme High-Level-Anweisungen entgegen und führen mehrstufige Pläne aus: vorhandene Codebasen lesen, neue Funktionen schreiben, Tests ausführen, Fehlermeldungen interpretieren und Bugs in einer Schleife beheben, bis die Aufgabe abgeschlossen ist. Führende agentische Coding-Plattformen umfassen Anthropics Claude Code, OpenAIs Codex CLI, Cursor, Devin von Cognition AI und Apples erweiterte Xcode-KI-Integration. Diese Systeme nutzen Large Language Models mit Tool-Use-Fähigkeiten und geben Agenten Zugang zu Dateisystemen, Terminals, Browser-Umgebungen und externen APIs. Agentisches Coding beschleunigt die Softwareentwicklung, indem repetitive Implementierungsaufgaben, Boilerplate-Generierung, Testschreiben und Refaktorierung an KI-Agenten ausgelagert werden. Wichtige Herausforderungen sind die Aufrechterhaltung der Code-Korrektheit in langen agentischen Sitzungen, die Vermeidung von Kontextdrift und sichere Sandboxing-Umgebungen. Bei Context Studios nutzen wir agentische Coding-Tools – insbesondere Claude Code und Cursor – als Kernkomponenten unseres internen Entwicklungs-Workflows, was schnellere Prototyp-Iterationen und automatisierte Testgenerierung für Kunden-KI-Anwendungen ermöglicht.

Konzept entdecken

Ökonomie & Skalierung

AI Model Ping-Pong

AI Model Ping-Pong ist ein AI economics-Konzept in modernen KI-Systemen, das das Kosten-Nutzen-Verhältnis der KI-Einführung und des Betriebs optimiert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo der Nachweis eines klaren ROI für fortlaufende KI-Investitionen entscheidend ist.

Konzept entdecken

Agentic Business

Async Agentisches Coding

Ein Entwicklungsworkflow, bei dem ein KI-Coding-Agent autonom auf der lokalen Maschine läuft und Aufgaben über einen längeren Zeitraum ausführt, ohne dass ständige Entwicklerüberwachung erforderlich ist. Der Entwickler schaut periodisch vorbei, um den Fortschritt zu überprüfen, Aktionen zu genehmigen oder Anleitung zu geben. Ermöglicht durch Tools wie Claude Code Remote Control.

Konzept entdecken

Agentic Infrastructure

Batch-Inferenz

Batch-Inferenz bezeichnet die gebündelte Verarbeitung mehrerer KI-Anfragen in einem einzelnen Durchlauf, statt jede Anfrage sofort einzeln zu beantworten. Inputs werden gesammelt, zu Batches zusammengefasst und gemeinsam durch das Modell verarbeitet – im Gegensatz zur Real-Time-Inferenz, bei der jede Anfrage sofort einzeln beantwortet wird. Die wirtschaftlichen Vorteile sind erheblich: KI-Anbieter wie Anthropic und OpenAI bieten Batch-APIs an, die 50–75% günstiger sind als synchrone Endpunkte. Der Grund ist bessere GPU-Auslastung – statt viele kleine Anfragen sequenziell zu verarbeiten, nutzen Batches verfügbare Rechenkapazität nahezu vollständig aus. NVIDIA Blackwell und Tensor-Kerne sind speziell auf hohen Batch-Durchsatz ausgelegt. Typische Batch-Inferenz Use Cases: Massenübersetzung von Dokumenten, automatisierte SEO-Analyse großer Content-Bibliotheken, tägliche Zusammenfassungen von News-Feeds, Produktkatalog-Klassifizierung, Sentiment-Analyse von Kundenfeedback und nächtliche Verarbeitung von Analysedaten. Gemeinsam ist diesen Szenarien: Ergebnisse werden nicht in Echtzeit benötigt – Verzögerungen von Minuten bis Stunden sind akzeptabel. Wichtige technische Parameter: Batch-Größe (Anzahl Anfragen pro Batch), maximale Latenz (Deadline für Ergebnisse), Fehlerbehandlung (was passiert bei einzelnen fehlschlagenden Items?) und adaptives Batching (dynamische Größenanpassung basierend auf Last und Token-Anzahl pro Anfrage). Moderne Batch-Systeme implementieren Continuous Batching für maximale GPU-Effizienz.

Konzept entdecken

KI-Sicherheit & Leitplanken

Benchmark-Kontamination

Benchmark-Kontamination bezeichnet das Problem, bei dem Evaluierungsdaten eines Benchmarks versehentlich oder absichtlich in den Trainingsdaten eines KI-Modells enthalten sind. Das Modell erscheint dadurch auf diesem Benchmark besser als es tatsächlich generalisiert — es hat Antworten 'auswendig gelernt' statt Fähigkeiten erworben. Das Problem ist systemischer Natur: Moderne Sprachmodelle trainieren auf riesigen Web-Datensätzen; populäre Benchmarks (MMLU, HumanEval, GSM8K, MATH) sind frei im Internet verfügbar, was versehentliche Aufnahme wahrscheinlich macht. Gleichzeitig schaffen wirtschaftliche Anreize Bedingungen für intentionale Kontamination. Symptome: Dramatisch bessere Benchmark-Scores als reale Task-Performance; große Diskrepanz zwischen Benchmark-Ergebnissen und Nutzererfahrungen; der 'MMLU-Shuffle'-Effekt, bei dem zufällige Antwort-Reihenfolgen Scores stark verändern — ein bekanntes Kontaminationssignal. Gegenmaßnahmen: Private Hold-out-Benchmarks vor Veröffentlichung; dynamische Benchmarks mit täglich neu generierten Fragen; Contamination-Detection über N-gram-Overlap-Analyse; Vertrauen auf unabhängige externe Evaluierungen statt Selbstberichte. Organisationen wie METR, HELM und ARC Evals entwickeln kontaminationsresistentere Methodologien.

Konzept entdecken

Agentic Business

Coding Agent

Ein KI-System, das über die Codevervollständigung hinausgeht und autonom komplexe Software-Engineering-Aufgaben wie das Implementieren von Funktionen, das Beheben von Fehlern, das Ausführen von Tests und das Verwalten von Git-Workflows durchführt.

Konzept entdecken

Agentic Business

Computer Use (KI)

Computer Use (KI) bezeichnet die Faehigkeit von KI-Agenten, einen Computer direkt zu bedienen — also Maus zu bewegen, zu klicken, Text einzugeben, Bildschirminhalte zu lesen und auf Anwendungen zuzugreifen — genau wie ein menschlicher Nutzer. Diese Faehigkeit wurde 2024 von Anthropic mit Claude als erste weitreichend verfuegbare Implementierung vorgestellt. Im Gegensatz zu herkoemmlicher Browser-Automatisierung (die auf strukturierten APIs, CSS-Selektoren und vordefinierten Skripten basiert) arbeitet ein Computer-Use-Agent auf Pixelebene: Er sieht einen Screenshot des Bildschirms, entscheidet, wo er klicken oder was er eingeben soll, fuehrt die Aktion aus und beobachtet das Ergebnis. Dieser Ansatz ist universell — er funktioniert mit jeder Anwendung und jeder Website ohne spezielles Engineering. Die praktischen Faehigkeiten umfassen: Navigation auf beliebigen Websites ohne API-Zugang, Interaktion mit Desktop-Anwendungen, Ausfuellen von Formularen, Extrahieren von Daten aus visuellen Interfaces, und die Ausfuehrung von mehrstufigen Workflows die keine programmatischen Schnittstellen haben. Computer Use hat auch bekannte Schwaechen: Es ist langsamer als direkte API-Aufrufe (da jeder Schritt einen Screenshot erfordert), anfaelliger fuer Fehler bei unerwarteten UI-Aenderungen, und teurer in Token-Verbrauch da Screenshots als Input mitgehen. Trotzdem ist es fuer viele Automatisierungsaufgaben, die keine API anbieten, die einzig praktikable Option.

Konzept entdecken

Agentic Infrastructure

Echtzeit-Inferenz

Echtzeit-Inferenz bezeichnet die sofortige Verarbeitung von KI-Anfragen mit minimaler Latenz, typischerweise im Bereich von Millisekunden bis wenige Sekunden. Im Gegensatz zur Batch-Inferenz, bei der Anfragen gesammelt und gebündelt verarbeitet werden, reagiert Echtzeit-Inferenz auf jede Eingabe unverzüglich — entscheidend für interaktive Anwendungen, bei denen Nutzer unmittelbares Feedback erwarten. Die wichtigste Metrik ist der Time-to-First-Token (TTFT): Zeit zwischen Anfrage und erstem Token der Antwort. Für Chatbots gilt TTFT unter 500ms als akzeptabel; für Coding-Assistenten werden sub-200ms angestrebt. Streaming-Ausgabe (Token für Token) verbessert die wahrgenommene Latenz erheblich, auch wenn die Gesamtantwortzeit gleich bleibt. Typische Echtzeit-Inferenz Use Cases: Konversations-Chatbots wie ChatGPT oder Claude.ai, KI-Coding-Assistenten wie GitHub Copilot oder Cursor, Echtzeit-Übersetzung, Voice-Assistenten (Spracherkennung + Generierung), interaktive Dokument-Analyse und autonome KI-Agenten, die schnell auf Umgebungsveränderungen reagieren müssen. Die technischen Anforderungen sind deutlich höher als bei Batch-Inferenz: niedrige Latenz erfordert geografisch nahe Server (Edge Inference), spezielle Low-Latency-Optimierungen oder kleinere, schnellere Modelle. Anbieter wie Groq (LPU-Chip) oder Cerebras erreichen über 500 TPS für Echtzeit-Anwendungen. Entscheidend ist der Trade-off zwischen Latenz, Durchsatz und Kosten pro Token.

Konzept entdecken

Reasoning & Verlässlichkeit

EHR

Elektronische Gesundheitsakte — digitale Patientenakte. KI-Agenten integrieren sich zunehmend mit EHR-Systemen für automatisierte Dokumentation.

Konzept entdecken

KI-Sicherheit & Leitplanken

Evidence Packs

Kuratierte Dokumentenbündel, die dem KI-Modell als verifizierte Faktenbasis für komplexe Aufgaben bereitgestellt werden, um Halluzinationen signifikant zu reduzieren.

Konzept entdecken

Reasoning & Verlässlichkeit

GGUF Format

GGUF ist ein Dateiformat zum Speichern quantisierter großer Sprachmodelle, das für effizientes Laden und Inferenz entwickelt wurde. Es hat das ältere GGML-Format ersetzt und wird häufig von Tools wie llama.cpp und Ollama verwendet, um Modelle lokal auszuführen.

Konzept entdecken

Reasoning & Verlässlichkeit

GLM-5

GLM-5 ist ein großes Sprachmodell von Zhipu AI, einem Pekinger KI-Forschungsunternehmen, mit rund 744 Milliarden Parametern – eines der leistungsfähigsten Open-Weight-Modelle, das bislang veröffentlicht wurde. GLM-5 ist das erste Open-Weight-Modell, das auf Augenhöhe mit OpenAIs GPT-5.2 abschneidet – bei Reasoning, Coding und mehrsprachigem Textverständnis. Anders als vollständig proprietäre Modelle von OpenAI, Google oder Anthropic sind die Gewichte von GLM-5 öffentlich zugänglich, sodass Unternehmen das Modell auf eigener Infrastruktur betreiben, für spezifische Domänen feinabstimmen und vollständige Datensouveränität gewährleisten können. GLM-5 nutzt eine Mixture-of-Experts-Architektur (MoE), bei der pro Inferenzschritt nur ein Bruchteil der Parameter aktiviert wird – das reduziert den Rechenaufwand gegenüber dichten Modellen vergleichbarer Stärke erheblich. Das Modell unterstützt ein 128K-Token-Kontextfenster und ermöglicht damit die Analyse langer Dokumente, komplexes mehrstufiges Reasoning sowie tiefes Code-Verständnis. GLM-5 markiert einen Wendepunkt in der globalen KI-Landschaft: Frontier-Intelligenz ist nicht länger das exklusive Terrain westlicher Tech-Konzerne. Das zweisprachige chinesisch-englische Vortraining verschafft GLM-5 einen Vorsprung bei ostasiatischen Sprachen, während die Leistung auch in europäischen Sprachen überzeugt. Bei Context Studios haben wir GLM-5 eingehend für Kundenanwendungen bewertet, bei denen On-Premise-Betrieb oder DSGVO-konforme Datenhaltung erforderlich ist. Die Kombination aus offenen Gewichten, erweitertem Kontextfenster und Frontier-Performance macht GLM-5 zur überzeugenden Alternative für Unternehmen, die Kontrolle und Compliance über API-Abhängigkeit stellen.

Konzept entdecken

Agentic Business

Human-in-the-Loop (HITL)

Menschliche Aufsicht, die in die KI-Entscheidungsfindung integriert ist.

Konzept entdecken

Agentic Infrastructure

Inferenz-Chip

Ein Inferenz-Chip ist ein spezialisierter Halbleiter-Prozessor, optimiert für die effiziente Ausführung von KI-Modellen bei der Inferenz. Im Gegensatz zu General-Purpose-CPUs oder Training-GPUs priorisieren Inferenz-Chips Durchsatz (TPS), Energieeffizienz und niedrige Latenz für bereits trainierte Modelle. Die drei dominanten Kategorien: GPUs wie NVIDIAs H100 und B200 Blackwell, die durch massive parallele Rechenarchitektur und Tensor-Kerne glänzen; TPUs (Tensor Processing Units) von Google, speziell für Matrix-Multiplikationen in neuronalen Netzen entwickelt; sowie ASICs (Application-Specific Integrated Circuits) für eine spezifische Aufgabe — etwa Groqs LPU (Language Processing Unit) mit 500+ TPS, Cerebrases CS-3 oder Amazons Inferentia-Chips. NVIDIAs Blackwell-Generation (GB200, B200) hat die Inferenz-Landschaft revolutioniert: Natives FP4 ermöglicht 4× mehr Operationen pro Watt vs. H100; 192 GB HBM3e-Speicher hält selbst die größten Frontier-Modelle vollständig im VRAM. Der GB200 NVL72 Rack (72 B200 GPUs, 1,4 TB Gesamt-VRAM) erreicht 30× höheren Durchsatz als H100-Systeme. Die Wahl des richtigen Inferenz-Chips beeinflusst Kosten, Latenz und maximale Modellgröße: Kleinere Modelle laufen effizient auf einzelnen H100s; Frontier-Modelle benötigen Multi-GPU-Cluster.

Konzept entdecken

Vertrauen & Souveränität

Injection Attack (LLM)

Bösartige Anweisungen in der Eingabe zur Manipulation des Verhaltens von LLM.

Konzept entdecken

Reasoning & Verlässlichkeit

JSON-RPC

Ein leichtgewichtiges Remote-Procedure-Call-Protokoll in JSON-Kodierung das als Kommunikationsschicht im Model Context Protocol fuer den standardisierten Nachrichtenaustausch verwendet wird.

Konzept entdecken

Reasoning & Verlässlichkeit

JSON-RPC

Ein leichtgewichtiges Remote-Procedure-Call-Protokoll in JSON-Kodierung das als Kommunikationsschicht im Model Context Protocol verwendet wird.

Konzept entdecken

Ökonomie & Skalierung

KI-Aktienverkauf

Ein KI-Aktienverkauf bezieht sich auf einen signifikanten Rückgang der Aktienkurse von KI-bezogenen Unternehmen. Im Februar 2026 erlebte der S&P 500 Software & Services Index einen bemerkenswerten Ausverkauf, während NVIDIA-CEO Jensen Huang eine optimistische Einschätzung der KI-Infrastrukturausgaben beibehielt.

Konzept entdecken

Agentic Business

KI-Coding-Agent

Ein KI-gestütztes System, das autonom Code generiert, modifiziert und bereitstellt und sich in Entwicklungsworkflows wie CI/CD-Pipelines und Versionskontrolle integriert. Im Gegensatz zu Code-Assistenten, die Vervollständigungen vorschlagen, können Coding-Agenten eigenständig ganze Aufgaben erledigen.

Konzept entdecken

Reasoning & Verlässlichkeit

KI-Coding-Desktop-App

Eine eigenständige Desktop-Anwendung für KI-gestützte Softwareentwicklung mit Agentenverwaltung, Aufgabenüberwachung und integrierten Entwicklungsworkflows.

Konzept entdecken

Agentic Infrastructure

KI-Inferenz

KI-Inferenz (auch AI Inference) bezeichnet den Prozess, bei dem ein trainiertes KI-Modell eine Eingabe verarbeitet und eine Vorhersage oder Ausgabe generiert. Im Gegensatz zum Training, das einmalig und rechenintensiv ist, findet Inferenz bei jeder einzelnen Nutzeranfrage statt — ob bei einem Chatbot, einem Coding-Assistenten oder einer Bildanalyse. Die Inferenz ist daher der mit Abstand kostenrelevanteste Faktor im KI-Betrieb: Während ein Modell einmal trainiert wird (Kosten im Millionenbereich), wird es millionenfach pro Tag für Inferenz genutzt. Die wichtigsten Metriken sind Time-to-First-Token (TTFT) für die Latenz und Tokens-per-Second (TPS) für den Durchsatz. Moderne Inferenz-Optimierungen umfassen Quantisierung (Reduktion der Rechengenauigkeit), Batching (Bündelung mehrerer Anfragen), Speculative Decoding und spezialisierte Hardware wie NVIDIAs Blackwell-Architektur. Für Unternehmen ist die Wahl zwischen Batch-Inferenz (günstig, aber langsam) und Echtzeit-Inferenz (schnell, aber teurer) eine zentrale Architekturentscheidung.

Konzept entdecken

Reasoning & Verlässlichkeit

Kontextfenster

Das Kontextfenster bezeichnet die maximale Textmenge – gemessen in Token –, die ein großes Sprachmodell in einem einzigen Inferenzaufruf verarbeiten und berücksichtigen kann. Token sind die Grundeinheiten des Texts für LLMs und entsprechen grob drei bis vier Zeichen oder drei Viertel eines englischen Wortes. Das Kontextfenster bestimmt, was das Modell beim Generieren einer Antwort sehen kann: Gesprächsverläufe, abgerufene Dokumente, Codedateien und Anweisungen konkurrieren alle um diesen begrenzten Raum. Frühe Transformer-Modelle wie BERT arbeiteten mit 512-Token-Fenstern; GPT-3 erweiterte dies auf 4.096 Token. Heutige Frontier-Modelle gehen weit darüber hinaus: GPT-4 Turbo bietet 128K Token, Googles Gemini 1.5 Pro unterstützt bis zu einer Million Token, und Anthropics Claude 3.7 Sonnet verarbeitet 200K Token – ausreichend, um ganze Rechtsverträge, Codebasen oder Bücher in einem einzigen Prompt zu verarbeiten. Das Kontextfenster ist eine kritische Architekturbeschränkung, da Attention-Mechanismen quadratisch mit der Sequenzlänge skalieren und sehr lange Kontexte rechenintensiv machen. Retrieval-Augmented Generation (RAG) entstand teilweise als Workaround für begrenzte Kontextfenster, indem relevante Passagen dynamisch abgerufen werden. Mit wachsenden Kontextfenstern ergänzen sich RAG und Long-Context-Ansätze zunehmend, anstatt zu konkurrieren. GLM-5 unterstützt ein 128K-Token-Kontextfenster. Bei Context Studios ist die Größe des Kontextfensters eine der ersten Spezifikationen, die wir bei der Auswahl eines Sprachmodells für einen Kundenanwendungsfall evaluieren.

Konzept entdecken

Reasoning & Verlässlichkeit

Medical Coding

Übersetzung medizinischer Diagnosen in standardisierte Codes (ICD-10/11, CPT). KI-Agenten automatisieren diesen fehleranfälligen Prozess.

Konzept entdecken

Agentic Infrastructure

Mixture-of-Experts (MoE)

Mixture-of-Experts (MoE) ist eine neuronale Netzwerkarchitektur, bei der ein Modell aus mehreren spezialisierten Teilnetzwerken – sogenannten Experten – besteht, kombiniert mit einem erlernten Gating-Mechanismus, der jeden Eingabe-Token dynamisch zu den relevantesten Experten weiterleitet. Anstatt bei jedem Token alle Parameter zu aktivieren, wählt ein MoE-Modell pro Vorwärtsdurchlauf nur eine kleine Teilmenge der Experten aus – typischerweise zwei bis acht von Dutzenden. Das reduziert den aktiven Rechenaufwand erheblich, ohne die Gesamtkapazität zu verringern. Google Brain popularisierte dieses Konzept mit dem Switch Transformer, Mistral AI brachte es mit Mixtral 8x7B und 8x22B in die Open-Source-Community. Heute nutzen GPT-4, Gemini 1.5 Pro, DeepSeek V3 und GLM-5 alle MoE-Architekturen. MoE ermöglicht es, die Gesamtanzahl der Parameter auf Hunderte von Milliarden oder gar Billionen zu skalieren, ohne dass die Inferenzkosten proportional steigen: Ein MoE-Modell mit 700 Milliarden Parametern aktiviert pro Token möglicherweise nur 40 bis 70 Milliarden, was den Betriebskosten eines weit kleineren dichten Modells entspricht. Der entscheidende Kompromiss ist der Speicherbedarf: Alle Expertengewichte müssen während der Inferenz im VRAM liegen, auch wenn nur ein Bruchteil genutzt wird. MoE ist heute ein grundlegendes Muster in der Frontier-KI-Entwicklung, das die Wissenskapazität eines massiven Modells zu den Kosten eines kompakten ermöglicht. Bei Context Studios ist das Verständnis von MoE essenziell, wenn wir Kunden bei der GPU-Infrastruktur für Self-Hosted-Deployments beraten.

Konzept entdecken

Reasoning & Verlässlichkeit

Modell-Einstellung

Modell-Einstellung ist der Prozess, bei dem KI-Unternehmen ältere KI-Modelle abkündigen und einstellen und Nutzer auf neuere Versionen umleiten. OpenAIs Einstellung von GPT-4o am 13. Februar 2026 war bemerkenswert für die emotionale Reaktion, die sie auslöste, und verdeutlichte die Bindung der Nutzer an spezifische KI-Persönlichkeiten.

Konzept entdecken

Reasoning & Verlässlichkeit

Moonshot AI

Ein chinesisches KI-Unternehmen, das die Kimi-Serie von Sprachmodellen entwickelt hat, bekannt für bahnbrechende ultra-lange Kontextfenster und wettbewerbsfähige Open-Source-Modelle.

Konzept entdecken

Agentic Business

Multi-Agenten-Kommunikation

Multi-Agenten-Kommunikation bezeichnet die Protokolle, Mechanismen und Patterns, über die mehrere KI-Agenten miteinander interagieren, Informationen austauschen und Aufgaben koordinieren. In komplexen KI-Systemen arbeiten spezialisierte Agenten zusammen: Ein Orchestrator koordiniert Sub-Agenten für Recherche, Schreiben, Qualitätsprüfung und Publishing. Die dominanten Kommunikationsmodelle: Direktes Orchestrieren (übergeordneter Agent ruft Sub-Agenten auf), MCP (Model Context Protocol) von Anthropic als standardisierter Tool-Aufruf-Protokoll zwischen Agenten und externen Diensten, A2A (Agent-to-Agent Protocol) von Google als offenem Standard für Peer-Kommunikation, sowie Message-Queue-basierte Systeme für asynchrone Kommunikation. Kritische Design-Entscheidungen: Synchron vs. asynchron (synchron = einfacher, asynchron = skalierbarer); Push vs. Pull; Fehlerhandling (was passiert, wenn ein Sub-Agent ausfällt?); Zustandsmanagement (wie wird gemeinsamer Kontext konsistent gehalten?). Jede Agent-zu-Agent-Schnittstelle muss explizit spezifiziert, versioniert und unabhängig getestet werden. Praxisbeispiel: Ein Content-Erstellungs-Multi-Agent-System besteht aus Recherche-Agent (holt aktuelle Daten via MCP), Schreib-Agent (erhält Research-Output, generiert Draft), Qualitäts-Agent (prüft Draft gegen Regeln) und Publishing-Agent (veröffentlicht genehmigten Content). Ohne klare Kommunikationsverträge werden Multi-Agenten-Systeme fragil und schwer zu debuggen.

Konzept entdecken

Reasoning & Verlässlichkeit

Multimodale KI

Multimodale KI bezeichnet künstliche Intelligenzsysteme, die Informationen über mehrere Datenmodalitäten hinweg verarbeiten, verstehen und generieren können – darunter Text, Bilder, Audio, Video und strukturierte Daten – innerhalb eines einzigen, einheitlichen Modells. Anders als unimodale Systeme, die auf einen Datentyp spezialisiert sind, können multimodale KI-Modelle gleichzeitig über Modalitäten hinweg schlussfolgern: ein Bild beschreiben, Fragen zu einem Video beantworten, Sprache transkribieren und analysieren oder Bilder aus Textbeschreibungen generieren. Die Transformer-Architektur, die von Google Brain entwickelt und später von OpenAI, DeepMind und Anthropic verfeinert wurde, erwies sich durch Attention-Mechanismen, die einheitlich über diverse Token-Sequenzen operieren, als natürlich geeignet für multimodales Lernen. Wegweisende multimodale Modelle sind OpenAIs GPT-4V und GPT-4o, Google DeepMinds Gemini 1.5 und 2.0, Anthropics Claude-3-Familie und Metas Llama 3.2 Vision. ByteDances Seedance 2.0 ist ein Beispiel für multimodale KI in der Videogenerierung. Die praktischen Anwendungen multimodaler KI reichen von Gesundheitswesen (gemeinsame Analyse von Bildbefunden und klinischen Notizen) über Fertigung (Kombination von Sensordaten mit visueller Inspektion) bis zu Handel (Bildersuche nach Produkten) und Medien (automatische Videountertitelung). Multimodale KI wird schnell zum Standard-Paradigma für Foundation Models. Bei Context Studios setzen wir multimodale KI in Kundenanwendungen ein – von Dokumentenintelligenz-Pipelines, die Text und eingebettete Bilder verarbeiten, bis zu Produktvisualisierungstools.

Konzept entdecken

Agentic Infrastructure

NVIDIA Blackwell

NVIDIA Blackwell ist NVIDIAs KI-GPU-Architektur der neuesten Generation, benannt nach Mathematiker David Harold Blackwell. Auf GTC 2024 vorgestellt und auf GTC 2025/2026 erweitert, umfasst sie mehrere GPU-Varianten: B200 (Inferenz- und Training-optimiert), GB200 (Grace Blackwell Superchip, kombiniert ARM-CPU + B200-GPU), und GB200 NVL72 (72-GPU-Rack-Scale-System für Hyperscaler). Technische Fortschritte gegenüber Hopper (H100): Natives FP4 bedeutet gegenüber FP8 nochmals 2× Recheneffizienz. Der B200 erreicht 20 Petaflops FP4-Inferenz-Leistung. Der integrierte NVLink-Switch mit 1,8 TB/s Bandbreite eliminiert Inter-GPU-Kommunikations-Bottlenecks. 192 GB HBM3e-Speicher pro B200 ermöglicht, 400B-Parameter-Modelle ohne Model-Parallelism zu halten. Für Inferenz besonders relevant: Der GB200 NVL72 Rack (72 B200 GPUs, 1,4 TB HBM3e gesamt) hält ein 1-Billion-Parameter-Modell vollständig im VRAM und verarbeitet es mit 30× höherem Durchsatz als H100-Systeme. Auf GTC 2026 kündigte NVIDIA Blackwell Ultra an: weitere 2× Inferenz-Durchsatz-Verbesserung plus verbesserte Multi-Instance-GPU-Fähigkeiten. Cloud-Anbieter AWS, Azure und Google Cloud deployen Blackwell-Infrastruktur schrittweise 2025/2026, was zu weiteren API-Preissenkungen führt.

Konzept entdecken

Agentic Infrastructure

NVIDIA Vera Rubin

NVIDIA Vera Rubin ist die nächste GPU-Architekturgeneration nach Blackwell, auf dem GTC 2026 von Jensen Huang angekündigt und für 2026/2027 geplant. Benannt nach Astronomin Vera Rubin, die Evidenz für dunkle Materie lieferte, soll die Architektur erneut einen Generationssprung bei KI-Inferenz- und Training-Performance bringen. Bekanntgegebene Eckdaten: Der 'Vera' ARM-CPU als Nachfolger des Grace-Prozessors mit höherer Speicherbandbreite und verbesserten KI-Erweiterungen, sowie der 'Rubin' GPU-Die als Rechenmotor. Gemeinsam bilden sie den Vera Rubin Superchip — analog zur Grace Blackwell Architektur. NVIDIA folgt seinem jährlichen Roadmap-Rhythmus: Hopper (2022) → Blackwell (2024) → Blackwell Ultra (2025) → Vera Rubin (2026/2027). Für die KI-Industrie bedeutet Vera Rubin die Fortsetzung des Hardware-Deflationstrends: Alle 1–2 Jahre verdoppelt bis verdreifacht sich die Inferenz-Performance pro Dollar. Dieser Trend treibt den jährlichen 50–80% Preisverfall bei LLM-APIs. Unternehmen mit teuren Inferenz-Workloads können bei Vera-Rubin-basierter Cloud-Kapazität mit drastisch günstigeren Kosten rechnen. Im Wettbewerb konkurriert NVIDIA mit AMDs MI400, Googles Ironwood TPU (ebenfalls GTC 2026 angekündigt), Intel Gaudi 4 und ASIC-Anbietern wie Groq, Cerebras und Amazon Trainium 3.

Konzept entdecken

Agentic Business

Phase-Budget

Ein Phase-Budget ist ein explizit definiertes Zeitlimit oder Token-Limit für eine einzelne Phase innerhalb eines KI-Agenten-Workflows. Das Konzept entstammt dem GSD-Framework von Context Studios und löst eines der häufigsten Probleme bei autonomen Agenten: unkontrolliertes Wachsen von Sitzungen (Runaway Sessions), bei denen Agenten ohne Zeitbeschränkung in analyseparalytische Endlos-Loops geraten. In der Praxis: Ein Content-Erstellungs-Agent erhält 120 Sekunden für Recherche, 300 Sekunden für Schreiben und 60 Sekunden für Qualitätsprüfung. Überschreitet eine Phase das Budget, bricht der Agent diese Phase ab, gibt das bisherige Ergebnis weiter und protokolliert die Überschreitung. So blockiert kein einzelner überlaufender Schritt die gesamte Pipeline. Phase-Budgets sind besonders kritisch in Multi-Agent-Systemen, wo ein langsamer Teilagent die gesamte Orchestrierung verzögern kann. Sie ermöglichen präzise Kostenkontrolle: Da LLM-Inferenzkosten direkt von Token-Anzahl abhängen, begrenzen Token-Budgets maximale Kosten pro Phase. Best Practices: Budgets großzügig, aber nicht unbegrenzt setzen. Immer einen Fallback definieren — was passiert bei Überschreitung? Budgets empirisch nach mehreren Produktionsläufen kalibrieren. Typische Token-Budgets: 2.000–20.000 Tokens pro Phase je nach Aufgabenkomplexität.

Konzept entdecken

Reasoning & Verlässlichkeit

Research Preview

Eine Vorabversion von Software für begrenzte Nutzer zum Testen vor dem offiziellen Launch. Üblich bei KI-Produkten.

Konzept entdecken

Reasoning & Verlässlichkeit

SaaS-Wildwuchs

SaaS-Wildwuchs bezeichnet das unkontrollierte Wachstum von Software-as-a-Service-Abonnements in einer Organisation. Das durchschnittliche Unternehmen nutzt 130+ SaaS-Tools, wobei 25-30% der Ausgaben für ungenutzte Lizenzen verschwendet werden. KI-Super-Apps versprechen, den SaaS-Wildwuchs zu reduzieren.

Konzept entdecken

Agentic Infrastructure

Sandboxed Iframe

Ein Sandboxed Iframe ist ein eingeschränkter HTML-Container, der eingebetteten Inhalt aus Sicherheitsgründen von der übergeordneten Seite isoliert. Im Kontext von MCP Apps ermöglichen Sandboxed Iframes KI-Assistenten, interaktive Drittanbieter-Anwendungen sicher in Konversationen zu rendern.

Konzept entdecken

Agentic Infrastructure

Semantic Router

Eine leichtgewichtige Schicht, die die Absicht des Nutzers klassifiziert und an den effizientesten Sub-Agenten oder das passende Modell weiterleitet, um Zeit und Geld zu sparen.

Konzept entdecken

Reasoning & Verlässlichkeit

Small Language Model (SLM)

Ein KI-Sprachmodell mit relativ wenigen Parametern (typischerweise unter 10B), das für eine effiziente lokale Bereitstellung auf Verbrauchshardware konzipiert ist und gleichzeitig nützliche Fähigkeiten für spezifische Aufgaben beibehält.

Konzept entdecken

Inference & Engineering

Spec-Driven Development

Spec-Driven Development ist ein AI engineering-Konzept in modernen KI-Systemen, das die Entwicklung und Wartung KI-gestützter Systeme verbessert. Es spielt eine Schlüsselrolle in Enterprise-KI-Deployments, wo Software-Qualität und Entwicklungsgeschwindigkeit direkt Geschäftsergebnisse beeinflussen.

Konzept entdecken

Agentic Business

Spec-Driven Scaffolding

Spec-Driven Scaffolding bezeichnet den Ansatz, KI-Agenten nicht durch freie Prompts, sondern durch strukturierte, maschinenlesbare Spezifikationen zu steuern — ähnlich wie Softwareentwickler Code gegen technische Anforderungsdokumente schreiben. Statt 'schreibe einen Blogpost über KI' definiert eine Spezifikation präzise: Format, Zielgruppe, Mindest-Wortanzahl, erforderliche Sektionen, Quellenpflichten, verbotene Formulierungen und Akzeptanzkriterien. Das 'Scaffolding' bezeichnet das Gerüst strukturierter Instruktionen, das dem Agenten Halt gibt und Drift verhindert. Wie ein Baugerüst während der Konstruktion gibt das Spec-Scaffolding dem Agenten zur Laufzeit eine feste Struktur. Diese umfasst typischerweise: Agenten-Rolle und Kontext, Eingabe-Validierungsregeln, Schritt-für-Schritt-Deliverables, Output-Format-Anforderungen und explizite Grenzen (was der Agent nicht tun soll). Der Unterschied zu klassischem Prompt Engineering ist fundamental: Prompt Engineering optimiert für Sprachqualität; Spec-Driven Scaffolding optimiert für Verhaltenskonsistenz. Ein gut spezifizierter Agent produziert beim 1000. Durchlauf das gleiche strukturelle Ergebnis wie beim ersten. Spec-Driven Scaffolding ermöglicht einen wichtigen operativen Vorteil: Spezifikationen können versioniert, peer-reviewed, getestet und iterativ verbessert werden, unabhängig vom zugrundeliegenden Modell.

Konzept entdecken

Inference & Engineering

Speculative Decoding

Eine Optimierungstechnik, bei der ein kleines, schnelles Modell die nächsten Token vorhersagt und ein großes Modell diese nur verifiziert, was die Geschwindigkeit drastisch erhöht.

Konzept entdecken

Agentic Infrastructure

Test Felder

Dies ist eine Testdefinition die alle Felder testet. KI-Inferenz bezeichnet den Prozess, bei dem ein trainiertes KI-Modell neue Eingabedaten verarbeitet und Vorhersagen oder Ausgaben generiert. Dies ist eine ausreichend lange Definition mit mehreren Sätzen, die den Begriff klar erklärt. Wir beschreiben hier die Grundlagen der KI-Inferenz und ihre Bedeutung für den laufenden Betrieb. In der Praxis sind Inferenzkosten der dominierende Kostenfaktor.

Konzept entdecken

Reasoning & Verlässlichkeit

Text-to-Video

Text-to-Video bezeichnet eine Kategorie generativer KI-Technologie, bei der Modelle Videosequenzen direkt aus natürlichsprachlichen Beschreibungen erzeugen – ohne traditionelles Filmen, Animation oder manuelles Editing. Text-to-Video-Modelle analysieren einen Textprompt und synthetisieren temporal konsistente Videoframes, die die beschriebenen Szenen, Kamerabewegungen, Lichtverhältnisse und Objekte abbilden. Das Feld hat sich seit OpenAIs Sora, das Anfang 2024 mit physikalisch plausiblen, minutenlangen kinematischen Clips Aufsehen erregte, rasant entwickelt. Führende Text-to-Video-Systeme sind heute Googles Veo 3, ByteDances Seedance 2.0, Runway MLs Gen-3 Alpha, Stability AIs Stable Video Diffusion und Kling AI von Kuaishou. Die meisten modernen Modelle kombinieren großangelegte Video-Diffusionsarchitekturen mit Sprachencodern wie CLIP oder T5 für reichhaltige semantische Verankerung. Wichtige Leistungsdimensionen umfassen Videodauer, Auflösung, Bewegungsrealismus, Prompt-Treue, Charakterkonsistenz und Kamerasteuerung (Schwenk, Zoom, Dolly). Text-to-Video transformiert Marketing, Unterhaltung, Bildung und E-Commerce, indem es KI-native Videoinhalte zu einem Bruchteil herkömmlicher Produktionskosten ermöglicht. Marken können Produktdemonstrationen, Erklärvideos und Social-Media-Inhalte programmatisch in großem Maßstab generieren. Context Studios integriert Text-to-Video-Generierung in Client-Content-Pipelines und nutzt Modelle wie Veo 3, Seedance 2.0 und Sora für Social Content, Produktvisualisierungen und automatisierte Videoproduktions-Workflows.

Konzept entdecken

Agentic Infrastructure

Tokens per Second (TPS)

Tokens per Second (TPS) ist die primäre Durchsatz-Metrik für KI-Sprachmodell-Inferenz. Sie misst, wie viele Tokens pro Sekunde ein Modell generiert, nachdem der Generierungsprozess begonnen hat. TPS und Time-to-First-Token (TTFT) bestimmen gemeinsam die User Experience. Ein Token entspricht grob 0,75 Wörtern in Englisch oder 0,5–0,6 Wörtern in anderen Sprachen. Typische TPS-Werte: Groqs LPU erreicht 500–800 TPS für 7B-Modelle; Anthropics Claude-API liefert je nach Modell 30–100 TPS; Open-Source-Modelle auf einem H100 erreichen 50–200 TPS je nach Größe. TPS beeinflusst UX auf zwei Weisen: Für kurze Anfragen (bis ~500 Tokens) dominiert TTFT die gefühlte Responsivität; für lange Outputs (Dokumente, Code, Analysen) wird TPS entscheidend. Bei 30 TPS benötigt ein 3.000-Wörter-Dokument ~80 Sekunden; bei 200 TPS nur ~12 Sekunden. Für Voice-KI ist mindestens 100 TPS notwendig für Sprachsynthese ohne wahrnehmbare Lücken. Einflussfaktoren: Modellgröße (größer = langsamere TPS), Quantisierungsniveau (FP4 vs FP8 vs BF16), Batch-Größe (höheres Batching erhöht Gesamt-TPS, senkt individuelles TPS), Hardware und KV-Cache-Auslastung.

Konzept entdecken

Reasoning & Verlässlichkeit

Vendor Lock-In (KI)

Vendor Lock-In in der KI bezeichnet die Abhängigkeit von den Modellen, Tools und dem Ökosystem eines einzelnen KI-Anbieters, was den Wechsel kostspielig macht. GitHubs Agent HQ begegnet dem durch Unterstützung mehrerer KI-Agenten, sodass Entwickler Einzelanbieter-Abhängigkeit vermeiden können.

Konzept entdecken

Reasoning & Verlässlichkeit

YAML Frontmatter

Ein Metadatenblock am Anfang einer Datei im YAML-Format, haeufig zur Konfiguration von KI-Agent-Skills und Dokumentation verwendet.

Konzept entdecken