---
type: Glossary Term
title: Distillationsangriff (Distillation Attack)
description: "Ein Distillationsangriff (englisch: distillation attack) ist eine Form des Modelldiebstahls, bei der ein Angreifer ein fremdes, proprietäres KI-Modell systemati"
resource: "https://www.contextstudios.ai/de/glossar/distillation-attack"
category: security
language: de
timestamp: "2026-06-26T12:03:40.492Z"
---

# Distillationsangriff (Distillation Attack)

Ein Distillationsangriff (englisch: distillation attack) ist eine Form des Modelldiebstahls, bei der ein Angreifer ein fremdes, proprietäres KI-Modell systematisch über dessen Schnittstelle abfragt, die Antworten sammelt und mit diesen Ausgaben ein eigenes, konkurrierendes Modell trainiert. Auf diese Weise lassen sich die Fähigkeiten eines hochwertigen Modells nachbilden, ohne jemals Zugriff auf dessen Gewichte, Trainingsdaten oder Architektur zu haben — der Angreifer rekonstruiert das Verhalten allein aus den beobachteten Ein- und Ausgaben. Technisch ähnelt das Verfahren der legitimen Modell-Distillation, bei der ein Anbieter bewusst ein kleineres Schülermodell auf den Ausgaben eines eigenen, größeren Lehrermodells trainiert. Der entscheidende Unterschied liegt in der Autorisierung: Beim Angriff wird das geistige Eigentum eines fremden Anbieters ohne Erlaubnis extrahiert. Prominent wurde der Fall, als Anthropic dem US-Senat meldete, Alibaba-nahe Akteure hätten Claude in großem Stil distilliert. Für Unternehmen sind solche Angriffe doppelt relevant: Wer ein eigenes Modell betreibt, riskiert dessen Nachbildung; wer Drittmodelle einsetzt, muss deren Herkunft hinterfragen. Schutzmaßnahmen reichen von Rate-Limits und Anomalieerkennung über Wasserzeichen in den Ausgaben bis zu vertraglichen Nutzungsbeschränkungen.