---
type: Glossary Term
title: Attaque par distillation
description: Une attaque par distillation est une forme de vol de modèle dans laquelle un adversaire interroge à plusieurs reprises un modèle IA propriétaire via son interfa
resource: "https://www.contextstudios.ai/fr/glossaire/distillation-attack"
category: security
language: fr
timestamp: "2026-07-01T15:27:31.844Z"
---

# Attaque par distillation

Une attaque par distillation est une forme de vol de modèle dans laquelle un adversaire interroge à plusieurs reprises un modèle IA propriétaire via son interface publique, récolte les réponses et utilise ces sorties pour entraîner un modèle concurrent. L'attaquant clone effectivement le comportement d'un modèle de grande valeur sans jamais toucher à ses poids, ses données d'entraînement ou son architecture — la capacité est reconstruite uniquement à partir des entrées et sorties observées. Mécaniquement, l'approche reflète la distillation de modèle légitime, où un fournisseur entraîne délibérément un modèle étudiant plus petit sur les sorties de son propre modèle enseignant plus grand. La différence réside dans le consentement : lors d'une attaque, la propriété intellectuelle d'une autre entreprise est extraite sans permission. La tactique a gagné en notoriété lorsque Anthropic a informé le Sénat américain que des opérateurs liés à Alibaba avaient distillé Claude à grande échelle. L'exposition fonctionne dans les deux sens. Si vous exploitez votre propre modèle, une attaque réussie peut reproduire des années d'investissement en quelques jours. Si vous vous appuyez sur des modèles tiers, la provenance de ce sur quoi vous vous basez devient une question à se poser. Les défenses vont de la limitation de débit et la détection d'anomalies au tatouage numérique des sorties et aux restrictions contractuelles d'utilisation.
