AI Knowledge Base 2026

Glossaire IA 2026

Définitions claires pour l'ère de l'IA agentique et de l'intelligence spatiale.

Business Agentique

Continuité de Session

La continuité de session désigne la capacité d'un agent IA ou d'un système à maintenir l'état, le contexte et la progression d'une tâche en cours lors d'interruptions, de redémarrages ou de changements de session. Comme les LLM sont par nature sans état (pas de mémoire à long terme intégrée), la continuité doit être implémentée explicitement via des mécanismes externes. Le défi fondamental: chaque nouvelle conversation LLM commence sans connaissance des interactions précédentes. Pour les tâches d'agents longues — comme un projet de recherche multi-jours ou un processus de contenu en continu — c'est problématique. La solution réside dans des stores d'état externes et des transferts de contexte structurés. Les stratégies d'implémentation pour la continuité de session comprennent: les fichiers de mémoire, les bases de données vectorielles, les objets d'état structurés (documents JSON représentant l'état complet de l'agent), et les journaux d'événements. L'architecture de continuité de session implique typiquement plusieurs couches: un cache chaud pour le contexte récent, un store de mémoire sémantique pour les connaissances à long terme, et un journal d'événements pour la reproductibilité complète.

Explore Concept
Économie & Échelle

Coût d'Inférence

Le coût d'inférence désigne les dépenses financières encourues lors de l'exploitation d'un modèle de langage IA. Contrairement aux coûts d'entraînement (ponctuels, très élevés), les coûts d'inférence s'accumulent continuellement et représentent le principal facteur de coût IA dans les opérations courantes. Les coûts d'inférence sont facturés en prix par token. En 2026 : GPT-4o environ 2–5 $/M tokens d'entrée ; Claude Sonnet à 3 $/M entrée, 15 $/M sortie ; modèles abordables comme Haiku ou Gemini Flash 0,25–1 $/M tokens. Les tokens de sortie coûtent plus cher que les tokens d'entrée, donc les systèmes rentables optimisent la longueur des sorties. Les coûts d'inférence ont chuté de plus de 100× depuis 2023 — les performances équivalentes GPT-4 coûtent maintenant ~1% de leur prix de 2023. Cette tendance se poursuit avec les déploiements Blackwell et Vera Rubin. Stratégies d'optimisation clés : routage des modèles (modèles bon marché pour les tâches simples), inférence batch (remise 50–75%), optimisation des prompts (demander des sorties plus courtes), mise en cache des requêtes fréquentes.

Explore Concept
Business Agentique

Codage Agentique

Le codage agentique désigne des workflows de développement logiciel dans lesquels des agents IA écrivent, testent, déboguent, refactorisent et itèrent du code de manière autonome avec une intervention humaine minimale, opérant sur plusieurs étapes pour accomplir des tâches de programmation complexes. Contrairement aux assistants de code IA traditionnels comme GitHub Copilot — qui suggèrent des complétions ou des extraits en réponse aux invites des développeurs — les systèmes de codage agentique reçoivent des instructions de haut niveau et exécutent des plans multi-étapes : lire les bases de code existantes, écrire de nouvelles fonctions, exécuter des tests, interpréter les messages d'échec et corriger les bugs en boucle jusqu'à l'achèvement de la tâche. Les principales plateformes de codage agentique comprennent Claude Code d'Anthropic, Codex CLI d'OpenAI, Cursor, Devin de Cognition AI et l'intégration améliorée de l'IA dans Xcode d'Apple. Ces systèmes exploitent des grands modèles de langage avec des capacités d'utilisation d'outils, donnant aux agents accès aux systèmes de fichiers, terminaux, environnements de navigateur et API externes. Le codage agentique accélère le développement logiciel en déléguant les tâches d'implémentation répétitives, la génération de code standard, l'écriture de tests et la refactorisation à des agents IA. Les défis clés incluent le maintien de la correction du code sur de longues sessions agentiques, l'évitement de la dérive de contexte et l'assurance d'un sandboxing sécurisé. Chez Context Studios, nous utilisons des outils de codage agentique — notamment Claude Code et Cursor — comme composants essentiels de notre workflow de développement interne, permettant des itérations de prototypes plus rapides et une génération automatisée de tests pour les applications IA clients.

Explore Concept
Business Agentique

Communication Multi-Agents

La communication multi-agents englobe les protocoles, mécanismes et patterns par lesquels plusieurs agents IA interagissent, échangent des informations et coordonnent des tâches. Dans les systèmes IA complexes, des agents spécialisés collaborent fréquemment : un orchestrateur coordonne des sous-agents pour la recherche, l'écriture, le contrôle qualité et la publication. Modèles de communication dominants : orchestration directe, MCP (Model Context Protocol) d'Anthropic comme protocole standardisé d'appel d'outils entre agents et services externes, A2A (Agent-to-Agent Protocol) de Google comme standard ouvert pour la communication pair-à-pair, et systèmes basés sur des files de messages pour la communication asynchrone. Décisions de conception critiques : synchrone vs. asynchrone ; push vs. pull ; gestion des erreurs (que se passe-t-il quand un sous-agent échoue ?) ; gestion de l'état (comment le contexte partagé est maintenu cohérent ?). Chaque interface agent-à-agent doit être explicitement spécifiée, versionnée et testée indépendamment. Exemple concret : un système multi-agents de création de contenu comprend un Agent de Recherche, un Agent de Rédaction, un Agent Qualité et un Agent de Publication. Sans contrats de communication clairs, les systèmes multi-agents deviennent fragiles.

Explore Concept
Sécurité IA & Garde-fous

Contamination de Benchmark

La contamination de benchmark désigne le problème où les données d'évaluation d'un benchmark apparaissent dans les données d'entraînement d'un modèle, accidentellement ou intentionnellement. En conséquence, le modèle semble mieux performer sur ce benchmark qu'il ne généralise réellement à des données non vues — il a 'mémorisé' les réponses plutôt qu'acquis les capacités sous-jacentes. La contamination est un défi systémique : les modèles de langage modernes s'entraînent sur de vastes données web ; les benchmarks populaires (MMLU, HumanEval, GSM8K) sont librement disponibles en ligne, rendant l'inclusion accidentelle probable. Des incitations économiques créent également des conditions pour une contamination intentionnelle. Les symptômes comprennent : des scores de benchmark considérablement meilleurs que les performances sur tâches réelles ; l'effet 'MMLU shuffle' où le réordonnancement aléatoire des choix de réponses modifie significativement les scores. Les contre-mesures : benchmarks privés tenus secrets avant publication ; benchmarks dynamiques à questions quotidiennement générées ; détection de contamination via analyse de chevauchement n-gramme ; s'appuyer sur des évaluations externes indépendantes. Des organisations comme METR, HELM et ARC Evals développent des méthodologies résistantes à la contamination.

Explore Concept