---
type: Comparison
title: "Sous-agents récursifs vs équipes de sous-agents à plat (2026) : imbrication profonde ou orchestration prévisible ?"
description: "Claude Code 2.1.172 autorise cinq niveaux d'imbrication. Sous-agents récursifs vs équipes à plat : coût, traçabilité, profondeur de raisonnement et risque comparés 2026."
resource: "https://www.contextstudios.ai/fr/comparaison/recursive-sub-agents-vs-flat-sub-agent-teams"
category: approach
language: fr
timestamp: "2026-06-11T11:06:54.897Z"
---

# Sous-agents récursifs vs équipes de sous-agents à plat (2026) : imbrication profonde ou orchestration prévisible ?

Claude Code 2.1.172 (juin 2026) a apporté le plus grand changement à son architecture d'agents à ce jour : les sous-agents peuvent désormais lancer leurs propres sous-agents, jusqu'à cinq niveaux de profondeur. Jusqu'à cette version, la hiérarchie était délibérément plate — une session principale déléguait à des workers, et ces workers ne pouvaient pas s'imbriquer. Ce modèle à plat reste pleinement pris en charge, ce qui laisse aux équipes un vrai choix d'architecture : laisser les agents se ramifier en arbres profonds et auto-organisés, ou conserver un orchestrateur unique qui répartit vers un pool plat de spécialistes. Le compromis oppose la capacité au contrôle. Les sous-agents récursifs peuvent décomposer des problèmes ouverts à une profondeur arbitraire, mais ils alourdissent le coût en jetons et compliquent la traçabilité. Les équipes à plat sont prévisibles, faciles à déboguer et moins chères, mais elles limitent la profondeur à laquelle un seul fil de raisonnement peut s'auto-organiser. Cette comparaison évalue les deux approches selon la profondeur de décomposition, le coût, la traçabilité, la puissance de raisonnement, le risque d'emballement, le parallélisme, la spécialisation et la maturité en production.

## Comparison Factors

| Factor | Sous-agents récursifs | Équipes de sous-agents à plat | Winner |
|--------|------|------|--------|
| Profondeur de décomposition de la tâche | Les sous-agents lancent leurs propres sous-agents jusqu'à 5 niveaux et décomposent les problèmes ouverts à profondeur arbitraire | Limité à un seul niveau — un orchestrateur unique répartit vers des workers qui ne peuvent pas s'imbriquer | a |
| Coût en jetons et prévisibilité budgétaire | Le contexte est hérité à chaque niveau et amplifie le multiplicateur d'environ 15x des jetons multi-agents | Dépense prévisible et bornée — chaque worker s'exécute une fois sous l'orchestrateur | b |
| Traçabilité et débogage | Les arbres profonds deviennent des chaînes opaques ; difficile de tracer quel niveau a produit un résultat | Graphe de nœuds clair et plat, avec des points d'inspection et d'intervention évidents | b |
| Raisonnement multi-étapes le plus ardu | Excelle quand une sous-tâche doit se décomposer davantage en cours d'exécution | Solide pour le travail parallèle, mais un seul worker ne peut pas s'auto-organiser plus en profondeur | a |
| Risque d'emballement et rayon d'impact | Nécessite des limites d'arrêt explicites, sinon une branche peut boucler et brûler le budget | Borné par conception — pas d'explosion récursive, la hiérarchie reste prévisible | b |
| Débit parallèle | Se ramifie en profondeur ; de nombreuses branches s'exécutent, mais le coût de coordination augmente | Se ramifie en largeur ; des workers indépendants s'exécutent proprement et simultanément | tie |
| Spécialisation et routage de modèle par nœud | Chaque nœud imbriqué peut router vers un modèle différent (Haiku/Sonnet/Opus) adapté à sa sous-tâche | Les workers routent par rôle, mais la spécialisation est large d'un niveau, pas profonde | a |
| Maturité en production et prévisibilité | Nouveau dans 2.1.172 — puissant mais moins éprouvé en production | Le choix par défaut documenté et délibéré ; prévisible et difficile à casser | b |

## Key Statistics

- Le propre système de recherche multi-agents d'Anthropic utilise environ 15 fois plus de jetons qu'un chat à agent unique — le multiplicateur de coût central dès que les sous-agents se ramifient ou s'imbriquent
- Cette même architecture multi-agents a obtenu 90,2 % de meilleurs résultats qu'un agent unique sur l'évaluation interne de tâches de recherche d'Anthropic — le gain qui peut justifier le coût en jetons
- Claude Code 2.1.172 (juin 2026) autorise les sous-agents à lancer leurs propres sous-agents jusqu'à 5 niveaux ; avant cette version, l'imbrication était bloquée et la hiérarchie délibérément plate
- Avec la moyenne d'environ 13 $ par développeur et par jour rapportée par Anthropic, exécuter 5 agents simultanés peut porter la dépense quotidienne au-delà d'environ 50 $, et 10 agents parallèles consomment le quota du forfait 10 fois plus vite
- Des praticiens rapportent des sous-agents consommant plus de 25 000 jetons au démarrage avant tout travail réel — un coût de contexte fixe qui se multiplie à chaque niveau imbriqué
- Avant 2.1.172, Claude Code documentait les sous-agents comme strictement non imbricables — la hiérarchie plate était intentionnelle pour garder le système prévisible, établissant les équipes à plat comme référence de stabilité

## Choose Sous-agents récursifs When

- Vos problèmes sont profonds et ouverts, où un worker doit réellement lancer ses propres assistants en cours de tâche
- Vous traitez les refactorisations ou recherches multi-étapes les plus difficiles, où la profondeur de raisonnement prime sur la largeur
- La qualité de la réponse domine la décision et vous pouvez assumer le multiplicateur de jetons d'environ 15x
- Vous avez mis en place des limites de profondeur strictes, des budgets de jetons et des limites d'arrêt pour contenir la récursion incontrôlée

## Choose Équipes de sous-agents à plat When

- Vous exécutez des flux de production où le coût et la latence prévisibles comptent le plus
- Vous avez besoin d'une traçabilité claire et de points d'intervention humaine faciles à chaque étape
- Vos tâches se parallélisent naturellement en sous-tâches indépendantes et bien délimitées
- Vous voulez le choix par défaut éprouvé, difficile à casser et facile à déboguer

## Verdict

Il n'y a pas de gagnant universel — l'axe oppose le plafond de capacité au contrôle opérationnel. Les sous-agents récursifs sont le meilleur choix pour les tâches les plus difficiles et les plus ouvertes, là où un worker doit réellement lancer ses propres assistants et où la profondeur de raisonnement prime sur la largeur. Mais ils héritent du contexte à chaque niveau, amplifient le multiplicateur d'environ 15x en jetons que portent déjà les systèmes multi-agents, et transforment l'exécution en une chaîne opaque, difficile à déboguer et sujette aux boucles sans limites strictes. Les équipes de sous-agents à plat restent le choix par défaut en production pour de bonnes raisons : coût prévisible, traçabilité claire, intervention humaine aisée et hiérarchie difficile à casser. Le schéma pragmatique que privilégie Context Studios : garder les équipes à plat par défaut, router chaque nœud vers le modèle capable le moins cher, et n'utiliser la récursion que pour les rares tâches dont le plafond de qualité — Anthropic a mesuré 90,2 % de meilleurs résultats du multi-agent par rapport à l'agent unique — justifie le coût et la perte de visibilité.

## FAQ

**Q: Qu'est-ce qui a changé dans Claude Code 2.1.172 pour les sous-agents ?**
A: Avant 2.1.172, les sous-agents ne pouvaient pas lancer leurs propres sous-agents ; la hiérarchie était délibérément plate (session principale vers workers) pour garder un comportement prévisible. Claude Code 2.1.172 (juin 2026) permet aux sous-agents de lancer des sous-agents jusqu'à 5 niveaux, rendant l'orchestration récursive possible pour la première fois. Les équipes à plat fonctionnent toujours et restent le choix le plus sûr pour la plupart des charges de production.

**Q: Les sous-agents récursifs sont-ils plus chers que les équipes à plat ?**
A: En général oui. Le propre système de recherche multi-agents d'Anthropic consomme environ 15 fois plus de jetons qu'un chat à agent unique, et la récursion amplifie cela car chaque niveau hérite du contexte et du coût de démarrage — des praticiens rapportent plus de 25 000 jetons avant tout travail réel. Les équipes à plat sont plus prévisibles. La récursion ne paie que lorsque le gain de qualité (Anthropic a mesuré 90,2 % de meilleurs résultats) justifie le coût.

**Q: Quand utiliser une équipe de sous-agents à plat plutôt que l'imbrication ?**
A: Utilisez les équipes à plat quand les tâches se divisent proprement en sous-tâches indépendantes, quand vous avez besoin d'un coût et d'une latence prévisibles, et quand la traçabilité et l'intervention humaine comptent. Le plat est le choix par défaut documenté et éprouvé ; l'imbrication ajoute de la puissance mais aussi de l'opacité et un risque d'emballement, alors réservez-la aux problèmes qui nécessitent vraiment de la profondeur.

**Q: Comment maîtriser les coûts avec des sous-agents récursifs ?**
A: Fixez des limites de profondeur strictes (2.1.172 plafonne à 5 niveaux) et des budgets de jetons, routez chaque nœud vers le modèle capable le moins cher (Haiku pour les lectures, Sonnet pour l'implémentation, Opus pour le raisonnement difficile), et ajoutez des limites d'arrêt explicites pour qu'une branche ne puisse pas boucler. Réservez la récursion profonde aux rares tâches qui en ont vraiment besoin.