---
type: Glossary Term
title: Mise à l'échelle du calcul en temps de test
description: La mise à l'échelle du calcul en temps de test (également appelée mise à l'échelle du calcul en temps d'inférence) est la stratégie consistant à fournir à un mo
resource: "https://www.contextstudios.ai/fr/glossaire/test-time-compute-scaling"
category: engineering
language: fr
timestamp: "2026-07-01T15:35:37.507Z"
---

# Mise à l'échelle du calcul en temps de test

La mise à l'échelle du calcul en temps de test (également appelée mise à l'échelle du calcul en temps d'inférence) est la stratégie consistant à fournir à un modèle d'IA plus de ressources informatiques lors de la réponse à une requête, plutôt que de n'investir plus de calcul que pendant l'entraînement. Les modèles de langage traditionnels effectuent un seul passage avant pour chaque entrée et renvoient immédiatement un résultat. La mise à l'échelle du calcul en temps de test rompt avec ce schéma : le modèle est autorisé à consacrer plus de temps et de ressources à explorer plusieurs chemins de solution, à vérifier les résultats intermédiaires ou à s'auto-corriger avant de produire une réponse finale. En pratique, cela signifie que les tâches simples sont traitées rapidement, tandis que les problèmes complexes — débogage de code en plusieurs étapes, analyse stratégique, exécution autonome de tâches — peuvent obtenir des résultats nettement meilleurs avec un budget de calcul plus long. Cela a été démontré de manière puissante par Claude Mythos Preview, qui a obtenu un score de 92,1 % sur Terminal-Bench 2.1 avec un délai de 4 heures, comparé à des scores nettement inférieurs sous des contraintes de temps plus strictes. La mise à l'échelle du calcul en temps de test est étroitement liée au raisonnement en chaîne et aux architectures modernes d'agents IA, qui exploitent toutes deux la pensée itérative pour améliorer la qualité des résultats. Pour les entreprises, cela signifie que l'« intelligence » du modèle n'est plus une propriété fixe — elle peut être activement ajustée en allouant des ressources de calcul pour correspondre à la complexité des tâches.