---
type: Glossary Term
title: SWE-bench Vérifié
description: Un banc d'essai testant les modèles d'IA sur la résolution autonome de problèmes réels sur GitHub. La variante Vérifiée utilise des tâches validées par des huma
resource: "https://www.contextstudios.ai/fr/glossaire/swe-bench-verified"
category: tech
language: fr
timestamp: "2026-07-01T15:34:49.917Z"
---

# SWE-bench Vérifié

Un banc d'essai testant les modèles d'IA sur la résolution autonome de problèmes réels sur GitHub. La variante Vérifiée utilise des tâches validées par des humains pour un score fiable. Claude Sonnet 4.6 obtient un score de 79,6 %.
