---
type: Glossary Term
title: SWE-bench Verified
description: Un benchmark testant les modèles AI sur la résolution autonome de problèmes réels de GitHub. La variante vérifiée utilise des tâches validées par des humains po
resource: "https://www.contextstudios.ai/fr/glossaire/swe-bench-verified-fr"
category: tech
language: fr
timestamp: "2026-02-19T13:00:22.573Z"
---

# SWE-bench Verified

Un benchmark testant les modèles AI sur la résolution autonome de problèmes réels de GitHub. La variante vérifiée utilise des tâches validées par des humains pour un scoring fiable. Claude Sonnet 4.6 obtient un score de 79,6 %.

## Business Value

Exploite la technologie swe-bench verified pour des améliorations de performance 2-5x en débit et précision des applications IA.

## Context Studios Perspective

Nous restons à la pointe de swe-bench verified pour offrir à nos clients l'avantage du premier entrant.