---
type: Glossary Term
title: SWE-bench Verified
description: Un benchmark che testa i modelli AI nella risoluzione autonoma di problemi reali di GitHub. La variante verificata utilizza compiti convalidati da umani per una
resource: "https://www.contextstudios.ai/it/glossario/swe-bench-verified-it"
category: tech
language: it
timestamp: "2026-02-19T13:00:22.575Z"
---

# SWE-bench Verified

Un benchmark che testa i modelli AI nella risoluzione autonoma di problemi reali di GitHub. La variante verificata utilizza compiti convalidati da umani per una valutazione affidabile. Claude Sonnet 4.6 ottiene un punteggio del 79,6%.

## Business Value

Implementa swe-bench verified per sbloccare nuove capacità impossibili con architetture IA di generazione precedente.

## Context Studios Perspective

Implementiamo swe-bench verified con competenza approfondita su Claude, GPT e Gemini — scelta tecnologica ottimale per ogni caso d'uso.
