---
type: Glossary Term
title: SWE-bench Verified
description: "Ein Benchmark, der AI-Modelle testet, um reale GitHub-Probleme autonom zu lösen. Die verifizierte Variante verwendet von Menschen validierte Aufgaben für eine z"
resource: "https://www.contextstudios.ai/de/glossar/swe-bench-verified-de"
category: tech
language: de
timestamp: "2026-02-19T13:00:22.568Z"
---

# SWE-bench Verified

Ein Benchmark, der AI-Modelle testet, um reale GitHub-Probleme autonom zu lösen. Die verifizierte Variante verwendet von Menschen validierte Aufgaben für eine zuverlässige Bewertung. Claude Sonnet 4.6 erzielt 79,6 %.

## Business Value

Nutzt swe-bench verified für bessere Outputs und eine Reduzierung der Inferenz-Latenz um 50%.

## Context Studios Perspective

Wir bleiben an der Spitze von swe-bench verified, um unseren Kunden First-Mover-Vorteile mit neuesten KI-Fähigkeiten zu sichern.