OpenAI Agents SDK v0.14 Sandbox Agents : workspaces persistants, explication claire
OpenAI Agents SDK v0.14.0 (publié le 15 avril 2026 à 17:11 UTC) introduit des Sandbox Agents avec des workspaces persistants et isolés. Environ deux heures plus tard, v0.14.1 (15 avril 2026 à 19:26 UTC) ajoute des correctifs de stabilité importants.
Ce n'est pas une simple mise à jour de release notes. C'est un changement de modèle d'exécution : on passe d'appels d'outils stateless à une exécution orientée workspace.
TL;DR
v0.14.0apporte des primitives de sandbox (manifest, snapshots, reprise).v0.14.1corrige les premiers points sensibles en production.- Si vos agents manipulent des fichiers, des dépôts ou des runs longs, cette version est prioritaire.
- Pour des tâches courtes et déterministes, un chemin stateless reste souvent préférable.
Pourquoi cette version compte
En production, les incidents viennent souvent de la runtime, pas du modèle :
- perte de contexte entre les runs
- mauvaise réutilisation des artefacts
- reprise coûteuse après interruption
- dérive de l'environnement d'exécution
Les Sandbox Agents ciblent précisément ces problèmes via un workspace persistant, isolé et pilotable.
Ce que v0.14.0 apporte concrètement
Primitives clés :
SandboxAgent: agent standard avec defaults sandboxManifest: contrat déclaratif du workspaceSandboxRunConfig: configuration runtime par exécution- support snapshot + reprise
- capacités natives sandbox (shell, filesystem, image inspection, skills, memory, compaction)
- clients sandbox locaux, conteneurisés et hébergés
Impact pratique
Vous obtenez des workflows proches du travail réel d'ingénierie :
- édition de fichiers sur plusieurs étapes
- exécution de commandes dans un environnement contrôlé
- pause/reprise sans tout reconstruire
- continuité fiable des artefacts
Ce que v0.14.1 stabilise
v0.14.1 est un pass de robustesse, avec des fixes sur :
- la sanitation des payloads de tracing
- la compatibilité des touches modificatrices pour le computer driver
- le comportement d'arrêt de l'exécution outillée streamée après guardrail
- les handoffs server-managed face aux history rewrites non supportés
Lecture opérationnelle : la fonctionnalité majeure est livrée en v0.14.0, puis rapidement durcie en v0.14.1.
Stateless vs Sandbox : frontière de décision
| Question | Si OUI | Si NON |
|---|---|---|
| Le workflow nécessite-t-il des fichiers persistants entre runs ? | Préférer Sandbox | Stateless peut suffire |
| Avez-vous besoin de snapshot/reprise ? | Préférer Sandbox | Stateless peut rester plus simple |
| Le workflow est-il long et interrompu ? | Préférer Sandbox | Stateless reste viable |
| La latence single-shot est-elle la priorité absolue ? | Garder stateless | Sandbox seulement si nécessaire |
Dans la pratique, l'approche hybride est la plus efficace :
- sandbox pour les workflows stateful
- stateless pour les tâches courtes et déterministes
Où Sandbox Agents est le meilleur choix
- coding agents qui modifient des repos réels
- pipelines document/data avec artefacts intermédiaires
- workflows human-in-the-loop avec pause/reprise
- cas où la reconstruction de contexte devient le coût principal
Où il ne faut pas forcer Sandbox
Conservez votre pile existante si :
- les tâches sont single-step et déterministes
- la latence est le KPI dominant
- votre runtime actuelle est déjà stable, auditée et efficiente pour ce type de charge
Bonne architecture = sélective, pas dogmatique.
Plan d'adoption sur 14 jours
Jours 1-3 : choisir un workflow douloureux
Sélectionner un cas avec perte de contexte, dérive d'artefacts ou reprise coûteuse.
Jours 4-7 : construire le pilote sandbox
Utiliser :
SandboxAgentManifestexplicite- snapshot + reprise
Mesurer les métriques de baseline en parallèle.
Jours 8-10 : renforcer les garde-fous
Durcir :
- scope des capacités
- contraintes de paths/mounts
- gestion des secrets et redaction
- rétention et audit des traces
Jours 11-14 : comparer et décider
Comparer au baseline :
- temps de recovery
- taux d'intervention opérateur
- coût et durée des reruns
Si le gain est net, étendre à un workflow adjacent.
Erreurs fréquentes
1. Migrer tout d'un coup
Commencez par un seul workflow à forte friction.
2. Manifestes trop vagues
Sans manifeste précis, la reproductibilité chute.
3. Mélanger mémoire long terme et session state
Séparer clairement continuité de run et mémoire durable.
4. Déployer sans SLO de reprise
Définir les objectifs de recovery avant la mise en prod.
Sécurité et gouvernance
L'isolation sandbox aide, mais ne remplace pas la gouvernance.
Il faut toujours :
- une policy de capacités explicite
- une gestion stricte des secrets
- une séparation dev/stage/prod
- une auditabilité complète des runs
Conclusion
OpenAI Agents SDK v0.14.x est une avancée runtime significative pour des agents vraiment productifs. Il réduit le glue custom pour les workflows stateful, mais ne remplace pas le travail d'architecture.
Approche recommandée :
- l'adopter là où persistance et reprise sont de vrais goulots
- garder le stateless là où il suffit déjà
- élargir uniquement après gains mesurés
Si vous voulez cadrer ce rollout proprement, notre équipe chez Context Studios peut vous accompagner.
FAQ
v0.14 est-il prêt pour la production ?
Oui pour des pilotes contrôlés. Pour un déploiement large, procéder par étapes avec métriques opérationnelles.
Sandbox Agents remplace-t-il l'orchestration existante ?
En général non. Cela simplifie la runtime, mais orchestration, policy et intégrations restent indispensables.
Faut-il migrer tous les workflows ?
Non. Commencer par les workflows stateful et sensibles aux interruptions.
Le moyen le plus rapide de créer de la valeur ?
Piloter un workflow pendant 14 jours, mesurer recovery/interventions, puis étendre sélectivement.
Risque principal de rollout ?
Sur-migrer sans preuve. L'adoption sandbox doit rester une décision d'architecture mesurée.