---
type: Glossary Term
title: RLHF (Apprentissage par Renforcement à partir de Feedback Humain)
description: "La méthode dominante pour aligner les LLMs sur les préférences humaines. Les humains évaluent les sorties du modèle, et le modèle est entraîné à préférer les ré"
resource: "https://www.contextstudios.ai/fr/glossaire/rlhf"
category: engineering
language: fr
timestamp: "2026-02-05T22:07:47.876Z"
---

# RLHF (Apprentissage par Renforcement à partir de Feedback Humain)

La méthode dominante pour aligner les LLMs sur les préférences humaines. Les humains évaluent les sorties du modèle, et le modèle est entraîné à préférer les réponses mieux notées. Peut conduire au Mode Collapse car les réponses « typiques » sont systématiquement préférées.

## Business Value

RLHF est la raison pour laquelle des modèles comme ChatGPT et Claude deviennent utiles et sûrs. Comprendre ses mécanismes aide à prédire le comportement du modèle et contourner ses limitations.

## Context Studios Perspective

RLHF est puissant mais imparfait. Nous aidons les clients à comprendre où les comportements induits par RLHF aident ou nuisent – et comment contourner les limitations par le prompting.
