NVIDIA Vera Rubin
NVIDIA Vera Rubin est l'architecture GPU de prochaine génération succédant à Blackwell, annoncée par Jensen Huang au GTC 2026 et prévue pour 2026/2027. Nommée d'après l'astronome Vera Rubin qui a fourni des preuves de la matière noire, l'architecture promet un nouveau bond générationnel en performances d'inférence et d'entraînement IA.
Spécifications clés révélées au GTC 2026 : le CPU ARM 'Vera' successeur du Grace avec une bande passante mémoire plus élevée, et le die GPU 'Rubin' comme moteur de calcul. Ensemble, ils forment le Vera Rubin Superchip. NVIDIA poursuit sa cadence annuelle : Hopper (2022) → Blackwell (2024) → Blackwell Ultra (2025) → Vera Rubin (2026/2027).
Pour l'industrie IA, Vera Rubin signale la poursuite de la tendance à la déflation matérielle : tous les 1–2 ans, les performances d'inférence par dollar doublent voire triplent. Cette tendance alimente la chute de 50–80% des prix API LLM annuellement. Les organisations confrontées à des workloads d'inférence coûteux peuvent s'attendre à des coûts considérablement plus bas avec la capacité cloud Vera Rubin.
En concurrence, NVIDIA fait face à la série MI400 d'AMD, le TPU Ironwood de Google (également annoncé au GTC 2026), Intel Gaudi 4 et des fournisseurs ASIC comme Groq, Cerebras et Amazon Trainium 3.