Wafer-Scale Engine (WSE)
Le Wafer-Scale Engine (WSE) est un processeur développé par Cerebras Systems qui utilise un wafer de silicium entier comme puce unique – contrairement aux processeurs traditionnels découpés en petites puces. La génération actuelle WSE-3 offre 4 billions de transistors et 900 000 cœurs optimisés pour l'IA sur une seule surface de wafer de 300mm. Cette architecture élimine les goulots d'étranglement de communication entre plusieurs GPU et permet un entraînement et une inférence ultrarapides des grands modèles de langage. Le WSE est particulièrement pertinent pour les entreprises nécessitant des performances extrêmes en inférence LLM, avec des valeurs Time-to-First-Token inférieures à 100 millisecondes.