Wafer-Scale Engine (WSE)
Il Wafer-Scale Engine (WSE) è un processore sviluppato da Cerebras Systems che utilizza un intero wafer di silicio come singolo chip – a differenza dei processori tradizionali tagliati in piccoli chip. L'attuale generazione WSE-3 offre 4 trilioni di transistor e 900.000 core ottimizzati per l'IA su una singola superficie wafer da 300mm. Questa architettura elimina i colli di bottiglia di comunicazione tra più GPU e consente un addestramento e un'inferenza ultrarapidi dei grandi modelli linguistici. Il WSE è particolarmente rilevante per le aziende che necessitano di prestazioni estreme nell'inferenza LLM, con valori Time-to-First-Token inferiori a 100 millisecondi.