Cloud Next » gadgetsgenial.es

Google anunció en su evento Cloud Next, la 8ª generación de sus procesadores TPU para IA

Los Tensor Processing Units (TPU), una gran ventaja competitiva

Mientras nombres como OpenAI y Nvidia suelen dominar la conversación sobre IA, Google acaba de mostrar su arma secreta, un ecosistema de hardware totalmente integrado y diseñado específicamente para la era de los agentes de IA.

En su conferencia Cloud Next, la compañía presentó su nueva generación de Tensor Processing Units (TPU) y confirmó un cambio tecnológico importante ya que separará sus chips en dos tipos, para entrenamiento y para inferencia.

We’re introducing our eighth generation of TPUs. This time, we’re taking a dual chip approach: TPU 8t, optimized for training, and TPU 8i, optimized for inference.

💪TPU 8t achieves nearly three times the compute performance per pod over our previous generation, Ironwood.
⚡TPU… pic.twitter.com/SdVGBCjd4V
— Google (@Google) April 22, 2026

Dos chips en lugar de uno

Durante años, Google buscó un acelerador “todo en uno”. Ahora adopta un enfoque dual:

TPU 8t para entrenamiento masivo de modelos
TPU 8i para inferencia y ejecución de tareas

Esta división refleja cómo está cambiando la IA. Ahora ya no solo genera texto, ahora razona, ejecuta tareas y trabaja en ciclos continuos.

También hay otro cambio importante. Google abandona los CPUs x86 y usa sus Axion CPUs basadas en Arm, optimizando todo el sistema de extremo a extremo. Esto confirma que los procesadores x86 son cada vez menos relevantes.

TPU 8t: la fábrica de modelos gigantes

El TPU 8t, co-diseñado con Broadcom, está pensado para reducir el tiempo de entrenamiento de modelos de IA gigantescos de meses a semanas.

Puntos clave:

Superpod escalable hasta 9,600 chips
Conectados mediante switches ópticos (OCS)
Red Virgo Network
121 ExaFlops de potencia
2 petabytes de memoria compartida
Escalamiento potencial a 1 millón de chips

Google introduce además el concepto de “goodput” del 97%, que mide cuánto tiempo el sistema realmente entrena sin interrupciones. Esto es importante porque en clusters gigantes, cada fallo puede costar días de trabajo.

TPU 8i: el motor de razonamiento

La inferencia moderna no está limitada por el poder de cómputo, sino por memoria. El TPU 8i ataca ese cuello de botella.

Características clave:

288 GB de HBM
384 MB de SRAM on-chip (3× más que antes)
Diseñado para modelos Mixture-of-Experts
Nuevo motor CAE, con hasta 5× menos latencia
Red Boardfly, reduce saltos entre chips en más del 50%

Esto se traduce en 80% mejor rendimiento por dólar, lo que permite servir casi el doble de usuarios al mismo coste.

Google ya controla el stack completo

Google controla toda la cadena:

CPU (Axion)
Acelerador (TPU)
Software (JAX, PyTorch)
Infraestructura y centros de datos
Refrigeración líquida de cuarta generación

Esto permite duplicar la eficiencia energética frente a la generación anterior.

Incluso Elon Musk comentó que los TPUs están “subestimados”, un reconocimiento notable frente al dominio de Nvidia.

Quién ya apuesta por estas TPUs

Adopción temprana destacada:

Citadel Securities, ya usa el hardware
Anthropic, planea usar hasta 1 millón de chips en 2027
Rumores apuntan a que Apple podría apoyarse en esta infraestructura para futuras funciones de IA

Google planea producir:

4.3 millones de TPUs en 2026
35 millones para 2028

TPUs are underrated
— Elon Musk (@elonmusk) April 22, 2026

El mensaje final

Con TPUs separadas para crear y ejecutar IA, Google no solo compite en la carrera de la IA, sino que está intentando redefinir la infraestructura sobre la que se construirá toda la próxima generación de modelos y agentes inteligentes.

Etiqueta: Cloud Next

Google redobla su apuesta por el silicio propio con dos TPU de 8ª generación