
Los Tensor Processing Units (TPU), una gran ventaja competitiva
Mientras nombres como OpenAI y Nvidia suelen dominar la conversación sobre IA, Google acaba de mostrar su arma secreta, un ecosistema de hardware totalmente integrado y diseñado específicamente para la era de los agentes de IA.
En su conferencia Cloud Next, la compañía presentó su nueva generación de Tensor Processing Units (TPU) y confirmó un cambio tecnológico importante ya que separará sus chips en dos tipos, para entrenamiento y para inferencia.
Dos chips en lugar de uno
Durante años, Google buscó un acelerador “todo en uno”. Ahora adopta un enfoque dual:
- TPU 8t para entrenamiento masivo de modelos
- TPU 8i para inferencia y ejecución de tareas
Esta división refleja cómo está cambiando la IA. Ahora ya no solo genera texto, ahora razona, ejecuta tareas y trabaja en ciclos continuos.
También hay otro cambio importante. Google abandona los CPUs x86 y usa sus Axion CPUs basadas en Arm, optimizando todo el sistema de extremo a extremo. Esto confirma que los procesadores x86 son cada vez menos relevantes.
TPU 8t: la fábrica de modelos gigantes
El TPU 8t, co-diseñado con Broadcom, está pensado para reducir el tiempo de entrenamiento de modelos de IA gigantescos de meses a semanas.
Puntos clave:
- Superpod escalable hasta 9,600 chips
- Conectados mediante switches ópticos (OCS)
- Red Virgo Network
- 121 ExaFlops de potencia
- 2 petabytes de memoria compartida
- Escalamiento potencial a 1 millón de chips
Google introduce además el concepto de “goodput” del 97%, que mide cuánto tiempo el sistema realmente entrena sin interrupciones. Esto es importante porque en clusters gigantes, cada fallo puede costar días de trabajo.
TPU 8i: el motor de razonamiento
La inferencia moderna no está limitada por el poder de cómputo, sino por memoria. El TPU 8i ataca ese cuello de botella.
Características clave:
- 288 GB de HBM
- 384 MB de SRAM on-chip (3× más que antes)
- Diseñado para modelos Mixture-of-Experts
- Nuevo motor CAE, con hasta 5× menos latencia
- Red Boardfly, reduce saltos entre chips en más del 50%
Esto se traduce en 80% mejor rendimiento por dólar, lo que permite servir casi el doble de usuarios al mismo coste.
Google ya controla el stack completo
Google controla toda la cadena:
- CPU (Axion)
- Acelerador (TPU)
- Software (JAX, PyTorch)
- Infraestructura y centros de datos
- Refrigeración líquida de cuarta generación
Esto permite duplicar la eficiencia energética frente a la generación anterior.
Incluso Elon Musk comentó que los TPUs están “subestimados”, un reconocimiento notable frente al dominio de Nvidia.
Quién ya apuesta por estas TPUs
Adopción temprana destacada:
- Citadel Securities, ya usa el hardware
- Anthropic, planea usar hasta 1 millón de chips en 2027
- Rumores apuntan a que Apple podría apoyarse en esta infraestructura para futuras funciones de IA
Google planea producir:
- 4.3 millones de TPUs en 2026
- 35 millones para 2028
El mensaje final
Con TPUs separadas para crear y ejecutar IA, Google no solo compite en la carrera de la IA, sino que está intentando redefinir la infraestructura sobre la que se construirá toda la próxima generación de modelos y agentes inteligentes.

Deja una respuesta