gadgetsgenial.es

Etiqueta: Cloud Next

  • Google redobla su apuesta por el silicio propio con dos TPU de 8ª generación

    Google anunció en su evento Cloud Next, la 8ª generación de sus procesadores TPU para IA
    Google anunció en su evento Cloud Next, la 8ª generación de sus procesadores TPU para IA

    Los Tensor Processing Units (TPU), una gran ventaja competitiva

    Mientras nombres como OpenAI y Nvidia suelen dominar la conversación sobre IA, Google acaba de mostrar su arma secreta, un ecosistema de hardware totalmente integrado y diseñado específicamente para la era de los agentes de IA.

    En su conferencia Cloud Next, la compañía presentó su nueva generación de Tensor Processing Units (TPU) y confirmó un cambio tecnológico importante ya que separará sus chips en dos tipos, para entrenamiento y para inferencia.


    Dos chips en lugar de uno

    Durante años, Google buscó un acelerador “todo en uno”. Ahora adopta un enfoque dual:

    • TPU 8t para entrenamiento masivo de modelos
    • TPU 8i para inferencia y ejecución de tareas

    Esta división refleja cómo está cambiando la IA. Ahora ya no solo genera texto, ahora razona, ejecuta tareas y trabaja en ciclos continuos.

    También hay otro cambio importante. Google abandona los CPUs x86 y usa sus Axion CPUs basadas en Arm, optimizando todo el sistema de extremo a extremo. Esto confirma que los procesadores x86 son cada vez menos relevantes.


    TPU 8t: la fábrica de modelos gigantes

    El TPU 8t, co-diseñado con Broadcom, está pensado para reducir el tiempo de entrenamiento de modelos de IA gigantescos de meses a semanas.

    Puntos clave:

    • Superpod escalable hasta 9,600 chips
    • Conectados mediante switches ópticos (OCS)
    • Red Virgo Network
    • 121 ExaFlops de potencia
    • 2 petabytes de memoria compartida
    • Escalamiento potencial a 1 millón de chips

    Google introduce además el concepto de “goodput” del 97%, que mide cuánto tiempo el sistema realmente entrena sin interrupciones. Esto es importante porque en clusters gigantes, cada fallo puede costar días de trabajo.


    TPU 8i: el motor de razonamiento

    La inferencia moderna no está limitada por el poder de cómputo, sino por memoria. El TPU 8i ataca ese cuello de botella.

    Características clave:

    • 288 GB de HBM
    • 384 MB de SRAM on-chip (3× más que antes)
    • Diseñado para modelos Mixture-of-Experts
    • Nuevo motor CAE, con hasta 5× menos latencia
    • Red Boardfly, reduce saltos entre chips en más del 50%

    Esto se traduce en 80% mejor rendimiento por dólar, lo que permite servir casi el doble de usuarios al mismo coste.


    Google ya controla el stack completo

    Google controla toda la cadena:

    • CPU (Axion)
    • Acelerador (TPU)
    • Software (JAX, PyTorch)
    • Infraestructura y centros de datos
    • Refrigeración líquida de cuarta generación

    Esto permite duplicar la eficiencia energética frente a la generación anterior.

    Incluso Elon Musk comentó que los TPUs están “subestimados”, un reconocimiento notable frente al dominio de Nvidia.


    Quién ya apuesta por estas TPUs

    Adopción temprana destacada:

    • Citadel Securities, ya usa el hardware
    • Anthropic, planea usar hasta 1 millón de chips en 2027
    • Rumores apuntan a que Apple podría apoyarse en esta infraestructura para futuras funciones de IA

    Google planea producir:

    • 4.3 millones de TPUs en 2026
    • 35 millones para 2028

    El mensaje final

    Con TPUs separadas para crear y ejecutar IA, Google no solo compite en la carrera de la IA, sino que está intentando redefinir la infraestructura sobre la que se construirá toda la próxima generación de modelos y agentes inteligentes.