gadgetsgenial.es

Etiqueta: Mira Murati

  • Thinking Machines de Mira Murati presenta una IA que escucha mientras habla

    Thinking Machines, la nueva startup de Mira Murati presenta una IA que escucha mientras habla
    Thinking Machines, la nueva startup de Mira Murati presenta una IA que escucha mientras habla

    Reaparece Mira Murati

    Catorce meses después de dejar su puesto como CTO de OpenAI, Mira Murati reaparece con una nueva startup llamada Thinking Machines. Su propuesta no es competir directamente con modelos como Anthropic (Claude) o Google (Gemini) en pura capacidad de razonamiento, sino cambiar la forma en que interactuamos con la IA.

    La compañía introduce un nuevo concepto: “interaction models”, sistemas diseñados para colaborar con humanos en tiempo real, como lo haría una conversación natural.


    Hasta ahora, la IA “esperaba su turno”

    Actualmente, hablar con IA se parece a usar un walkie-talkie:

    1. El usuario habla o escribe
    2. El modelo deja de percibir el mundo
    3. Genera una respuesta
    4. El ciclo vuelve a empezar

    Durante la generación, el sistema deja de escuchar o ver lo que ocurre. Esto crea pausas incómodas y una sensación poco natural.

    Thinking Machines quiere romper ese cuello de botella.


    TML-Interaction-Small: conversación en tiempo real

    Su prototipo de investigación se llama TML-Interaction-Small y es un modelo multimodal full-duplex que puede escuchar, ver, pensar y responder al mismo tiempo.

    Características clave:

    • Entrada continua de audio, vídeo y texto
    • Conversación dividida en micro-turnos de 200 ms
    • Latencia de voz de solo 0,40 segundos
    • Arquitectura Mixture-of-Experts de 276B parámetros (12B activos por llamada)

    Esto significa que mientras el modelo habla, sigue escuchando interrupciones y ajusta su respuesta en tiempo real, igual que una persona.

    En el benchmark FD-bench v1.5 (centrado en interacción), el modelo obtuvo 77,8 puntos, superando ampliamente a los modos de baja latencia actuales, aunque los productos de sus competidores también son competitivos.


    Arquitectura de doble velocidad

    La innovación más interesante es su diseño de dos capas:

    1) Modelo de interacción (tiempo real)

    Se encarga de:

    • Conversación fluida
    • Señales visuales y de voz
    • Reacciones instantáneas

    2) Modelo de fondo (razonamiento pesado)

    Mientras conversas, otro modelo:

    • Realiza búsquedas web
    • Usa herramientas
    • Resuelve tareas complejas

    Así, la IA puede seguir hablando contigo mientras investiga en segundo plano.


    Una IA que entiende el tiempo

    Otro cambio importante es que el modelo incluye un reloj interno.

    Puede ejecutar tareas temporizadas como:

    • “Recuérdame revisar la temperatura cada 4 minutos”
    • Monitorizar eventos en tiempo real

    Este detalle abre la puerta a usos profesionales reales.


    Casos de uso reales

    Thinking Machines ha realizado demostraciones en las que la IA:

    • Cuenta objetos mencionados en una historia hablada
    • Traduce voz en tiempo real
    • Analiza vídeo y corrige la postura del usuario
    • Supervisa tareas en entornos laborales

    Sectores como sanidad, industria o laboratorios podrían beneficiarse enormemente.


    Una startup con músculo financiero

    La compañía arrancó fuerte:

    • Ronda «seed» (semilla) de 2.000 millones de dólares
    • Valoración de 12.000 millones de dólares
    • Equipo de ~50 personas
    • Incluye al cofundador de OpenAI John Schulman

    Por ahora, el modelo solo está disponible para investigadores, aunque se planea que pueda ser abierto al público más adelante este año.

    Si cumple sus promesas, incluyendo componentes open-source, podríamos estar entrando en una nueva era en la que los asistentes de IA puedan tener conversaciones realmente fluidas.