gadgetsgenial.es » Google presenta Gemini Omni, el futuro omnimodal de la creación de vídeo

Google presenta Gemini Omni, el futuro omnimodal de la creación de vídeo, con unos resultados increíbles

Google logra redefinir la realidad

La barrera entre la imaginación y la realidad cinematográfica acaba de reducirse de forma drástica. En la reciente conferencia Google I/O, Google presentó Gemini Omni, un revolucionario modelo de IA omnimodal diseñado para transformar la forma en que creamos e interactuamos con el vídeo. Superando las limitaciones de la IA generativa tradicional, Gemini Omni está concebido para “crear cualquier cosa a partir de cualquier entrada”, marcando un cambio de paradigma en la narrativa digital.

Una nueva era de la omnimodalidad

Mientras que los modelos anteriores eran multimodales, Gemini Omni da un paso más al convertirse en verdaderamente omnimodal. Esto significa que puede procesar y fusionar simultáneamente múltiples tipos de datos, imágenes, audio, vídeo y texto, para generar clips en alta definición en tiempo real.

Para los creadores, el punto de partida deja de ser un simple prompt de texto. Ahora se puede aportar una imagen de referencia para definir el estilo visual, añadir una pista de audio para marcar el tono y escribir instrucciones para describir la acción. Gemini Omni sintetiza todos estos elementos en un único vídeo coherente en alta definición. Esto supone una evolución importante respecto a modelos anteriores como Nano Banana o Veo 3.1, ampliando la creatividad desde el prompting básico hacia un sistema multisensorial completo.

Edición conversacional significa el adiós a las barreras técnicas

Una de las funciones más disruptivas es la edición conversacional. A través del primer modelo disponible, Gemini Omni Flash, la complejidad del software profesional de edición de vídeo se sustituye por una conversación natural.

Los usuarios pueden editar vídeos simplemente dialogando con la IA. Como el modelo recuerda instrucciones previas, es posible construir una escena paso a paso manteniendo coherencia en personajes y entornos.

Las capacidades van más allá de la generación desde cero: también puede transformar material existente. Un usuario puede grabar un clip sencillo y pedir a la IA que cambie el entorno, modifique el ángulo de cámara, añada objetos o introduzca nuevos personajes. En la práctica, una grabación real se convierte en un lienzo flexible para crear escenas que serían imposibles o demasiado costosas de filmar manualmente.

Gemini Omni doesn't just build scenes that look real, it reasons about what should happen next. It combines an intuitive understanding of physics with Gemini's knowledge of history, science, and cultural context.

Rolling out today starting with video outputs to Google AI Plus,… pic.twitter.com/EkLjv5O0dN
— Sundar Pichai (@sundarpichai) May 19, 2026

Realismo físico y narrativa

Para combatir el “uncanny valley”, esa sensación de que algo no está bien, Gemini Omni incorpora una comprensión avanzada del mundo físico. El modelo está entrenado con leyes como la gravedad, la energía cinética y la dinámica de fluidos, logrando movimientos y comportamientos más realistas.

Pero el objetivo no es solo la precisión visual. Al combinar realismo físico con el conocimiento de Gemini sobre historia, ciencia y cultura, Omni busca pasar del simple fotorrealismo a la narrativa significativa. Esto lo convierte en una herramienta especialmente potente para vídeos educativos y explicativos capaces de convertir ideas complejas en secuencias visuales atractivas.

Personalización, seguridad y accesibilidad

Gemini Omni también avanza en la personalización. Permite crear avatares digitales que se parecen y suenan como el usuario, utilizando su propia voz para generar audio.

Consciente de los retos éticos, Google ha incorporado varias medidas de seguridad. Todos los vídeos generados incluirán SynthID, una marca de agua digital imperceptible que certifica su origen en IA. Algunas funciones, como la edición de audio y voz existentes, siguen en pruebas para garantizar un despliegue responsable.

Gemini Omni Flash ya se está desplegando para suscriptores de Google AI Plus, Pro y Ultra a nivel global y próximamente se integrará en la app Gemini, Google Flow, YouTube Shorts y YouTube Create. Aunque algunas regiones, como Europa, podrían tener calendarios distintos, la llegada de Omni marca un paso decisivo hacia un mundo donde el único límite de la producción de vídeo será la capacidad de describir una idea.

Google presenta Gemini Omni, el futuro omnimodal de la creación de vídeo

Google logra redefinir la realidad

Una nueva era de la omnimodalidad

Edición conversacional significa el adiós a las barreras técnicas

Realismo físico y narrativa

Personalización, seguridad y accesibilidad

Comentarios

Deja una respuesta Cancelar la respuesta

Más entradas

Este es el último artículo de GadgetsGeniales

La dramática evolución de la búsqueda en Google

Android XR y la llegada de los lentes inteligentes con IA de Google

Google presenta Wear OS 7