gadgetsgenial.es

Categoría: Gemini

Noticias relacionadas con la IA de Google

  • Stitch da la bienvenidos a la era del “vibe design”

    Stitch de Google ahora convierte tus ideas en interfaces con solo describirlas
    Stitch de Google ahora convierte tus ideas en interfaces con solo describirlas

    Stitch de Google ahora convierte tus ideas en interfaces con solo describirlas

    La forma en que construimos software está viviendo una transformación radical. El 18 de marzo de 2026, Google Labs presentó una renovación profunda de Stitch, su herramienta impulsada por IA capaz de generar interfaces web y móviles a partir de simples instrucciones, imágenes o bocetos.

    Impulsada por los modelos Gemini, esta nueva versión convierte en realidad el concepto de “vibe design”, sacudiendo de paso a toda la industria del diseño.

    El anuncio no tardó en impactar los mercados: las acciones de Figma cayeron entre un 8% y un 9% en una sola sesión. Para muchos, esto señala la llegada de un competidor serio. Pero, ¿qué hace tan disruptivo a Stitch?


    De wireframes al “vibe design”

    Inspirado en el concepto de “vibe coding”, donde los desarrolladores generan código con IA a partir de la descripción de lo que pretenden lograr, Rustin Banks, product manager en Google Labs, introduce ahora el “vibe design”.

    En lugar de empezar desde una hoja en blanco, Stitch permite iniciar un proyecto describiendo un objetivo de negocio, la emoción que se quiere transmitir o incluso subiendo capturas de pantalla como referencia.

    A partir de ahí, la herramienta genera mockups visuales de alta fidelidad junto con código front-end listo para producción, incluyendo HTML/CSS, Tailwind y JSX/React.

    Para soportar este flujo, Google ha creado un lienzo infinito nativo de IA, gestionado por un agente inteligente que comprende toda la evolución del proyecto: sigue el progreso, organiza ideas y facilita iteraciones simultáneas.


    Diseñar con la voz

    En 2026, escribir es opcional. Una de las funciones más llamativas de Stitch es su integración por voz.

    Los usuarios pueden hablar directamente con el lienzo para modificar diseños en tiempo real. El agente actúa como un colaborador activo: puede hacer preguntas, sugerir mejoras o ejecutar comandos como:

    • “Dame tres opciones de menú”
    • “Muestra esta pantalla con distintas paletas de colores”

    Conectando diseño y desarrollo

    Google no quiere que Stitch sea una herramienta aislada. Por eso ha incorporado un servidor MCP (Model Context Protocol), un SDK y “skills” de código abierto.

    Esto permite integrar Stitch con asistentes de desarrollo como Claude Code, Cursor o Gemini CLI. En la práctica, otros agentes pueden controlar Stitch desde un entorno de desarrollo (IDE), generar interfaces y devolver el código automáticamente al flujo de trabajo.

    Es un paso clave hacia un ecosistema donde diseño y programación se fusionan completamente.


    ¿El fin de Figma?

    A pesar de la reacción del mercado, Stitch no sustituye (todavía) a herramientas tradicionales como Figma.

    Hoy por hoy, se posiciona en la fase inicial: ideación y prototipado rápido. Es ideal para transformar ideas en interfaces funcionales en minutos, especialmente útil para startups o pruebas de concepto.

    Sin embargo, diseñadores profesionales señalan que los resultados pueden ser algo genéricos. Para trabajos complejos de UX o sistemas de diseño avanzados, Figma sigue siendo esencial.

    En la práctica, muchos flujos modernos combinan ambos:

    • Stitch para generar rápidamente ideas
    • Figma para refinarlas y llevarlas a producción

    Disponibilidad

    Actualmente en fase beta, Stitch está disponible para usuarios residentes en todos los países donde Gemini está accesible. La interfaz, por ahora, se mantiene en inglés.


    Un nuevo paradigma creativo

    Ya seas diseñador o desarrollador, Stitch demuestra que la distancia entre una idea y un producto funcional nunca había sido tan corta.

    El “vibe design” no solo acelera el proceso creativo: redefine quién puede diseñar software.

  • Meta retrasa su modelo de IA “Avocado” tras problemas de rendimiento

     pesar de las inversiones, Meta sigue teniendo problemas para desarrollar un modelo líder de IA.
    A pesar de las inversiones, Meta sigue teniendo problemas para desarrollar un modelo líder de IA.

    Meta Platforms ha pospuesto el lanzamiento de su esperado modelo de inteligencia artificial de nueva generación, conocido internamente como Avocado (aguacate), después de detectar problemas de rendimiento durante las pruebas internas.

    Inicialmente previsto para mediados de marzo, según un artículo del New York Times, el modelo ahora apunta a una ventana de lanzamiento entre mayo y junio, lo que refleja los desafíos que enfrenta la compañía en la carrera por la inteligencia artificial avanzada.


    Un modelo que no alcanza a los líderes del sector

    Durante las pruebas internas, Avocado fue evaluado en tareas clave como:

    • Razonamiento
    • Programación
    • Redacción

    Los resultados mostraron avances respecto al modelo anterior de Meta, Llama 4, e incluso superó a Gemini 2.5 de Google.

    Sin embargo, el modelo no logró igualar el rendimiento de Gemini 3.0, lo que llevó a Meta a retrasar su lanzamiento mientras intenta mejorar sus capacidades.

    La brecha de rendimiento ha sido lo suficientemente preocupante como para que algunos ejecutivos consideren licenciar temporalmente la tecnología Gemini de Google para impulsar ciertos productos de Meta, una posibilidad que subraya la presión competitiva en el sector.


    Inversiones masivas para alcanzar la “superinteligencia”

    El retraso llega pese a los enormes recursos que Meta está destinando a la inteligencia artificial.

    El CEO Mark Zuckerberg ha señalado que el objetivo de la empresa es alcanzar la “superinteligencia”, un nivel de IA que supere la capacidad humana.

    Para ello, Meta ha proyectado:

    • Entre 115.000 y 135.000 millones de dólares en gasto de capital este año
    • Aproximadamente 600.000 millones de dólares en infraestructura, incluidos centros de datos y chips propios

    Estas cifras casi duplican la inversión de la compañía en el año anterior.


    Reorganización interna y nuevos líderes

    Tras el desempeño decepcionante de Llama 4, Meta también reorganizó su liderazgo en inteligencia artificial.

    En junio, la compañía invirtió 14.300 millones de dólares en la startup Scale AI y nombró a su fundador y CEO, Alexandr Wang, como nuevo Chief AI Officer.

    Wang creó un equipo de élite de unos 100 investigadores llamado TBD Lab, encargado de desarrollar una nueva generación de modelos con nombres inspirados en frutas.

    Entre ellos:

    • Avocado, un modelo centrado en texto
    • Mango, enfocado en generación de imágenes y video
    • Watermelon, un futuro modelo fundacional aún más grande

    El equipo también lanzó recientemente Vibes, una aplicación de video generativo diseñada para competir con herramientas como Sora de OpenAI.


    Tensiones internas y cambios estratégicos

    Además de los desafíos técnicos, Meta enfrenta debates internos sobre el futuro de su estrategia de IA.

    Históricamente, la empresa ha sido una defensora del modelo abierto en inteligencia artificial. Sin embargo, ahora algunos de sus líderes, incluidos Zuckerberg y Wang, han considerado mantener el modelo de Avocado cerrado.

    También han surgido desacuerdos sobre cómo integrar estos nuevos modelos en el negocio publicitario de Meta entre Wang, el director de producto Chris Cox y el director tecnológico Andrew Bosworth.

    Para mejorar la coordinación, la empresa ha creado un nuevo equipo de ingeniería de IA bajo la dirección de Bosworth que trabajará directamente con la división de Wang.


    Meta mantiene el optimismo

    A pesar del retraso, Meta insiste en que el desarrollo sigue avanzando.

    Según el portavoz de la compañía Dave Arnold, el próximo modelo no solo será competitivo, sino que demostrará la rapidez con la que la empresa está avanzando en el desarrollo de nuevas capacidades de IA.

    Mientras el equipo de TBD Lab continúa refinando Avocado para un lanzamiento a finales de primavera, Meta ya está trabajando en la próxima generación de modelos.

  • Google Maps recibe una gran actualización con Gemini: navegación 3D inmersiva y el nuevo “Ask Maps”

    Google sigue integrando la IA de Gemini en todos sus productos. Ahora le toca a Google Maps.
    Google sigue integrando la IA de Gemini en todos sus productos. Ahora le toca a Google Maps.

    Google continúa integrando su inteligencia artificial Gemini en todo su ecosistema, y ahora es el turno de Google Maps. La compañía ha presentado una de las mayores actualizaciones en la historia reciente del servicio, incorporando navegación 3D inmersiva y una nueva herramienta conversacional llamada “Ask Maps”.

    Google describe esta actualización como el cambio más importante en la experiencia de conducción con Maps en más de una década.


    Navegación inmersiva: un rediseño 3D

    Durante años, los conductores han dependido de mapas en 2D para navegar. Con la nueva función Immersive Navigation, Google Maps transforma la ruta en una vista tridimensional mucho más realista.

    La nueva vista 3D de Google Maps

    La tecnología utiliza:

    • Imágenes actualizadas de Google Street View
    • Fotografías aéreas
    • Análisis espacial impulsado por Gemini

    El resultado es un entorno 3D que muestra con precisión:

    • Edificios cercanos
    • Puentes y pasos elevados
    • Puntos de referencia
    • Relieve del terreno

    Para evitar distracciones, la aplicación emplea zoom inteligente y transparencia en los edificios cuando el conductor se aproxima a giros complejos o cambios de carril.


    Más información en la carretera

    La navegación también destaca detalles viales importantes que antes podían pasar desapercibidos, como:

    • Carriles específicos
    • Pasos peatonales
    • Semáforos
    • Señales de parada
    • Medianas y divisores de carril

    Además, las indicaciones de voz ahora suenan más naturales y conversacionales. En lugar de instrucciones rígidas, el asistente puede decir cosas como: “Pasa esta salida y toma la siguiente hacia Illinois 43 South.”

    Este enfoque busca facilitar la conducción especialmente en ciudades desconocidas o durante viajes al extranjero.


    Rutas más inteligentes y llegadas sin estrés

    La nueva inteligencia de Maps también mejora la planificación de rutas.

    Antes de iniciar un viaje, la aplicación puede explicar las ventajas y desventajas de rutas alternativas, por ejemplo:

    • Un trayecto más largo con menos tráfico
    • Uno más rápido pero con peajes

    Mientras conduces, la app envía alertas en tiempo real sobre accidentes, obras y otros incidentes, basándose en la comunidad de usuarios que aporta más de 10 millones de reportes diarios.

    Google también ha mejorado el último tramo del viaje —el llamado “last mile”—. Antes de salir, los usuarios pueden:

    • Previsualizar el destino con Street View
    • Ver la entrada exacta del edificio
    • Recibir recomendaciones de estacionamiento cercano
    • Saber en qué lado de la calle está el destino

    “Ask Maps”: un asistente conversacional para descubrir lugares

    La segunda gran novedad es Ask Maps, una función impulsada por Gemini que permite hacer preguntas complejas al mapa usando lenguaje natural.

    Con esta herramienta, los usuarios pueden hacer consultas como:

    • “¿Hay una cancha pública de tenis con luces para jugar esta noche?”
    • “¿Dónde puedo cargar mi teléfono y tomar café sin hacer fila?”

    En lugar de revisar manualmente cientos de reseñas, Gemini analiza información de más de 300 millones de lugares y opiniones de usuarios para generar respuestas personalizadas y un mapa adaptado a la consulta.

    Además, Ask Maps puede:

    • Usar tu historial de búsquedas y lugares guardados
    • Ayudarte a crear itinerarios de viaje completos
    • Permitir acciones directas como reservar restaurantes o guardar ubicaciones

    Disponibilidad de las nuevas funciones

    Las novedades se están desplegando de forma gradual.

    • Immersive Navigation está empezando a activarse para usuarios en Estados Unidos.
    • En los próximos meses llegará a Android, iOS, Apple CarPlay, Android Auto y vehículos con Google integrado.

    Por su parte, Ask Maps ya está comenzando a llegar a usuarios de Android y iOS en Estados Unidos e India, mientras que la versión para escritorio de Google Maps se espera más adelante.

    Habrá que probar esta actualización, porque a pesar de que no hay duda de que Google dispone de la base de datos más actualizada de mapas e incidentes, la facilidad de uso y el interfaz gráfico de usuario siempre me llevan a usar Apple Maps. Si este rediseño cumple con todo lo prometido, quizás sea tiempo para mi de cambiar a Google Maps.


    Con estas nuevas funciones impulsadas por Gemini, Google busca transformar Google Maps de una simple herramienta de navegación en un asistente inteligente capaz de ayudar a explorar el mundo de forma más visual, intuitiva y conversacional.

  • NotebookLM de Google ahora convierte tus notas en videos cinematográficos totalmente animados

    Logo de Google
    Google presento la nueva funcionalidad de NotebookLM

    Presentaciones espectaculares con NotebookLM

    Tomar apuntes y organizar investigaciones acaba de recibir una mejora visual importante. Google ha lanzado oficialmente “Cinematic Video Overviews” para su servicio de inteligencia artificial NotebookLM, una función que permite transformar documentos escritos en videos animados e inmersivos.

    Diseñada para facilitar el aprendizaje y la comprensión de temas complejos, esta nueva herramienta añade una dimensión mucho más dinámica al estudio personal y a la creación de contenido.


    De simples presentaciones a narrativas visuales completas

    El lanzamiento representa un avance significativo respecto a la función Video Overviews introducida el año pasado.

    En su versión anterior, la herramienta generaba presentaciones básicas narradas con audio generado por IA. Ahora, los Cinematic Video Overviews van mucho más allá de las imágenes estáticas, creando visualizaciones detalladas y animaciones fluidas adaptadas al contenido del usuario.

    El objetivo es convertir notas, documentos o investigaciones en explicaciones visuales con estructura narrativa, facilitando la comprensión de información compleja.


    El papel de la IA: Gemini como “director creativo”

    La tecnología detrás de esta función combina varios modelos avanzados de Google, entre ellos:

    • Gemini 3
    • Nano Banana Pro
    • Veo 3

    Dentro de este sistema, Gemini actúa como un director creativo virtual, tomando cientos de decisiones narrativas y visuales para construir el video final.

    Entre otras tareas, el modelo decide:

    • La estructura narrativa más adecuada
    • El estilo visual
    • El ritmo de la animación
    • La coherencia entre las escenas

    El resultado es un video que no solo resume la información, sino que cuenta una historia basada en los documentos del usuario.


    Parte de la expansión de las herramientas generativas de Google

    La llegada de esta función forma parte de una rápida expansión del ecosistema de medios generativos de Google.

    En los últimos meses, la compañía también ha:

    • Actualizado su modelo de video Veo
    • Ampliado el acceso al generador de video Flow
    • lanzado el nuevo generador de imágenes Nano Banana 2
    • Presentado Project Genie, una herramienta experimental capaz de crear pequeños fragmentos jugables de videojuegos

    Este conjunto de avances muestra el creciente interés de Google por integrar generación de video, imágenes y experiencias interactivas dentro de sus herramientas de IA.


    Disponibilidad y límites de uso

    Los Cinematic Video Overviews ya están disponibles desde hoy tanto en web como en dispositivos móviles, incluyendo la app de NotebookLM disponible en la App Store para iPhone y iPad.

    Por ahora, la función:

    • Solo está disponible en inglés
    • Requiere una suscripción a Google AI Ultra (US$250 al mes)
    • Está limitada a usuarios mayores de 18 años

    Para garantizar la calidad y controlar el uso de recursos, Google establece un límite de hasta 20 videos generados por día.


    Una nueva forma de interactuar con la información

    Con esta actualización, NotebookLM apunta a convertirse en una herramienta más visual y pedagógica, capaz de transformar documentos tradicionales en explicaciones dinámicas.

    Ya sea para estudiantes (con mucho dinero) que desean visualizar material de estudio o profesionales que buscan presentar informes de forma más atractiva, esta función abre una nueva forma de interactuar con la información.

  • Anthropic busca atraer a usuarios de la competencia con nueva funcionalidad

    Claude, el nombre del modelo de Anthropic
    Anthropic busca impulsar el uso de Claude entre los usuarios de ChatGPT y Gemini

    Anthropic está aprovechando el auge de popularidad de Claude para lanzar una ofensiva directa contra plataformas rivales como OpenAI (con ChatGPT) y Google (con Gemini).

    En un movimiento estratégico para reducir al mínimo la dificultad que supone cambiar de ecosistema, la compañía ha habilitado su función de memoria para todos los usuarios gratuitos y ha lanzado una herramienta que permite importar fácilmente el historial contextual desde otros chatbots.

    Cambiar de IA sin empezar desde cero

    Uno de los mayores obstáculos para migrar entre asistentes de IA es la pérdida de contexto. Muchos usuarios invierten meses enseñando a su chatbot preferencias de formato, estilo de escritura, lenguajes de programación o detalles personales. Empezar desde cero en otra plataforma no es imposible, pero puede resultar tedioso.

    Para solucionar esto, Anthropic ha creado una herramienta de importación basada en un prompt predefinido. En lugar de requerir integraciones complejas vía API, el usuario solo necesita copiar y pegar un texto en su chatbot actual. Ese prompt instruye al sistema rival para que genere un “dossier” detallado con todo lo que ha aprendido sobre el usuario, organizado en un bloque de código limpio y estructurado.

    El prompt solicita explícitamente que se conserven:

    • Preferencias de tono, formato y estilo (“siempre haz X”, “nunca hagas Y”).
    • Datos personales como nombre, profesión e intereses.
    • Proyectos en curso, objetivos y temas recurrentes.
    • Herramientas, lenguajes y frameworks preferidos.

    Posteriormente, el usuario copia ese bloque de código y lo pega en el contexto de Claude. A partir de ese momento, Claude utilizará esa información importada y asimilada para continuar trabajando con el usuario, manteniendo la experiencia.

    Más acceso y control de privacidad

    Claude ofrecía la función de memoria a suscriptores de pago desde octubre de 2025, pero su expansión al plan gratuito supone un cambio importante en la estrategia de captación de usuarios de Anthropic.

    La función puede activarse desde el menú “Capabilities” en la configuración de Claude. Además, la compañía ha incorporado controles de privacidad robustos: los usuarios pueden pausar temporalmente la memoria sin borrarla, o eliminar completamente los datos almacenados en los servidores de Anthropic.

    Curiosamente, la empresa señala que el prompt de exportación diseñado para migrar datos puede utilizarse, en teoría, para mover información en cualquier dirección entre plataformas de IA que almacenan memoria de contexto (virtualmente todos).

    Aprovechando el momento

    Esta nueva funcionalidad forma parte de una ofensiva más amplia. Tras la decisión de ChatGPT de mostrar anuncios a usuarios gratuitos, Anthropic reiteró públicamente que Claude se mantendrá libre de publicidad. Posteriormente, desbloqueó para usuarios sin suscripción varias funciones antes restringidas, como la creación de archivos, conectores y habilidades adicionales.

    El impulso también ha sido técnico. Con modelos recientes como Opus 4.6 y Sonnet 4.6, que han demostrado ser muy capaces para realizar tareas complejas de programación, análisis de hojas de cálculo y automatización, entre otras.

    Claude ha ganado terreno entre los usuarios más avanzados, quienes la han estado recomendando. Esto explica en parte que la aplicación superó recientemente a ChatGPT en las listas de descargas gratuitas de la App Store, impulsada por herramientas como Claude Code y Claude Cowork. Claro que la otra parte de la explicación es política.

  • La Administración Trump prohíbe el uso federal de Anthropic y la califica como “riesgo para la cadena de suministro”

    Claude, el nombre del modelo de Anthropic
    Claude, el nombre del modelo de Anthropic

    Un enfrentamiento violento sobre los límites éticos de la inteligencia artificial ha llegado a un punto crítico en Washington.

    El presidente Donald Trump ordenó a todas las agencias federales cesar el uso de los productos de Anthropic, la empresa detrás del chatbot Claude. Poco después, el secretario de Defensa Pete Hegseth elevó la disputa al designar oficialmente a la compañía como un “riesgo para la cadena de suministro” para la seguridad nacional.

    La directiva supone, en la práctica, la exclusión de Anthropic del gobierno federal y prohíbe a cualquier contratista, proveedor o socio militar (como por ejemplo Boeing o Northrop Grumman mantener actividades comerciales con la firma. La medida podría afectar a grandes tecnológicas que integran Claude en contratos federales, como Amazon Web Services y Palantir Technologies.

    La administración ha establecido un periodo de transición de seis meses para que agencias y fuerzas armadas migren a otros proveedores.


    El núcleo del conflicto

    Durante semanas, Anthropic y el Pentágono mantuvieron un pulso en torno a los usos permitidos de la tecnología de IA de la empresa. La disputa se originó tras un memorando emitido en enero por Hegseth en el que exigía que los proveedores de IA autorizaran el uso de sus modelos para “todos los fines lícitos”.

    Para Anthropic, esa cláusula traspasa una línea ética fundamental. Según la compañía, esa redacción podría abrir la puerta al uso de sus modelos para vigilancia masiva en territorio nacional o para el desarrollo de armas autónomas letales capaces de identificar y atacar objetivos sin supervisión humana directa.

    El CEO de Anthropic, Dario Amodei, se negó a firmar el acuerdo actualizado. En un comunicado público, afirmó que si bien la empresa no se opone en términos generales a colaborar con el ámbito de defensa, considera que “en un conjunto limitado de casos… la IA puede socavar, en lugar de defender, los valores democráticos”.

    Amodei aseguró que las presiones del gobierno no cambiarán su postura, aunque ofreció colaborar para facilitar una transición ordenada hacia otro proveedor y evitar interrupciones en misiones críticas.

    Según un portavoz de la empresa, las negociaciones finales fracasaron cuando el Pentágono introdujo formulaciones legales que, a su juicio, permitirían ignorar las salvaguardas acordadas. Tras el colapso de las conversaciones, el Departamento de Defensa lanzó un ultimátum y activó la designación de “riesgo para la cadena de suministro”, una etiqueta habitualmente reservada a adversarios extranjeros.


    Una respuesta contundente de la Casa Blanca

    La reacción de la administración fue inmediata y enérgica. En su red social, Trump acusó a Anthropic de intentar imponer sus términos de servicio al Departamento de Defensa por encima de la Constitución, y calificó a la empresa de “radical” e “ideologizada”. También advirtió que, si no coopera durante el periodo de retirada progresiva, podría enfrentar “importantes consecuencias civiles y penales”.

    Hegseth, por su parte, acusó a la compañía de anteponer la ideología de Silicon Valley a las necesidades de las fuerzas armadas y aseguró que la decisión es definitiva.

    Esta respuesta era de esperar por parte de Trump quien suele reaccionar siempre de forma colérica contra quienes se atreven a llevarle la contraria, especialmente si cree que va a poder ganarles fácilmente usando todo el poder del estado.


    Reacciones del sector tecnológico y defensores de derechos civiles

    La medida ha provocado fuertes reacciones en la industria tecnológica y en organizaciones de libertades civiles. Alexandra Givens, presidenta y CEO del Center for Democracy and Technology, advirtió que este tipo de amenazas pueden distorsionar el ecosistema de innovación y expandir peligrosamente el poder ejecutivo.

    Dentro del sector de la IA, numerosas voces han expresado su respaldo a Anthropic. Empleados de empresas competidoras como Google y OpenAI han firmado una carta abierta en solidaridad con la postura ética de la compañía.

    Aunque actores como xAI y OpenAI habrían aceptado las nuevas condiciones del Pentágono, el panorama sigue evolucionando. Según informes, OpenAI estaría buscando renegociar sus términos para incorporar límites éticos similares a los defendidos por Anthropic, y su CEO, Sam Altman, habría indicado internamente que la empresa también está dispuesta a trazar líneas rojas.


    Este enfrentamiento pone de relieve una tensión cada vez más profunda: la colisión entre las políticas de seguridad y ética impulsadas desde Silicon Valley y la visión del aparato militar estadounidense sobre el papel de la inteligencia artificial en el futuro de la guerra.

  • Google redobla su apuesta por la IA física con la integración de Intrinsic

    Intrinsic se integra a Google y utilizará sus modelos de IA
    Intrinsic se integra a Google y utilizará sus modelos de IA

    Google está dando un paso decisivo en la carrera por la inteligencia artificial física. Intrinsic, la compañía de robótica impulsada por IA que nació como uno de los “moonshots” de Alphabet, dejará de operar como proyecto independiente para integrarse directamente dentro de Google.

    El movimiento no es menor. Desde 2021, Intrinsic formaba parte de la división “Otras apuestas” de Alphabet , el portafolio de apuestas de alto riesgo y alto impacto que incluye a Waymo y Verily, trabajando silenciosamente en una ambición clara: transformar la forma en la que los robots son programados, desplegados y utilizados en entornos industriales.

    Ahora, al convertirse en un “grupo diferenciado” dentro de Google, Intrinsic pasa de experimento prometedor a pieza estratégica.

    El “Android de la robótica”

    La visión de Intrinsic es ambiciosa: convertirse en el “Android de la robótica”. Su plataforma propone una capa de software universal que permita desarrollar aplicaciones compatibles con distintos robots, cámaras y sensores, eliminando la fragmentación que hoy caracteriza al sector.

    En lugar de programaciones rígidas y específicas para cada máquina, Intrinsic busca ofrecer un framework de software interoperable con el que los desarrolladores puedan construir soluciones adaptables y escalables. El concepto es tan potente que incluso gigantes tecnológicos como Meta han mostrado interés en explorar enfoques similares.

    De movimientos rígidos a inteligencia adaptativa

    El verdadero salto está en la inteligencia. Intrinsic quiere que los robots dejen de ejecutar instrucciones predefinidas y pasen a percibir, razonar y reaccionar dinámicamente ante cambios en tiempo real.

    Eso significa robots capaces de ajustarse a variaciones en procesos industriales, manipular objetos impredecibles o adaptarse a entornos cambiantes sin necesidad de reprogramación constante. En esencia, se trata de trasladar la potencia de la IA moderna al mundo físico.

    Sinergia con Gemini y DeepMind

    Aunque no se han hecho públicos los términos financieros de la transacción, la lógica estratégica es evidente. Integrada en Google, Intrinsic podrá aprovechar directamente la infraestructura de Google Cloud y los modelos avanzados de Gemini.

    Además, trabajará estrechamente con Google DeepMind, consolidando una estrategia que la compañía viene afinando desde hace años: centrarse en desarrollar el “cerebro” de las máquinas más que el hardware en sí.

    Tras vender Boston Dynamics en 2017, Google ha pivotado progresivamente hacia una visión de robótica definida por software e inteligencia artificial. En 2023, DeepMind absorbió la división Everyday Robotics, y posteriormente lanzó modelos basados en Gemini diseñados para tareas físicas complejas.

    La apuesta por una capa universal de IA física

    Con esta integración, Google envía una señal clara al mercado: el próximo gran avance en robótica no dependerá únicamente de mejoras mecánicas, sino de una capa de software impulsada por IA capaz de convertir cualquier máquina en un sistema adaptable e inteligente.

    Si Gemini es el cerebro digital para texto, imagen y código, Intrinsic podría convertirse en el puente que lleve esa inteligencia al mundo físico.

    La carrera por la IA ya no es solo virtual. Google quiere que también sea tangible.

  • Google presenta Nano Banana 2: generación de imágenes con calidad profesional a velocidad “Flash”

    Nano Banana 2
    El modelo Nano Banana 2 de Google

    Google vuelve a acelerar en la carrera de la IA generativa con el lanzamiento de Nano Banana 2, presentado oficialmente el 26 de febrero de 2026. El modelo —conocido técnicamente como Gemini 3.1 Flash Image— promete combinar calidad visual de nivel profesional con velocidades ultrarrápidas.

    Tras el éxito viral del primer Nano Banana en agosto de 2025 y la versión Nano Banana Pro en noviembre, Google ahora lleva esas capacidades avanzadas al público general. Nano Banana 2 reemplaza a la versión Pro como generador de imágenes predeterminado dentro del ecosistema Gemini, ampliando funciones antes reservadas a suscriptores de pago.


    Inteligencia avanzada a velocidad Flash

    La filosofía detrás de Nano Banana 2 es clara: unir la potencia visual y el razonamiento avanzado de la versión Pro con la infraestructura optimizada y veloz de Gemini Flash.

    El modelo aprovecha la base de conocimiento de Gemini y puede integrar información en tiempo real desde búsquedas web para representar sujetos específicos con mayor precisión o convertir notas en visualizaciones complejas e infografías.

    Entre sus capacidades destacadas:

    • Consistencia de personajes y objetos: permite mantener la apariencia exacta de hasta cinco personajes y la fidelidad de hasta 14 objetos distintos en un mismo flujo creativo, ideal para narrativa visual y storyboards.
    • Texto preciso y traducción integrada: genera texto legible y correctamente alineado dentro de imágenes (maquetas de marketing, tarjetas, diagramas) e incluso lo traduce y localiza directamente.
    • Control total de formato: admite múltiples relaciones de aspecto y resoluciones desde 512 px hasta 4K.
    • Mayor fidelidad visual: iluminación más vibrante, texturas más ricas y mayor precisión en la interpretación de instrucciones complejas.

    Integración en todo el ecosistema Gemini

    Nano Banana 2 pasa a ser el modelo predeterminado en:

    • La app de Gemini (en sus modos Fast, Thinking y Pro)
    • El Modo IA de Google Search
    • Google Lens
    • Flow, la herramienta de video con IA de Google

    También está disponible en fase preliminar para desarrolladores a través de AI Studio, la API de Gemini y Vertex AI en Google Cloud, además de integrarse en sugerencias creativas dentro de Google Ads.

    Aunque Nano Banana 2 se convierte en el estándar, los suscriptores de Google AI Pro y Ultra aún pueden acceder a Nano Banana Pro para tareas que requieran máxima precisión factual.


    Seguridad y trazabilidad con SynthID

    Ante el creciente realismo del contenido generado por IA, Google refuerza su apuesta por la transparencia. Nano Banana 2 integra SynthID, la tecnología de marca de agua digital desarrollada por la compañía para identificar contenido generado por IA.

    Desde noviembre, la función de verificación de SynthID se ha utilizado más de 20 millones de veces. Google también planea combinarla con credenciales de contenido interoperables bajo el estándar C2PA, ofreciendo mayor claridad sobre el origen y edición de imágenes.


    La estrategia “navaja suiza” de la IA

    Con este lanzamiento, Google deja clara su ambición: convertir Gemini en una plataforma creativa integral. Al combinar generación de imágenes ultrarrápida con modelos de video como Veo y herramientas musicales como Lyria, la compañía construye un ecosistema creativo interconectado.

    El objetivo es consolidar su liderazgo en IA generativa en un momento en que la competencia se intensifica y el mercado evoluciona hacia soluciones cada vez más integradas, rápidas y accesibles.

  • OpenAI lanzará un altavoz inteligente con IA en 2027

    El logotipo de OpenAI
    El logotipo de OpenAI

    OpenAI quiere competir con Alexa, Google y Siri

    OpenAI, la empresa que revolucionó el mundo de la IA generativa con el lanzamiento de ChatGPT, pretende diversificarse aventurándose en el mercado del hardware, con planes de lanzar una serie de dispositivos impulsados por IA. El primer producto que esperan lanzar es un altavoz inteligente, que podría llegar al mercado en 2027. Este ambicioso proyecto está respaldado por un equipo dedicado de más de 200 empleados y marca un paso significativo para OpenAI más allá de su enfoque tradicional, centrado en el software.

    Se prevé que el altavoz inteligente, con un precio entre $200 y $300, cuente con una variedad de funciones diseñadas para sumergir a los usuarios en una experiencia impulsada por la IA. Equipado con una cámara, el dispositivo tiene como objetivo comprender su entorno identificando objetos en su vecindad e incluso interpretando conversaciones cercanas. Esta recopilación de información visual y auditiva permite un nivel más profundo de interacción y respuestas personalizadas. Además, se rumorea que la cámara incorpora un sistema de reconocimiento facial similar al Face ID de Apple, lo que podría permitir a los usuarios autenticar compras directamente a través del altavoz.

    OpenAI trabaja también en otros dispositivos

    Más allá del altavoz inteligente, OpenAI también está explorando otras posibilidades de hardware, incluidas gafas inteligentes y una lámpara inteligente. Si bien se han desarrollado prototipos de la lámpara inteligente, su futuro sigue siendo incierto. Las gafas inteligentes, destinadas a competir con las ofertas de Meta, están proyectadas para un lanzamiento posterior, potencialmente en 2028.

    Este impulso hacia el hardware está significativamente influenciado por los problemas que enfrenta OpenAI para generar los flujos de efectivo que requiere su operación. En tiempos recientes ha enfrentado una competencia feroz tanto por el lado de Google como por parte de Anthropic que le han quitado importantes partes de mercado, pero que además ponen en riesgo esa percepción de liderazgo en temas de IA que la empresa tenía con sus clientes.

    El mercado está muy competido

    Sin embargo, ganar dinero en el mercado de los altavoces inteligentes es complicado. Por un lado está Amazon que ha perdido billones de dólares promoviendo los dispositivos Alexa a precios muy bajos y por otro lado está Apple que dispone de un rico ecosistema que hace que sus clientes prefieran los productos de la compañía. Entre los dos, está Google, un gigante con gran experiencia en IA y que en tiempos recientes parece haber rebasado a OpenAI en cuanto a calidad de sus modelos, diferencia que se podría acrecentar con el próximo lanzamiento de Gemini 3.1.

    Aún así, OpenAI parece creer que lo puede lograr. Por eso adquirieron la firma de diseño de Jony Ive, io Products. Ive, el ex Director de Diseño de Apple, es ampliamente reconocido por dar forma a la estética de diseño icónica de Apple. La apuesta de OpenAI es clara, tienen la intención de lanzar dispositivos visualmente atractivos y fáciles de usar.

    Existen aún muchos interrogantes

    Aunque la estrategia es clara, la colaboración no ha estado exenta de problemas. Se ha sabido por ejemplo que la integración de la filosofía de diseño de Ive con el equipo de hardware existente de OpenAI ha provocado cierta fricción.

    También existe preocupación con respecto a la potencia informática necesaria para operar dispositivos de IA a escala. Finalmente, hay dudas acerca de como se protegerá la privacidad con unos dispositivos que están constantemente escuchando y observando.

    A pesar de estos obstáculos, la incursión de OpenAI en el ámbito del hardware promete ser paso importante en la rápida evolución de la IA y su integración en nuestra vida diaria.

    El éxito de estos dispositivos probablemente dependerá de cómo OpenAI logrará atender las crecientes preocupaciones acerca de la privacidad de los consumidores y sobre todo de su capacidad para ofrecer un valor convincente de forma sostenida a sus clientes ya que es probable que además del precio del altavoz haya que pagar una suscripción mensual.