gadgetsgenial.es

Categoría: IA

Noticias acerca de productos y servicios relacionados con la Inteligencia Artificial

  • MemPalace, el proyecto de memoria para la IA de Milla Jovovich, despierta fascinación y polémica

    Milla Jovovich da el salto de Hollywood la IA con su proyecto MemPalace
    Milla Jovovich da el salto de Hollywood la IA con su proyecto MemPalace

    De Hollywood a GitHub

    No conforme con combatir hordas de zombis y salvar el universo en franquicias icónicas de ciencia ficción como Resident Evil y The Fifth Element, la actriz Milla Jovovich ha puesto la mira en una nueva frontera, la inteligencia artificial.

    El 6 de abril de 2026, la actriz sorprendió al mundo tecnológico con el lanzamiento de MemPalace, una herramienta gratuita y de código abierto diseñada para mejorar la memoria de los sistemas de IA. El proyecto fue desarrollado junto a Ben Sigman, CEO del marketplace de préstamos peer-to-peer de Bitcoin Libre. El impacto fue inmediato: 13,000 estrellas en GitHub durante las primeras 24 horas y más de 34,000 estrellas junto a 4,000 forks en solo tres días.

    Sin embargo, su popularidad explosiva también vino acompañada de un intenso escrutinio por parte de la comunidad de desarrolladores.


    MemPalace combate la “amnesia de la IA”

    La idea de MemPalace surgió a finales de 2025, cuando Jovovich utilizaba intensivamente herramientas de IA para desarrollar un proyecto de videojuegos aún no anunciado. Durante ese proceso se topó con un problema frustrante: la “amnesia de la IA”.

    Los modelos actuales tienen una memoria de contexto limitada y por eso suelen resumir conversaciones. Decidir qué información es relevante y descartar el resto es un proceso complejo. Para Jovovich, esto significaba perder meses de trabajo y tener que empezar desde cero repetidamente. Además, consideraba que los sistemas tradicionales basados en búsquedas por palabras clave eran “torpes y desordenados”.

    Su solución fue inspirarse en el método de loci, una antigua técnica mnemónica de la cultura clásica griega conocida como el “palacio de la memoria”. En lugar de enviar datos a la nube, MemPalace organiza la información de forma local en el dispositivo del usuario. El sistema estructura los datos como si fueran áreas, pasillos y habitaciones dentro de un edificio imaginario, permitiendo a la IA recuperar recuerdos palabra por palabra sin pérdida alguna.


    Cómo funciona MemPalace

    Jovovich conceptualizó la arquitectura del proyecto, mientras que Sigman aportó la ingeniería necesaria para convertir la idea en realidad. El desarrollo se apoyó en herramientas como Claude Code de Anthropic, así como en tecnologías open source como ChromaDB y SQLite.

    El equipo también creó un lenguaje de compresión propio llamado “AAAK compression dialect”, diseñado para que la IA pueda comprimir grandes volúmenes de información en pequeños resúmenes altamente eficientes.

    En sus primeras pruebas, el sistema parecía impresionante: el investigador Jeremy Nguyen señaló que MemPalace obtuvo un 100% en el benchmark LongMemEval, una prueba que mide memoria a largo plazo, razonamiento entre sesiones y actualización de conocimiento en modelos de lenguaje.


    La polémica en GitHub y el misterio de “Lu”

    El entusiasmo inicial dio paso rápidamente a la polémica. La comunidad de desarrolladores cuestionó tanto la validez de los benchmarks como el papel real de Jovovich en el desarrollo.

    La controversia estalló en redes sociales cuando un comentarista de IA acusó a Sigman de usar a la actriz como figura promocional y de contratar a un supuesto desarrollador fantasma llamado “Lu”. La sospecha surgió debido al historial limitado de Jovovich en GitHub.

    Sigman reconoció que la comunidad “destrozó” el proyecto en su análisis inicial y posteriormente ajustó la puntuación del benchmark a un 96.6% en modo real.

    Jovovich respondió rápidamente: “Lu o Lu_code es mi agente de IA, así que los comentarios entre Ben y Lu son en realidad míos”. Con ello, desmintió la teoría del programador fantasma y reafirmó su rol como arquitecta del proyecto, apoyada por su agente de IA para tareas de código y scripts.


    Optimismo de expertos y el papel humano en la IA

    A pesar de la polémica, expertos ven potencial real en la propuesta. Sean Ren, profesor de ciencias computacionales y CEO de Sahara AI, considera que MemPalace ofrece un enfoque novedoso para estructurar la memoria de los sistemas de IA y que podría escalar a distintos tipos de agentes. No obstante, advierte que los resultados deben validarse en entornos reales.

    Para impulsar esa validación, Jovovich y Sigman han abierto un canal de Discord donde desarrolladores pueden experimentar, enviar mejoras y contribuir al proyecto.

    Una iniciativa muy meritoria

    La gente tiene la mala costumbre de infravalorar a los actores en general y a las actrices en particular. Un caso muy conocido es el de Hedy Lamarr que tras huir de la Alemania nazi se convirtió en una estrella de Hollywood en los años 40. En 1942 patentó un sistema de comunicación para torpedos para ayudar a los ejércitos aliados. Ese invento es la base de funcionamiento de los actuales teléfonos celulares.

    Para la actriz, la experiencia refuerza su visión sobre la relación entre arte y tecnología:
    “La IA solo sabe lo que ya se ha hecho. Son los humanos quienes crean algo único y diferente”.

  • El exploit que logró que Apple Intelligence insultara a los usuarios

    Todos los modelos de IA locales se pueden engañar para saltarse las reglas, incluso Apple Intelligence.
    Todos los modelos de IA locales se pueden engañar para saltarse las reglas, incluso Apple Intelligence.

    Apple Intelligence es más grosero de lo que quisiera la empresa

    Apple Intelligence se ha convertido rápidamente en una pieza clave del ecosistema de la compañía. Integrado en Macs, iPhone y iPad recientes, el sistema de IA en el dispositivo impulsa apps nativas como Mail, Messages y Siri, además de estar disponible para desarrolladores. Con unos 200 millones de dispositivos compatibles activos a finales de 2025, la seguridad es crítica.

    Sin embargo, investigadores de RSAC demostraron recientemente lo vulnerable que pueden ser estos modelos locales. Encadenando dos técnicas avanzadas de ataque, lograron saltarse las protecciones de seguridad y forzar al sistema a generar respuestas controladas por el atacante.

    En sus pruebas, el equipo consiguió que la IA produjera texto ofensivo, pero el riesgo real iba mucho más allá porque la vulnerabilidad podía manipular datos accesibles por apps que usan el modelo.

    El riesgo real es la manipulación de contactos y otros datos

    Según Petros Efstathopoulos, VP de I+D en RSAC, el exploit podía crear contactos falsos en el dispositivo:

    • Añadir un nuevo contacto con privilegios de confianza
    • Insertar números maliciosos bajo nombres confiables (por ejemplo, “mamá”)

    Esto abre la puerta a ataques de ingeniería social mucho más sofisticados.

    Cómo funcionó el ataque

    Para ejecutar el exploit, los investigadores tuvieron que burlar la cadena de seguridad del sistema. Su hipótesis:

    1. Un filtro revisa la entrada del usuario.
    2. El modelo LLM genera la respuesta.
    3. Un filtro final revisa la salida antes de mostrarla.

    Para romper este flujo combinaron dos técnicas:

    1) Hack Unicode para engañar filtros

    El equipo escribió instrucciones maliciosas al revés y aplicó la función Unicode Right-to-Left Override. El resultado:

    • El texto parecía inocente para los filtros
    • El modelo lo interpretaba correctamente y ejecutaba las instrucciones

    2) Neural Exec: automatización del prompt injection

    Después desplegaron Neural Exec, técnica creada por el investigador Dario Pasquini que automatiza el prompt injection.
    En lugar de crear ataques manualmente, un algoritmo genera cadenas optimizadas para obligar al modelo a ignorar sus reglas.

    El hecho de que Apple use modelos más pequeños en el dispositivo, en lugar de modelos gigantes albergados en la nube, los hace más vulnerables a los ataques adversariales. De hecho, recientemente se anunció una herramienta de código abierto que puede eliminar todas las medidas de seguridad en modelos locales, llamada OBLITERATUS.

    76% de éxito en pruebas reales

    Para medir el impacto, los investigadores ejecutaron 100 pruebas combinando:

    • Prompts legítimos
    • Cadenas maliciosas
    • Entradas benignas extraídas de Wikipedia

    El ataque tuvo éxito en el 76% de los casos.

    La solución (y el reto a futuro)

    La buena noticia es que el fallo ya fue corregido. RSAC informó a Apple el 15 de octubre de 2025, y la empresa reforzó sus sistemas silenciosamente en iOS 26.4 y macOS 26.4.

    Aun así, el problema de la inyección de prompts está lejos de desaparecer. A medida que la IA se integra más en dispositivos personales, la seguridad seguirá siendo un juego constante de gato y ratón entre investigadores y atacantes.

  • OpenAI lanza un nuevo plan ChatGPT Pro de $100 al mes

    OpenAI anuncia un nuevo plan ChatGPT Pro de $100 al mes para competir mejor con Anthropic
    OpenAI anuncia un nuevo plan ChatGPT Pro de $100 al mes para competir mejor con Anthropic

    Pensado para los desarrolladores que usan Codex

    OpenAI amplía su catálogo de suscripciones con un nuevo plan ChatGPT Pro de 100 dólares mensuales, diseñado especialmente para desarrolladores que usan su herramienta de programación basa en agentes de IA, Codex. El objetivo es cubrir el espacio entre el uso casual y las cargas de trabajo de nivel empresarial con límites más altos y funciones exclusivas.

    La guerra de la programación asistida por IA se intensifica

    El lanzamiento llega en un momento clave. Desde la llegada de la app de Codex para Mac en febrero, la adopción se ha disparado y la herramienta ya supera los 3 millones de usuarios activos semanales, lo que supone un creciendo del 500% en apenas tres meses.

    Pero no es solo una respuesta a la demanda interna. También es un movimiento competitivo directo frente a Anthropic y su herramienta Claude Code, especialmente su plan Max de 100 dólares al mes.

    Qué incluye el nuevo plan ChatGPT Pro de $100

    El nuevo nivel está pensado para sesiones de programación largas y proyectos ambiciosos. Entre sus beneficios destacan:

    • 5 veces más uso de Codex que el plan ChatGPT Plus de $20/mes
    • Acceso a todas las funciones Pro, incluidos modelos exclusivos
    • Uso ilimitado de los modelos Instant y Thinking de OpenAI

    Además, como promoción de lanzamiento, hasta el 31 de mayo los suscriptores recibirán hasta 10x más uso de Codex que con el plan Plus.

    ¿Cómo queda la nueva escala de precios?

    Con esta incorporación, la oferta de suscripciones queda así:

    • Free & Go ($8/mes): uso básico y casual
    • Plus ($20/mes): ideal para uso diario de Codex
    • Pro ($100/mes): pensado para “proyectos reales”, con 5x más capacidad que el plan Plus
    • Pro ($200/mes): para cargas intensivas y proyectos paralelos, con 20x más capacidad

    Los límites de consumo de ChatGPT Pro son igual de turbios que los de Claude

    El problema es que, al igual que en el caso de Claude, para los desarrolladores es difícil estimar cuánto uso real significa 5 o 20 veces más capacidad que el plan Plus.

    En general, una buena noticia para los usuarios de Codex

    El nuevo plan de $100 funciona como el punto intermedio que muchos desarrolladores pedían, con más potencia que el plan Plus, pero sin llegar a las necesidades del plan de $200. En plena carrera por dominar la programación asistida por IA, OpenAI apuesta por ofrecer la capacidad exacta que los creadores necesitan para construir la próxima generación de software.

  • YouTube Shorts estrena avatares IA personalizados para creadores

    YouTube Shorts ya permite la creación y uso de avatars para la creación de contenido.
    YouTube Shorts ya permite la creación y uso de avatars para la creación de contenido.

    Clónate tu mismo

    La era de la inteligencia artificial personalizada llega oficialmente a las redes sociales. YouTube Shorts está comenzando a desplegar una función muy esperada que permite a los creadores generar avatares IA fotorrealistas de sí mismos para utilizarlos en videos cortos.

    La herramienta “Make a video with my avatar” ya está disponible en las apps móviles de YouTube y YouTube Create, permitiendo capturar tu apariencia y voz para crear un clon digital capaz de hablar, gesticular y expresarse como tú.

    A continuation un ejemplo de un avatar creado por el usuario Jibin Joseph:


    Cómo crear tu doble digital en YouTube Shorts

    Para usar la función debes ser propietario de un canal y tener al menos 18 años. El proceso dentro de la app es sencillo:

    1. Toca el botón Crear (+) y selecciona Short.
    2. Pulsa el icono de chispas (AI Playground).
    3. Elige Create video → Make a video with my avatar.

    Después deberás grabar un selfie en vivo:

    • Mueve la cabeza de lado a lado.
    • Lee números en voz alta para capturar tu voz.
    • Mantén buena iluminación y silencio absoluto.

    Una vez generado el avatar, solo debes escribir un prompt y la IA producirá un video de hasta 8 segundos en el que tu clon hablará con movimientos labiales, expresiones faciales y gestos realistas.

    También podrás insertarte en Shorts existentes usando:
    Remix → Reimagine → Add me to this scene.


    Seguridad, transparencia y control

    Ante el crecimiento de los deepfakes, YouTube enfatiza el uso responsable:

    • Todos los videos tendrán la etiqueta de contenido generado por IA
    • Incluirán marcas visibles e invisibles (SynthID y C2PA)
    • Solo el creador puede usar su avatar
    • El avatar puede eliminarse en cualquier momento

    Eso sí, borrar el avatar no elimina automáticamente los videos ya publicados; deberán borrarse manualmente. Además, Google eliminará avatares que no se usen durante tres años.


    La apuesta total de YouTube por la IA

    Esta función llega primero a usuarios móviles, con un despliegue global progresivo en los próximos días.

    Forma parte de una ola de novedades con IA que YouTube ha lanzado recientemente:

    • Escalado automático de videos
    • Edición asistida por IA
    • Resultados de búsqueda generados por IA

    Con los avatares personalizados, crear contenido rápido y atractivo nunca había sido tan fácil.

  • Google integra NotebookLM en Gemini para simplificar la gestión de proyectos con IA

    La gestión de proyectos por fin llega a Gemini
    La gestión de proyectos por fin llega a Gemini

    Google acorta distancias con la competencia

    A medida que dependemos cada vez más de la inteligencia artificial para proyectos complejos, desde estudiar para un examen hasta investigar oportunidades de negocios, organizar chats, archivos y fuentes se ha convertido en un gran desafío. Durante mucho tiempo, los usuarios de Google Gemini pedían una función de gestión de proyectos similar a las herramientas disponibles en otras plataformas.

    Ahora, Google responde integrando su potente herramienta de investigación con IA, NotebookLM, directamente dentro de Gemini.

    Google describe esta novedad como la creación de un auténtico “segundo cerebro”, que introduce los notebooks(cuadernos) en Gemini para organizar ideas, archivos y conversaciones en un solo lugar.


    Cómo funcionan los notebooks en Gemini

    Empezar a usar los notebooks es sencillo ya basta con hacer clic en “New notebook” en el panel lateral de Gemini. Desde ahí, el chatbot se transforma en una base de conocimiento personalizada.

    Cada notebook permite:

    • Subir hasta 100 fuentes seleccionadas
    • Añadir PDFs, documentos de texto, URLs, videos de YouTube y texto copiado
    • Definir instrucciones globales para el proyecto (rol de la IA, tono y reglas)

    Esto permite adaptar Gemini en un asistente especializado para cada proyecto.


    Sinergia total entre Gemini y NotebookLM

    La app independiente de NotebookLM no desaparece. En su lugar, ambas plataformas ahora funcionan en tandem con una sincronización bidireccional automática.

    Todo lo que agregues en Gemini aparecerá en NotebookLM y viceversa, lo que permite aprovechar las fortalezas de cada herramienta sin duplicar trabajo.

    Ejemplo práctico:

    1. Un estudiante sube apuntes y videos a un notebook en Gemini.
    2. Abre ese mismo notebook en NotebookLM para crear:
      • Un resumen en formato podcast (Audio Overview)
      • Mapas mentales
      • Infografías
    3. Regresa a Gemini para generar un ensayo usando las mismas fuentes.

    El resultado es un flujo de trabajo de IA mucho más integrado y eficiente.


    Disponibilidad y lanzamiento

    La función de notebooks comienza a desplegarse esta semana para usuarios de:

    • Google AI Ultra
    • Google AI Pro
    • Google AI Plus

    Inicialmente estará disponible en la versión web. El acceso móvil y para usuarios gratuitos llegará en las próximas semanas.

    El lanzamiento en Europa se retrasará ligeramente para cumplir con regulaciones locales.


    La integración entre Gemini y NotebookLM marca un gran paso hacia la productividad con IA, transformando al asistente en una herramienta capaz de organizar y potenciar cualquier proyecto a largo plazo.

  • Controla tu Mac y agentes de IA remotamente con Workbench de Astropad

    Astropad lanza la app Workbench para controlar las Macs remotamente desde una Mac, iPad o iPhone.
    Astropad lanza la app Workbench para controlar las Macs remotamente desde una Mac, iPad o iPhone.

    Diseñado para la IA y aplicaciones como OpenClaw

    La compañía Astropad, conocida por convertir el iPad en una tableta profesional con Astropad Studio, amplía su oferta de software con Workbench, una nueva app de escritorio remoto diseñada específicamente para la era de la inteligencia artificial y para las computadoras de Apple.

    A diferencia de las soluciones tradicionales de acceso remoto, Workbench está pensada para gestionar Macs que funcionan como servidores personales siempre activos, especialmente en configuraciones “headless” (sin monitor) como la Mac mini que ejecutan automatizaciones o agentes de IA locales como OpenClaw.


    Un escritorio remoto pensado para la era de la IA

    El auge de Apple Silicon ha convertido a muchas Macs (en especial las minis) en servidores personales dedicados a tareas de fondo, automatización y modelos de IA locales. En muchos casos, estos servidores no cuentan ni con un monitor ni con un teclado. Sin embargo, Apple no ofrece una herramienta nativa optimizada para administrar estos entornos de forma remota.

    Workbench llega para cubrir ese vacío y permite:

    • Supervisar los logs del sistema
    • Verificar los resultados de agentes de IA
    • Reiniciar automatizaciones fallidas
    • Reconectar procesos largos
    • Lanzar prompts mediante el uso de la voz, usando el micrófono del iPhone o del iPad
    • Controlar tus Macs desde iPhone o iPad desde cualquier lugar

    La idea es dejar de depender del acceso físico a la computadora para gestionar flujos de trabajo de IA y automatización.


    El motor Liquid: la clave del rendimiento

    El gran diferenciador de Workbench frente a otras herramientas similares como TeamViewer o el screen sharing de macOS es el motor propietario Liquid de Astropad, el mismo que impulsa Luna Display y Astropad Studio.

    Este motor ofrece:

    • Streaming rápido y de alta fidelidad
    • Soporte para pantallas Retina
    • Codecs adaptativos
    • Latencia muy baja
    • Colores precisos sin pérdida perceptible

    Además, la app fusiona múltiples pantallas de la Mac en una sola vista adaptada al iPhone o iPad, con un mini-mapa para navegar escritorios grandes con facilidad.


    Control total desde tu iPhone o iPad

    Workbench convierte el dispositivo móvil en un centro de control completo:

    • Soporte para Apple Pencil
    • Gestos táctiles intuitivos
    • Teclado y ratón
    • Dictado por voz para comandos y prompts

    En cuanto a conectividad, elimina la fricción típica del escritorio remoto ya que no requiere configuraciones complejas ni port forwarding. Las conexiones se gestionan mediante una red global de relé con cifrado AES-256 de extremo a extremo, y Astropad asegura que no se graban sesiones ni pantallas.


    Disponibilidad y precio

    Workbench ya está disponible con apps nativas para Mac, iPhone y iPad.

    Requisitos principales:

    • macOS 15 o superior
    • Dispositivo iOS actualizado
    • Compatible con Intel, pero optimizado para Apple Silicon

    Modelo de precios:

    • Gratis: 20 minutos diarios
    • Planes ilimitados:
      • US$10 al mes
      • US$50 al año

    Workbench es una aplicación diseñada para desarrolladores, entusiastas y profesionales que ejecutan automatizaciones o IA local, y confirma la tendencia de que la Mac se está transformando en un verdadero servidor personal siempre conectado. El próximo lanzamiento de la Mac mini M5 solo debería acelerar este movimiento.

  • Meta reinicia su estrategia de IA con Muse Spark

    Tras el fracaso de Llama 4, Meta apuesta por un nuevo modelo, Muse Spark
    Tras el fracaso de Llama 4, Meta apuesta por un nuevo modelo, Muse Spark

    Un nuevo inicio para Meta

    Tras la fría recepción de Llama 4 en 2025, Meta ha decidido pasar página y relanzar su ambición en inteligencia artificial. Con miles de millones invertidos y la creación de Meta Superintelligence Labs bajo el liderazgo de Alexandr Wang, la compañía presenta su nuevo modelo insignia, Muse Spark.

    Se trata del primer paso de una nueva etapa para las iniciativas de IA de Meta y, a diferencia de muchos anuncios que prometen lanzamientos futuros, el modelo ya está disponible a través de la app y la web de Meta AI.


    Un enfoque por niveles para el razonamiento

    Muse Spark introduce un sistema de razonamiento escalable que permite elegir cuánta “profundidad mental” usar según la tarea:

    • Instant: respuestas ultrarrápidas para consultas básicas.
    • Thinking: análisis más profundo para problemas complejos.

    Meta asegura que el modo Thinking ya compite con modelos de referencia como Claude Opus 4.6 Max, Gemini 3.1 Pro High y GPT-5.4 Xhigh.

    El verdadero salto llegará con Contemplating, un modo en desarrollo que coordina múltiples subagentes trabajando en paralelo. Este enfoque multiagente promete grandes mejoras en tareas complejas, como planificación avanzada o investigación científica.

    En la práctica, esto permitirá dividir tareas complejas, como por ejemplo planear un viaje, entre múltiples agentes, trabajando en paralelo en la reservaciones de avión, hotel y excursiones.


    Diseñado para el ecosistema Meta

    Muse Spark está pensado para mejorar todo el universo de productos de Meta.

    Su capacidad multimodal nativa permite:

    • Analizar fotos y vídeos en tiempo real
    • Responder preguntas visuales tipo Google Lens
    • Integrarse con gafas inteligentes y apps sociales

    El modelo también incorpora un asistente de compras, capaz de comparar productos, mostrar pros y contras y ofrecer enlaces de compra, con lo que Meta entra directamente en competencia con otros asistentes de e-commerce basados en IA.

    A futuro, Meta planea que la IA haga recomendaciones usando contenido compartido en Instagram, Facebook y Threads.


    Una apuesta fuerte por la salud

    Uno de los pilares diferenciales de Muse Spark es su enfoque en salud y bienestar.

    Para mejorar la exactitud y combatir la desinformación, Meta colaboró con más de 1,000 médicos en la curación de datos de entrenamiento relacionados con la salud.

    Entre sus capacidades destacan:

    • Explicar visualmente la activación muscular en ejercicios
    • Estimar las calorías de alimentos a partir de fotos
    • Analizar gráficos médicos e imágenes

    Con esto, Meta busca competir directamente con nuevas iniciativas de IA enfocadas en salud.


    Lanzamiento y dudas sobre el open source

    Muse Spark ya está disponible en EE. UU. y se integrará progresivamente en:

    También llegará una API privada para socios.

    Sin embargo, queda una gran incógnita, ¿abrirá sus nuevos modelos Meta como lo hacía con Llama?. Aunque Meta afirma que “espera” liberar versiones futuras, las declaraciones recientes de Mark Zuckerberg sugieren una postura más cautelosa.

    Por ahora, Muse Spark marca el inicio de una nueva etapa en la que Meta quiere olvidar el fracaso de Llama 4 y posicionarse como protagonista en la carrera por la super inteligencia personal integrada en la vida diaria.

  • Apple quiere redefinir el prototipado de interfaces gráficas mediante IA con SQUIRE

    Xcode 26.3 soporta el desarrollo con IA mediante el uso de agentes. Xcode 27 podría integrar SQUIRE.
    Xcode 26.3 soporta el desarrollo con IA mediante el uso de agentes. Xcode 27 podría integrar SQUIRE.

    La próxima frontera de la IA de Apple

    Apple continúa integrando inteligencia artificial en su ecosistema de desarrollo. Tras introducir herramientas de agentic coding en Xcode 26.3, compatibles con chatbots como Claude y Codex, ahora Apple se centra en el siguiente paso del llamado vibe coding, el diseño de interfaces impulsado por IA.

    El protagonista de esta nueva fase es SQUIRE, un proyecto de investigación presentado en el estudio academico SQUIRE: Interactive UI Authoring via Slot Query Intermediate Representations, que propone reinventar el prototipado de interfaces con ayuda de IA.

    En el estudio, SQUIRE fue utilizado para crear interfaces gráficos web, pero la misma tecnologia aplica para GUIs nativos como SwiftUI o AppKit.


    El problema actual del diseño asistido por IA

    Los prompts en lenguaje natural han revolucionado el desarrollo de software, pero en diseño de interfaces gráficas presentan dos grandes retos:

    • El lenguaje natural es ambiguo y difícil de traducir con precisión a elementos visuales.
    • Los modelos de lenguaje pueden responder de forma impredecible.

    Hoy, muchas herramientas generan un diseño completo tras un solo prompt. Si no convence, el desarrollador entra en un ciclo frustrante de prueba y error. Hay que volver a pedir cambios con la esperanza de que la IA no rompa el resto del diseño.


    Qué es SQUIRE y por qué cambia el juego

    SQUIRE propone un enfoque radicalmente distinto que busca combinar el poder de la IA con control granular.

    El sistema fue creado usando GPT-4o (que en ese momento era considerado como el modelo más moderno) y crea una representación intermedia llamada SquireIR. En lugar de generar código final directamente, la IA construye un árbol de componentes con “slots” (espacios vacíos) para completar.

    Ejemplos de slots:

    • Etiquetas de botones
    • Imágenes
    • Estructuras de layout
    • Elementos interactivos

    El flujo funciona así:

    1. El desarrollador describe el objetivo de la interfaz.
    2. SQUIRE genera la estructura base con huecos por completar.
    3. La IA propone múltiples alternativas para cada slot (por ejemplo, lista vs grid).
    4. El usuario selecciona opciones y ve cambios en tiempo real.

    Cuando el diseño está listo, SQUIRE lo convierte automáticamente en HTML, CSS y JavaScript mediante componentes Web.


    Adiós al ciclo infinito de re-prompts

    El mayor avance de SQUIRE está en cómo gestiona las modificaciones.

    Los desarrolladores pueden pedir cambios muy específicos, por ejemplo, ajustar la tipografía de un botón, y el sistema garantiza que solo ese elemento se modifica, sin romper el resto del layout.

    Este nivel de precisión elimina uno de los mayores dolores del desarrollo con IA, a saber la falta de previsibilidad de los resultados.


    Más creatividad gracias a una IA predecible

    Apple probó SQUIRE con 11 desarrolladores frontend que crearon páginas móviles usando la herramienta.

    Resultados clave:

    • Alta puntuación en usabilidad y satisfacción.
    • Mejores percepciones sobre la calidad del código generado.
    • Mayor disposición a experimentar y asumir riesgos creativos.

    Al tener control y seguridad para deshacer cambios, los desarrolladores se sintieron libres para explorar diseños que normalmente evitarían.


    ¿Llegará SQUIRE a Xcode?

    Por ahora, SQUIRE es un proyecto experimental. Apple no ha anunciado su lanzamiento público, pero el potencial es evidente.

    La investigación sugiere que combinar chat con límites explícitos y control granular podría ser el futuro del desarrollo de apps. No sería extraño ver esta filosofía integrada en futuras versiones de Xcode para iOS y macOS.

    Si esto ocurre, el prototipado de interfaces podría cambiar para siempre, con menos fricción, más creatividad y una colaboración real entre desarrollador y IA.

  • Google lleva la inteligencia artificial local al smartphone bajo la marca Google AI Edge

    Google está empezando a ver el valor de los modelos de IA locales bajo la marca Google AI Edge
    Google está empezando a ver el valor de los modelos de IA locales bajo la marca Google AI Edge

    Los LLMs locales cada vez tendrán más importancia

    La IA generativa está dejando de depender exclusivamente de gigantescos centros de datos. Google acaba de presentar dos nuevas apps bajo la marca AI Edge que muestran el futuro de la inteligencia artificial funcionando directamente en el dispositivo, sin necesitar una conexión a internet:

    Google AI Edge Gallery: un laboratorio para probar la IA local

    La nueva app Google AI Edge Gallery, recién lanzada para iPhone tras debutar en Android, funciona como un hub para descargar y ejecutar el modelo open-source Gemma 4 completamente en local.

    Aunque los modelos on-device tienen menos parámetros que los de la nube, sus capacidades avanzan rápido. Desde la app, los usuarios pueden:

    • Chatear con el modelo como si fuera un asistente.
    • Convertir audio a texto.
    • Probar funciones en modo “agente” como por ejemplo:
      • Encender la linterna
      • Programar eventos
      • Redactar correos mediante prompts, etc.

    Google también apunta a entusiastas y desarrolladores con opciones avanzadas:

    • Limitar generación de tokens.
    • Alternar procesamiento entre CPU y GPU.
    • Activar o desactivar el razonamiento del modelo.

    En otras palabras, se trata de un sandbox completo para experimentar con IA local.

    AI Edge Eloquent: dictado inteligente y privado

    La segunda app, Google AI Edge Eloquent, se centra en un caso práctico diario: convertir voz en texto perfectamente redactado.

    El flujo es simple:

    1. Hablas.
    2. La app transcribe en tiempo real.
    3. Elimina muletillas, errores y repeticiones.
    4. Copia el texto listo al portapapeles.

    Entre sus funciones destacan:

    • Conversión automática a viñetas o diferentes tonos.
    • Estadísticas como palabras por minuto.
    • Diccionario personalizado con nombres y jerga.
    • Modo 100% offline para máxima privacidad.

    Opcionalmente, puede integrarse con Gemini para pulir aún más el texto.

    La gran apuesta es la IA en el dispositivo

    El lanzamiento, especialmente en iOS, apunta a un cambio estratégico importante. Con futuras versiones de iOS integrando más IA, estas apps funcionan como adelanto de lo que viene.

    Usando frameworks como App Intents, una futura Siri podría estar impulsada por modelos de Gemini y controlar el smartphone mediante voz.

    El objetivo de mover la IA al “edge” (el dispositivo) es lograr:

    • Reducir la carga de los servidores.
    • Mejorar la privacidad.
    • Aumentar la velocidad y la integración.

    Con chips móviles cada vez más potentes, la IA local deja de ser experimental y empieza a perfilarse como el nuevo estándar para atender peticiones sencillas en el dispositivo.

  • Google refuerza los controles de salud mental en Gemini ante el creciente escrutinio gubernamental

    Google se preocupa por la salud mental de los usuarios de Gemini
    Google se preocupa por la salud mental de los usuarios de Gemini

    Google quiere evitar más demandas

    A medida que la inteligencia artificial se integra cada vez más en la vida diaria, Google anunció una profunda renovación de las protecciones de salud mental de su chatbot Gemini, junto con una inversión millonaria en apoyo global a líneas de crisis. El movimiento llega en un momento crítico, marcado por el creciente debate sobre los vínculos emocionales que los usuarios desarrollan con la IA generativa y una demanda.

    Google está bajo presión

    La noticia no sale de la nada. Toda la industria enfrenta presión regulatoria y demandas legales, incluida una demanda presentada por la familia de Jonathan Gavalas, quien se suicidó tras interactuar con Gemini en conversaciones que incluían role-play romántico y escenarios ficticios.

    El caso se suma a otras acciones legales contra OpenAI y Character.ai, además de una investigación de la Federal Trade Commission sobre chatbots “de compañía” que fomentan la intimidad emocional.

    Google afirma que el chatbot dejó claro que era IA y sugirió líneas de ayuda en repetidas ocasiones, aunque reconoció que estos escenarios siguen siendo extremadamente complejos y que los modelos “no son perfectos”.

    Acceso más rápido a ayuda humana

    El cambio más visible es un nuevo módulo llamado “Help is available” (ayuda disponible).

    Cuando Gemini detecta señales de crisis, autolesiones o riesgo suicida:

    • Aparece una interfaz simplificada diseñada por expertos clínicos.
    • El usuario puede llamar, enviar mensajes o chatear con un agente humano con un solo toque.
    • El acceso a ayuda profesional permanece visible durante toda la conversación.

    El objetivo es reducir fricción y facilitar el paso inmediato de la IA a apoyo humano real.

    Nuevos límites y protección de menores

    Google también ha rediseñado la forma en que Gemini responde a conversaciones emocionales complejas:

    • Prioriza fomentar la conexión con personas reales.
    • Evita validar conductas dañinas o delirios peligrosos.
    • Diferencia suavemente entre experiencias subjetivas y hechos objetivos.

    Además, introduce “persona protections” para evitar dependencia emocional, especialmente en menores:

    • El chatbot no puede afirmar ser humano.
    • No simula intimidad ni necesidades emocionales.
    • Incluye protecciones contra bullying y acoso.

    Inversión global en líneas de crisis

    Google reconoce que la IA no puede sustituir la atención clínica. Por ello, Google.org invertirá:

    • 30 millones de dólares en tres años para fortalecer líneas de crisis globales.
    • 4 millones de dólares adicionales para ReflexAI, que utiliza simulaciones con IA para entrenar personal y voluntarios.

    Gemini se integrará en estas simulaciones, mientras expertos técnicos de Google colaborarán con organizaciones como Educators Thriving y Erika’s Lighthouse.

    IA como puente, no reemplazo

    El mensaje central es que la IA puede ayudar a encontrar información y orientación, pero no reemplaza la terapia ni el apoyo profesional. Con estas mejoras, Google busca que la tecnología funcione como puente hacia la ayuda real y no como sustituto de la misma.