gadgetsgenial.es

Categoría: Gemini

Noticias relacionadas con la IA de Google

  • Gemini llega a la Mac con una nueva app nativa

    Gemini llega a la Mac con una app nativa programada en Swift para competir con Anthropic y OpenAI
    Gemini llega a la Mac con una app nativa programada en Swift para competir con Anthropic y OpenAI

    Mejor tarde que nunca

    Google por fin dió un paso importante para llevar su inteligencia artificial a más escritorios con el lanzamiento de la app nativa de Gemini para macOS. Con este movimiento, el servicio empareja su ofrecimiento a los de OpenAI y Anthropic.

    La nueva app está desarrollada completamente en Swift y diseñada específicamente para el ecosistema de Apple, lo que promete una experiencia mucho más fluida que la versión web.

    Acceso rápido y experiencia tipo Spotlight

    La app se integra profundamente con macOS. Puede invocarse desde cualquier lugar del sistema con atajos de teclado:

    • Option + Space abre una mini ventana flotante
    • Option + Shift + Space abre la experiencia completa

    Los usuarios pueden personalizar estos atajos, elegir cómo se abren nuevas conversaciones o acceder desde la barra de menú y el Dock.

    Asistencia contextual en tiempo real

    Una de las funciones más potentes es la capacidad de entender lo que el usuario está viendo en pantalla. Al otorgar permisos de accesibilidad, se puede usar Share Window (compartir ventana) para compartir contenido en tiempo real.

    Esto permite trabajar con archivos locales, código, páginas web completas o documentos de Google Drive. Con este contexto, Gemini puede resumir textos, redactar correos, ayudar a programar, analizar imágenes o servir como asistente creativo.

    También integra lectura por voz con múltiples opciones de voz.

    Creación multimedia con modelos generativos

    La app aprovecha modelos generativos de última generación para crear imágenes, video y música desde el escritorio. Entre ellos destacan Nano Banana para imágenes y Veo para generación de video.

    Competencia directa en el escritorio Mac

    Aunque la app representa un gran avance, la competencia sigue fuerte. ChatGPT y Claude mantienen ventaja en automatización con funciones que permiten ejecutar tareas directamente en el ordenador.

    Sin embargo, Google afirma que este lanzamiento es solo el comienzo de un asistente personal más proactivo y potente. Este movimiento resulta especialmente relevante ante la esperada renovación de Siri con IA generativa, que podría integrarse profundamente con macOS y presentarse en WWDC.

    Disponibilidad y precios

    La app Gemini para Mac ya está disponible globalmente en todos los países donde el servicio funciona. Requiere macOS 15 o superior.

    El uso básico es gratuito con límites. Para usuarios avanzados, Google ofrece planes de suscripción:

    • Google AI Plus por 7.99 dólares al mes
    • Google AI Pro por 19.99 dólares al mes
    • Google AI Ultra por 249.99 dólares al mes

    Con esta app, Google deja clara su apuesta por convertir la IA en una pieza central del escritorio moderno.

  • Google y Anthropic apuestan por la automatización

    Google y Anthropic buscan mejorar la productividad apostando por la automatización
    Google y Anthropic buscan mejorar la productividad apostando por la automatización

    Todos buscan mejorar la productividad

    La era de copiar y pegar prompts de IA sin parar está llegando a su fin. Google y Anthropic han presentado nuevas funciones diseñadas para fomentar la automatización, convirtiendo sus asistentes en motores de flujos de trabajo altamente personalizables.

    Ya sea navegando por la web o gestionando ciclos complejos de desarrollo de software, estas herramientas buscan eliminar tareas repetitivas y ahorrar tiempo.


    Gemini introduce “Skills” para la automatización de tareas diarias

    Para usuarios de escritorio, Google está lanzando Skills en Gemini dentro de Chrome. Esta función actúa como macros personalizadas de un solo clic para los prompts que usas con frecuencia.

    En lugar de buscar prompts antiguos en el historial, ahora puedes activar un Skill escribiendo “/” en la caja de Gemini. La macro se ejecutará sobre la página web actual o en varias pestañas seleccionadas mediante el botón “+”.

    Además, al finalizar una conversación, Gemini sugerirá guardar prompts exitosos como nuevos Skills, permitiendo asignarles nombre y emoji para identificarlos fácilmente.

    Google también ha lanzado una biblioteca de flujos de trabajo predefinidos donde los usuarios pueden explorar, guardar y editar Skills en categorías como aprendizaje, investigación, compras y redacción.

    Ejemplos de uso:

    • Salud y bienestar: calcular automáticamente macros de proteínas de cualquier receta online.
    • Compras: generar comparativas de especificaciones entre múltiples productos abiertos en pestañas.
    • Productividad: escanear documentos largos para extraer información clave o convertir datos complejos en infografías fáciles de entender.

    Para mayor seguridad, los Skills pedirán confirmación antes de ejecutar acciones sensibles, como enviar correos o crear eventos de calendario.

    Los Skills comienzan a desplegarse desde hoy en Gemini para Chrome en escritorio y se sincronizan automáticamente en todos los dispositivos con sesión iniciada.


    Anthropic lanza “Repeatable Routines” en Claude Code para la automatización de tareas

    Mientras Google mejora la experiencia web para consumidores, Anthropic apunta a la automatización del desarrollo de software con Repeatable Routines para Claude Code, disponible como vista previa de investigación.

    Hasta ahora, los desarrolladores debían gestionar cron jobs, infraestructura y herramientas adicionales como servidores MCP. Con las nuevas rutinas, ahora pueden empaquetar automatizaciones y programarlas para ejecutarse según horarios o eventos específicos.

    El aspecto más destacado es que estas rutinas se ejecutan completamente en la infraestructura web de Anthropic. Esto significa que tareas programadas, flujos de APIs complejos o automatizaciones de GitHub seguirán funcionando incluso si el equipo del usuario está offline.

    Las rutinas incluyen acceso integrado a repositorios y conectores, creando un entorno sin fricción para la automatización continua del desarrollo.

    Límites según suscripción:

    • Usuarios Pro: hasta 5 rutinas diarias
    • Usuarios Max: hasta 15 rutinas diarias
    • Team y Enterprise: hasta 25 rutinas diarias

    La próxima evolución de la IA

    El lanzamiento simultáneo de Gemini Skills y las rutinas de Claude Code confirma una tendencia de la IA está evolucionando de un asistente pasivo a un colaborador activo y personalizado.

    Al permitir crear, guardar y programar flujos de trabajo fácilmente, Google y Anthropic están eliminando fricciones y convirtiendo la inteligencia artificial en una parte invisible y automatizada de la vida digital diaria.

  • Google Gemini evoluciona con modelos 3D interactivos y simulaciones en tiempo real

    Google Gemini ahora puede ilustrar conceptos complejos mediante modelos 3D interactivos y simulaciones en tiempo real
    Google Gemini ahora puede ilustrar conceptos complejos mediante modelos 3D interactivos y simulaciones en tiempo real

    Google sigue la tendencia iniciada por OpenAI y Anthropic

    La inteligencia artificial está dejando atrás el texto y las imágenes estáticas. En una actualización importanteGoogle Gemini ahora puede generar modelos 3D interactivos y simulaciones funcionales directamente dentro del chat, cambiando la forma en que los usuarios exploran conceptos complejos.

    Hasta hace poco, pedir a un chatbot que explicara un tema difícil implicaba leer largos párrafos acompañados, quizá, por un diagrama estático. Ahora, Gemini ofrece visualizaciones dinámicas que pueden manipularse en tiempo real. Desde rotar una molécula compleja hasta experimentar con sistemas de física, basta un solo prompt para interactuar con el conocimiento.


    De diagramas a simulaciones manipulables

    Un ejemplo claro es la mecánica espacial. Si pides a Gemini simular la órbita de la Luna alrededor de la Tierra, no verás una ilustración plana, la IA genera un modelo 3D interactivo que puedes rotar, acercar y pausar para analizar cada detalle.

    Lo más llamativo es la posibilidad de modificar los datos que impulsan la simulación. Los usuarios pueden:

    • Ajustar la velocidad orbital con controles deslizantes
    • Activar o desactivar la trayectoria orbital
    • Introducir valores numéricos exactos para velocidad inicial y gravedad
    • Observar cómo estos cambios afectan la estabilidad del sistema en tiempo real

    Esto convierte la experiencia en una especie de laboratorio virtual dentro del navegador.


    La carrera por la IA interactiva se acelera

    La actualización llega en medio de una intensa competencia en la industria. En las últimas semanas, Anthropic añadió a Claude la capacidad de responder automáticamente con gráficos interactivos, mientras que OpenAI incorporó nuevas funciones en ChatGPT para crear visualizaciones de matemáticas y ciencia.

    Con la llegada de simulaciones 3D en tiempo real, Google refuerza la posición de Gemini en esta nueva etapa de la IA interactiva.


    Cómo probar las simulaciones 3D de Gemini

    La función ya se está desplegando globalmente para los usuarios de la app de Gemini. Para probarla:

    1. Entra a gemini.google.com
    2. Asegúrate de tener seleccionado el modelo Pro en la barra de prompt
    3. Pide una visualización con frases como:
      • “Show me a double pendulum”
      • “Help me visualize the Doppler Effect”
    4. Haz clic en “Show me the visualization” debajo de la respuesta para comenzar a interactuar.

    Desafortunadamente, esto no parece funcionar aún si la pregunta se formula en español, por lo que parece que el sistema aún está bastante alambrado, al igual que el de ChatGPT, que solo soporta un número determinado de visualizaciones. El verdadero adelanto se verá cuando esto sea mucho más orgánico y producto realmente de la IA.

  • Google integra NotebookLM en Gemini para simplificar la gestión de proyectos con IA

    La gestión de proyectos por fin llega a Gemini
    La gestión de proyectos por fin llega a Gemini

    Google acorta distancias con la competencia

    A medida que dependemos cada vez más de la inteligencia artificial para proyectos complejos, desde estudiar para un examen hasta investigar oportunidades de negocios, organizar chats, archivos y fuentes se ha convertido en un gran desafío. Durante mucho tiempo, los usuarios de Google Gemini pedían una función de gestión de proyectos similar a las herramientas disponibles en otras plataformas.

    Ahora, Google responde integrando su potente herramienta de investigación con IA, NotebookLM, directamente dentro de Gemini.

    Google describe esta novedad como la creación de un auténtico “segundo cerebro”, que introduce los notebooks(cuadernos) en Gemini para organizar ideas, archivos y conversaciones en un solo lugar.


    Cómo funcionan los notebooks en Gemini

    Empezar a usar los notebooks es sencillo ya basta con hacer clic en “New notebook” en el panel lateral de Gemini. Desde ahí, el chatbot se transforma en una base de conocimiento personalizada.

    Cada notebook permite:

    • Subir hasta 100 fuentes seleccionadas
    • Añadir PDFs, documentos de texto, URLs, videos de YouTube y texto copiado
    • Definir instrucciones globales para el proyecto (rol de la IA, tono y reglas)

    Esto permite adaptar Gemini en un asistente especializado para cada proyecto.


    Sinergia total entre Gemini y NotebookLM

    La app independiente de NotebookLM no desaparece. En su lugar, ambas plataformas ahora funcionan en tandem con una sincronización bidireccional automática.

    Todo lo que agregues en Gemini aparecerá en NotebookLM y viceversa, lo que permite aprovechar las fortalezas de cada herramienta sin duplicar trabajo.

    Ejemplo práctico:

    1. Un estudiante sube apuntes y videos a un notebook en Gemini.
    2. Abre ese mismo notebook en NotebookLM para crear:
      • Un resumen en formato podcast (Audio Overview)
      • Mapas mentales
      • Infografías
    3. Regresa a Gemini para generar un ensayo usando las mismas fuentes.

    El resultado es un flujo de trabajo de IA mucho más integrado y eficiente.


    Disponibilidad y lanzamiento

    La función de notebooks comienza a desplegarse esta semana para usuarios de:

    • Google AI Ultra
    • Google AI Pro
    • Google AI Plus

    Inicialmente estará disponible en la versión web. El acceso móvil y para usuarios gratuitos llegará en las próximas semanas.

    El lanzamiento en Europa se retrasará ligeramente para cumplir con regulaciones locales.


    La integración entre Gemini y NotebookLM marca un gran paso hacia la productividad con IA, transformando al asistente en una herramienta capaz de organizar y potenciar cualquier proyecto a largo plazo.

  • Google refuerza los controles de salud mental en Gemini ante el creciente escrutinio gubernamental

    Google se preocupa por la salud mental de los usuarios de Gemini
    Google se preocupa por la salud mental de los usuarios de Gemini

    Google quiere evitar más demandas

    A medida que la inteligencia artificial se integra cada vez más en la vida diaria, Google anunció una profunda renovación de las protecciones de salud mental de su chatbot Gemini, junto con una inversión millonaria en apoyo global a líneas de crisis. El movimiento llega en un momento crítico, marcado por el creciente debate sobre los vínculos emocionales que los usuarios desarrollan con la IA generativa y una demanda.

    Google está bajo presión

    La noticia no sale de la nada. Toda la industria enfrenta presión regulatoria y demandas legales, incluida una demanda presentada por la familia de Jonathan Gavalas, quien se suicidó tras interactuar con Gemini en conversaciones que incluían role-play romántico y escenarios ficticios.

    El caso se suma a otras acciones legales contra OpenAI y Character.ai, además de una investigación de la Federal Trade Commission sobre chatbots “de compañía” que fomentan la intimidad emocional.

    Google afirma que el chatbot dejó claro que era IA y sugirió líneas de ayuda en repetidas ocasiones, aunque reconoció que estos escenarios siguen siendo extremadamente complejos y que los modelos “no son perfectos”.

    Acceso más rápido a ayuda humana

    El cambio más visible es un nuevo módulo llamado “Help is available” (ayuda disponible).

    Cuando Gemini detecta señales de crisis, autolesiones o riesgo suicida:

    • Aparece una interfaz simplificada diseñada por expertos clínicos.
    • El usuario puede llamar, enviar mensajes o chatear con un agente humano con un solo toque.
    • El acceso a ayuda profesional permanece visible durante toda la conversación.

    El objetivo es reducir fricción y facilitar el paso inmediato de la IA a apoyo humano real.

    Nuevos límites y protección de menores

    Google también ha rediseñado la forma en que Gemini responde a conversaciones emocionales complejas:

    • Prioriza fomentar la conexión con personas reales.
    • Evita validar conductas dañinas o delirios peligrosos.
    • Diferencia suavemente entre experiencias subjetivas y hechos objetivos.

    Además, introduce “persona protections” para evitar dependencia emocional, especialmente en menores:

    • El chatbot no puede afirmar ser humano.
    • No simula intimidad ni necesidades emocionales.
    • Incluye protecciones contra bullying y acoso.

    Inversión global en líneas de crisis

    Google reconoce que la IA no puede sustituir la atención clínica. Por ello, Google.org invertirá:

    • 30 millones de dólares en tres años para fortalecer líneas de crisis globales.
    • 4 millones de dólares adicionales para ReflexAI, que utiliza simulaciones con IA para entrenar personal y voluntarios.

    Gemini se integrará en estas simulaciones, mientras expertos técnicos de Google colaborarán con organizaciones como Educators Thriving y Erika’s Lighthouse.

    IA como puente, no reemplazo

    El mensaje central es que la IA puede ayudar a encontrar información y orientación, pero no reemplaza la terapia ni el apoyo profesional. Con estas mejoras, Google busca que la tecnología funcione como puente hacia la ayuda real y no como sustituto de la misma.

  • Google presenta Gemma 4, su nueva familia de modelos de IA abiertos, basados en Gemini 3

    Google presenta la familia de modelos Gemma 4, para la IA local
    Google presenta la familia de modelos Gemma 4, para la IA local

    Son los más potentes hasta ahora y se pueden usar localmente

    GoogleTras el salto tecnológico logrado con Gemini 3 Pro el año pasado, Google lleva ahora parte de esa investigación a la comunidad open-source con el lanzamiento de Gemma 4, su nueva familia de modelos open-weight más inteligente hasta la fecha.

    Diseñados para razonamiento avanzado y flujos de trabajo agenticos, los nuevos modelos prometen una relación inédita de inteligencia por parámetro, ofreciendo capacidades de nivel frontera sin requerir hardware masivo.

    Las generaciones anteriores ya habían superado los 400 millones de descargas y generado más de 100,000 variantes, y Gemma 4 busca ampliar ese ecosistema con herramientas aún más potentes para los desarrolladores.


    Una familia versátil, del smartphone a la nube

    Para adaptarse a distintos dispositivos y casos de uso, Gemma 4 llega en cuatro tamaños. En IA, los parámetros son los ajustes internos que determinan cómo el modelo genera resultados: más parámetros suelen implicar mayor calidad, pero también mayor demanda computacional.

    Modelos para el edge: E2B y E4B

    Pensados para móviles y dispositivos IoT, los modelos de 2B y 4B parámetros efectivos priorizan:

    • Baja latencia
    • Uso mínimo de RAM
    • Ahorro de batería

    Desarrollados junto a Qualcomm, MediaTek y el equipo de Pixel de Google, estos modelos pueden ejecutarse completamente offline en smartphones o incluso en las Raspberry Pi.

    Modelos para estaciones de trabajo y la nube: 26B MoE y 31B Dense

    Para cargas de trabajo más exigentes:

    • Los pesos sin cuantizar caben en una sola GPU NVIDIA H100 de 80 GB.
    • Las versiones cuantizadas pueden ejecutarse en GPUs gaming.

    El modelo 26B Mixture of Experts (MoE) prioriza velocidad activando solo 3.8B parámetros durante inferencia.
    El 31B Dense se enfoca en calidad máxima para fine-tuning.

    En el ranking de texto de Arena AI, ambas variantes alcanzaron los puestos #3 y #6 entre modelos abiertos, superando sistemas hasta 20 veces más grandes.


    Capacidades de nueva generación

    Gemma 4 va mucho más allá del chat tradicional con funciones diseñadas para aplicaciones reales:

    • Multimodal nativo: procesan video, imágenes, OCR y gráficos; los modelos edge incluyen entrada de audio.
    • Workflows agenticos: soporte para function-calling, JSON estructurado e instrucciones del sistema.
    • Generación de código offline: permite crear software sin conexión.
    • Contexto masivo: hasta 128K tokens en edge y 256K en modelos grandes.
    • Cobertura global: entrenamiento en más de 140 idiomas.

    El gran cambio: licencia Apache 2.0

    Uno de los anuncios más importantes es la adopción de la licencia Apache 2.0, mucho más permisiva que las licencias previas de la familia Gemma.

    El movimiento responde al feedback de la comunidad y elimina barreras para uso comercial. El CEO de Hugging Face, Clément Delangue, calificó la decisión como un “gran hito” para el open-source.


    Un ecosistema listo desde el día uno

    Gemma 4 llega con soporte inmediato para herramientas populares como Hugging Face, LiteRT-LM, vLLM, Ollama y Google Cloud.

    Los desarrolladores pueden descargar los pesos desde Hugging Face, Kaggle u Ollama y experimentar en Google AI Studio o desplegar a escala con Vertex AI, Cloud Run y TPUs.

    Con Gemma 4, Google no solo ofrece una versión abierta de su IA avanzada: pone en manos de la comunidad una plataforma eficiente y poderosa para impulsar la próxima generación de aplicaciones inteligentes.

    ¿Cómo usar estos modelos de forma local?

    Ollama, para mí es la solución más sencilla para poder correr modelos abiertos de forma local y está disponible para macOS, Windows y Linux.

    Aunque Ollama tiene una interfaz gráfica que recuerda mucho a la de ChatGPT, muchas operaciones se deben hacer desde la línea de comando. Por ejemplo, bajar un nuevo modelo o actualizar un modelo, son tareas que se deben hacer desde la terminal.

    Por eso, les recomiendo que utilicen un front-end gráfico para Ollama. Existen muchos, tanto para macOS como para Windows y Linux.

    En el caso particular de macOS, una excelente opción para este tipo de tareas ya que los procesadores de Apple están especialmente diseñados para ellas, les recomiendo usar mi programa LocalIntelligence que no solo es un front-end gráfico para esa aplicación, sino que además incluye funcionalidad avanzada para ajustar los parámetros del modelo y soporte completo para MCP (Model Context Protocol), que es el protocolo en el que se basa la IA basa en agentes.

    LocalIntelligence está disponible de forma gratuita en la App Store de Apple. Sin embargo, si van a usar un servidor MCP local, necesitarán bajar la versión notariada de mi página web personal, ya que esto requiere permisos adicionales que las aplicaciones del App Store no pueden obtener.

  • Apple abrirá Siri a chatbots de IA rivales en iOS 27

    Apple abrirá Siri a chatbots de IA rivales en iOS 27
    Apple abrirá Siri a chatbots de IA rivales en iOS 27

    El fin de la exclusividad de ChatGPT

    Según Marc Gurman, de Bloomberg, Apple prepara uno de los cambios más importantes en la historia de Siri. Durante la Worldwide Developers Conference(WWDC) del 8 de junio de 2026, la compañía presentaría iOS 27, una actualización que permitirá integrar chatbots de IA de terceros directamente con el asistente.

    Este movimiento marcaría el fin de la exclusividad de ChatGPT dentro del ecosistema Apple y abriría la puerta a una nueva era de inteligencia artificial en iPhone, iPad y Mac.


    Siri será compatible con múltiples IA

    Desde la llegada de Apple Intelligence en iOS 18, OpenAI disfrutaba de una integración exclusiva de ChatGPT con Siri para resolver consultas complejas.

    Sin embargo, reportes recientes indican que Apple abandonará este modelo cerrado para adoptar un enfoque más abierto. Con iOS 27, los usuarios podrán conectar Siri con múltiples servicios de IA, entre ellos:

    El objetivo es crear un ecosistema competitivo donde el usuario elija qué IA usar según sus necesidades.


    Así funcionará el nuevo sistema “Extensions”

    Apple implementará un nuevo sistema basado en APIs llamado Extensions, disponible en:

    • iOS 27
    • iPadOS 27
    • macOS 27

    Si el usuario tiene instalada una app de IA compatible, podrá asignarla a tareas específicas dentro de Siri. Por ejemplo:

    • Usar Claude para programación
    • Usar otra IA para búsquedas web
    • Combinar varios asistentes según el tipo de consulta

    Todo se gestionará desde un nuevo menú en Configuración dentro de Apple Intelligence y Siri. Desde ahí, Apple ofrecerá enlaces directos a la App Store para descargar chatbots compatibles.

    Este cambio también abre una nueva fuente de ingresos para Apple mediante suscripciones de IA dentro de la App Store.


    El fin de la exclusividad con OpenAI

    El nuevo modelo pone fin a la relación exclusiva entre Apple y OpenAI.

    Este cambio también llega tras la presión del sector. La startup xAI de Elon Musk incluso presentó una demanda contra Apple y OpenAI, acusándolos de intentar dominar el mercado de IA.

    Con iOS 27, Apple permitirá que cualquier desarrollador integre su chatbot con Siri, siempre que cumpla con las nuevas APIs.


    La estrategia doble de Apple en inteligencia artificial

    Abrir Siri no significa que Apple abandone su propia IA.

    Los dispositivos seguirán usando modelos propios como sistema predeterminado mediante:

    • Procesamiento en el dispositivo
    • Private Cloud Compute para privacidad

    Además, Apple mantiene una relación estratégica con Google. Aunque Gemini podrá integrarse como app externa, Apple también usaría versiones optimizadas de sus modelos para mejorar sus propios sistemas de Apple Intelligence.

    Entre las funciones futuras se esperan:

    • Mayor control dentro de apps
    • Capacidades avanzadas de “Personal Intelligence”
    • Una posible app independiente de Siri con interfaz tipo chatbot

    Un despliegue gradual

    Apple ya comenzó este camino con iOS 26.4, que abrió CarPlay a chatbots de terceros.

    La estrategia de iOS 27 muestra el nuevo enfoque de Apple, mantener el control del ecosistema mientras permite a los usuarios elegir las mejores herramientas de IA disponibles.

    La guerra de los asistentes inteligentes en el iPhone acaba de comenzar.

  • Google lanza Lyria 3 Pro, para generar canciones

    Lyria 3 Pro de Google ahora crea canciones completas de hasta 3 minutos
    Lyria 3 Pro de Google ahora crea canciones completas de hasta 3 minutos

    Ahora crea canciones completas de hasta 3 minutos

    Google sigue avanzando en su apuesta por convertirse en el líder absoluto en inteligencia artificial con el lanzamiento de Lyria 3 Pro, una nueva versión de su modelo de generación musical capaz de crear canciones completas de hasta tres minutos. Esto representa un salto significativo frente al límite anterior de solo 30 segundos.

    Pero la mejora no se limita a la duración. La compañía también ha introducido controles mucho más precisos, colocándose al nivel de herramientas como Suno y Udio. Ahora, los usuarios pueden definir la estructura completa de una canción, indicando dónde deben ir las intros, versos, coros o puentes.


    Mayor control creativo con IA

    Según Google, Lyria 3 Pro tiene una comprensión más avanzada de la composición musical, lo que permite experimentar con transiciones complejas y arreglos más sofisticados.

    Los usuarios pueden generar música describiendo:

    • Estado de ánimo
    • Estilo musical
    • Instrumentación específica

    Además, la IA puede crear letras a partir de texto, imágenes o incluso videos, ampliando significativamente las posibilidades creativas.


    Integración total en el ecosistema de Google

    En lugar de lanzar una app independiente, Google está integrando esta tecnología en sus plataformas existentes:

    • Usuarios de Gemini ya pueden generar canciones directamente en el chatbot
    • Empresas pueden acceder vía Vertex AI
    • Los desarrolladores pueden hacerlo a través de Google AI Studio y la API de Gemini
    • Integración en Google Vids para creación de contenido audiovisual

    También destaca su llegada a ProducerAI, una plataforma adquirida recientemente que compite directamente con Suno.


    Derechos de autor bajo la lupa

    El avance tecnológico también reaviva preocupaciones sobre copyright y suplantación de artistas. Ante esto, Google asegura que el modelo fue entrenado únicamente con contenido sobre el que tiene derechos.

    Además:

    • No permite imitar artistas específicos
    • Interpreta nombres como referencia estilística general
    • Verifica coincidencias con contenido existente
    • Incluye marcas de agua invisibles mediante SynthID para identificar contenido generado por IA

    Un mercado saturado de música generada por IA

    El lanzamiento llega en un contexto complejo. Plataformas como Spotify ya enfrentan una avalancha de contenido sintético. Se estima que alrededor de 50,000 canciones generadas por IA se suben diariamente, lo que llevó a eliminar cerca de 75 millones de pistas el año pasado.

    Con Lyria 3 Pro facilitando aún más la creación de canciones completas, la industria musical podría enfrentarse a una nueva ola masiva de contenido automatizado.


    ¿Innovación o saturación?

    Aunque los avances de Google son impresionantes, queda abierta la pregunta clave: ¿realmente necesitamos más generadores de música con IA?

    Con la barrera de entrada cada vez más baja, la creatividad digital vive un auge sin precedentes, pero también un riesgo creciente de saturación. El impacto de herramientas como Lyria 3 Pro podría redefinir no solo cómo se produce la música, sino también cómo se consume en la era de la inteligencia artificial.

  • Apple miniaturiza Gemini, destilando el modelo de Google

    Apple crea la nueva generación de IA en el iPhone, destilando el modelo Gemini
    Apple crea la nueva generación de IA en el iPhone, destilando el modelo Gemini

    Así busca Apple impulsar la nueva generación de IA en el iPhone

    Apple está preparando un salto clave en inteligencia artificial, y lo hará con ayuda de su rival directo, Google. Gracias a un acuerdo estratégico, la compañía ha obtenido acceso avanzado al modelo Gemini, pero en lugar de usarlo tal cual, está aplicando una técnica innovadora para adaptarlo a sus dispositivos.


    La clave: “destilación” de modelos de IA

    Apple está utilizando un método llamado distillation (destilación) para transformar el potente modelo de Gemini en versiones más pequeñas y eficientes.

    El proceso funciona así:

    • Gemini actúa como “maestro”
    • Los modelos de Apple aprenden su lógica y razonamiento
    • Se crean versiones reducidas especializadas

    El resultado son modelos más ligeros que conservan gran parte de la precisión del original, pero consumen muchos menos recursos.


    IA en el dispositivo, una solución más rápida y privada

    El objetivo de Apple es llevar la inteligencia artificial directamente al iPhone.

    Gracias a estos modelos “mini”:

    • Las funciones de IA se ejecutan sin conexión a internet
    • Las respuestas son más rápidas
    • Se reducen costos de procesamiento
    • Se refuerza la privacidad (los datos no salen del dispositivo)

    Esto encaja con la estrategia de Apple Intelligence, centrada en procesamiento local, algo que es posible gracias a los procesadores de Apple.


    Una Siri completamente nueva

    Estos avances serán fundamentales para la próxima evolución de Siri, que llegará con iOS 27.

    La nueva versión permitirá:

    • Resumir documentos
    • Responder preguntas complejas
    • Ejecutar tareas entre apps
    • Generar contenido
    • Interactuar de forma conversacional

    En esencia, Siri pasará de asistente básico a un verdadero chatbot avanzado.


    Ajustando Gemini al ecosistema Apple

    El proceso no ha sido automático.

    Dado que Gemini fue entrenado principalmente para programación y uso general, Apple ha tenido que:

    • Ajustar respuestas
    • Adaptar el modelo a su ecosistema
    • Optimizarlo para experiencias móviles

    El trabajo está liderado por el equipo interno de modelos fundacionales de Apple.


    Una estrategia clara con menos nube y más procesamiento local

    A diferencia de otras compañías, Apple no busca competir directamente con modelos gigantes en la nube.

    Su enfoque es híbrido:

    • Modelos pequeños en el dispositivo (uso diario)
    • Gemini completo para tareas más pesadas

    Esto permite equilibrar rendimiento, privacidad y capacidad.


    El futuro de la IA en el iPhone

    La apuesta de Apple redefine cómo se implementa la inteligencia artificial en dispositivos móviles.

    En lugar de depender totalmente de servidores, la compañía está construyendo un ecosistema donde la IA vive en el bolsillo del usuario.

    Si esta estrategia funciona, el iPhone podría convertirse en uno de los dispositivos más avanzados en IA, sin comprometer privacidad ni velocidad.

  • Google prepara una app nativa de Gemini para Mac

    Google prepara una app nativa de Gemini para Mac
    Google prepara una app nativa de Gemini para Mac

    Un competidor directo de ChatGPT y Claude

    Google está a punto de dar un paso clave en la carrera de la inteligencia artificial con el desarrollo de una aplicación nativa de Gemini para macOS. Hasta ahora, los usuarios de Mac dependían del navegador para acceder a esta herramienta, pero eso cambiará pronto.

    Gemini llega como app nativa a macOS

    Según reportes recientes, Google ya está probando una versión beta de Gemini para Mac con un grupo reducido de usuarios externos. Se trata de una versión preliminar, enfocada en recopilar feedback antes de su lanzamiento oficial.

    Aunque aún es una versión incompleta, la app ya incluye funcionalidades importantes:

    • Búsquedas web integradas
    • Historial de conversaciones
    • Subida y análisis de documentos
    • Resolución de problemas complejos (incluyendo matemáticas)
    • Generación de contenido: texto, código, imágenes, tablas, gráficos, video y música

    La interfaz sigue la línea de las apps de Gemini en iPhone y iPad, ofreciendo una experiencia familiar dentro del ecosistema de Google.

    “Desktop Intelligence”: IA que ve tu pantalla

    La función más innovadora es “Desktop Intelligence”, una capacidad que permitirá a Gemini acceder al contexto de lo que ocurre en la pantalla del usuario.

    Esto significa que la IA podrá:

    • Analizar contenido visible en tiempo real
    • Extraer información de otras aplicaciones
    • Personalizar respuestas según el contexto

    Este enfoque ya lo hemos visto en soluciones como ChatGPT para Mac o Claude Cowork, pero su llegada a Gemini marca un salto importante en la integración de IA con el sistema operativo.

    Aunque no está confirmado si podrá ejecutar acciones dentro de otras apps, sí abre la puerta a integraciones con herramientas nativas de macOS como Calendario, Recordatorios o Fotos.

    Google vs Apple: una relación en evolución

    El lanzamiento de una app nativa de Gemini también refleja un cambio en la relación entre Google y Apple.

    Apple ha estado presionando para que Google participe más activamente en su ecosistema. Ejemplos recientes incluyen:

    • La app nativa de YouTube para Apple Vision Pro
    • La futura integración de Gemini en Apple Intelligence

    Aunque es lógico que Apple siempre quiere más aplicaciones para sus plataformas, hay que reconocer que Google ha sido un buen socio. Por ejemplo, Google liberó la aplicación Antigravity para desarrollar aplicaciones con la ayuda de la IA el mismo día que lo hizo para Windows y para Linux.

    También es importante destacar que esta app de Gemini será independiente del acuerdo entre ambas compañías para integrar modelos de IA en productos de Apple.

    Gemini podría llegar antes de lo esperado

    A diferencia de la integración profunda con Apple Intelligence, que depende de futuros desarrollos, la app de Gemini podría lanzarse mucho antes, sobre todo teniendo en cuenta que podría reutilizar parte del código de las apps para iPad e iPhone.

    El hecho de que ya esté en pruebas con usuarios externos sugiere que su lanzamiento público podría ser inminente.

    Un paso clave en la guerra de la IA

    Con esta nueva aplicación, Google entra de lleno en la competencia de apps de escritorio de IA, enfrentándose directamente a ChatGPT de OpenAI y Claude de Anthropic.

    Para los usuarios de Mac, esto supone el fin de una limitación importante: pronto podrán acceder a Gemini de forma nativa, más rápida y mejor integrada en su flujo de trabajo diario.

    La batalla por dominar la inteligencia artificial en el escritorio acaba de intensificarse.