gadgetsgenial.es

Etiqueta: Claude

  • Filtración de Claude Code: cómo un simple error expuso la hoja de ruta secreta de Anthropic

    Hemos descubierto la hoja de ruta secreta de Anthropic y del próximo modelo avanzado Claude Mythos
    Hemos descubierto la hoja de ruta secreta de Anthropic y del próximo modelo avanzado Claude Mythos

    Un simple error

    Incluso las empresas más avanzadas de inteligencia artificial pueden caer por errores humanos básicos. Anthropic lo comprobó recientemente cuando un fallo de empaquetado dejó expuesto el código fuente completo de su herramienta para desarrolladores Claude Code.

    Aunque los modelos de IA no se vieron comprometidos, la filtración reveló detalles fascinantes sobre la hoja de ruta de la compañía para 2026, incluyendo agentes autónomos, una función de “sueño nocturno” y hasta una mascota virtual estilo Tamagotchi dentro del terminal.


    Cómo ocurrió la filtración

    El problema fue detectado por el investigador de seguridad Chaofan Shou y se debió a un error sorprendentemente común: dejar un archivo .map en una versión de producción.

    Cuando Anthropic publicó la versión 2.1.88 del paquete npm @anthropic-ai/claude-code, incluyó accidentalmente un archivo que apuntaba a un archivo ZIP con el código TypeScript original sin ofuscar alojado en Cloudflare R2.

    El resultado:

    • ~1,900 archivos TypeScript
    • Más de 512,000 líneas de código
    • Un archivo comprimido de menos de 10 MB

    Eso sí, los pesos del modelo Claude nunca estuvieron expuestos.

    Anthropic confirmó que fue un error de empaquetado y no una brecha de seguridad ni exposición de datos de usuarios.


    Lo que reveló la hoja de ruta secreta de 2026

    Al explorar el código, la comunidad descubrió múltiples proyectos en desarrollo:

    Project ULTRAPLAN

    Un sistema de tareas autónomas en segundo plano que permitirá a Claude trabajar hasta 30 minutos sin supervisión, generando planes de acción detallados para aprobación humana.

    Project KAIROS (Always-On)

    Claude evolucionaría hacia un agente persistente con memoria a largo plazo.

    Incluye una función sorprendente: “Nightly Dreaming”, donde la IA organiza y limpia sus registros mientras el usuario duerme.

    Coordinator Mode

    Claude podrá clonarse en múltiples sub-agentes que trabajarán en paralelo bajo la supervisión de un “Master Claude”.

    Un nuevo modelo secreto

    El código menciona un modelo interno en pruebas llamado Capybara.

    Telemetría de frustración

    La herramienta registrará señales de frustración del usuario, como insultos al terminal o repetición del comando “continue”. Como usuario de Claude, puedo anticipar que esa medición va a reportar resultados bastante altos…


    Project BUDDY: la mascota virtual en la terminal

    La sorpresa más curiosa del leak fue Project BUDDY, una mascota virtual integrada en la CLI.

    Características:

    • Se genera automáticamente al “nacer” según el ID del usuario
    • Puede adoptar 18 formas (pato, robot, fantasma, axolote, capibara…)
    • Tiene estadísticas propias de un RPG: paciencia, sabiduría y caos
    • Incluye accesorios raros y variantes “shiny” estilo Pokémon

    Inicialmente planeado como broma del April Fool’s, podría convertirse en una función permanente.


    Consecuencias y lecciones para la industria

    El código filtrado fue rápidamente archivado en GitHub y llegó a tener más de 41,500 forks antes de ser retirado por motivos legales.

    El incidente deja una lección clara para toda la industria: incluso los equipos más avanzados pueden fallar en sus pipelines de despliegue.

    Un simple error en .npmignore o package.json puede exponer proyectos completos.

    Para Anthropic, la sorpresa se perdió. Para los desarrolladores, fue una clase magistral sobre arquitectura CLI y sobre lo peligrosos que pueden ser los errores de empaquetado.

  • Anthropic mejora Claude con gráficos y diagramas interactivos dentro del chat, ¿mediante MCP Apps?

    ¿Empieza Anthropic a utilizar MCP Apps dentro de Claude?
    ¿Empieza Anthropic a utilizar MCP Apps dentro de Claude?

    La empresa de inteligencia artificial Anthropic está llevando su chatbot Claude a un nuevo nivel educativo y visual que podría estar basada en el estándar MCP Apps. En una actualización importante que ya comenzó a desplegarse, Claude ahora puede generar gráficos, diagramas y visualizaciones interactivas directamente dentro de una conversación, facilitando la explicación de conceptos complejos.

    La nueva función convierte el chat en una especie de pizarra digital, donde el modelo puede complementar sus respuestas con ayudas visuales dinámicas.


    Visuales generados automáticamente durante la conversación

    Con esta actualización, Claude puede crear distintos tipos de contenido visual para apoyar sus respuestas, como:

    • Gráficas
    • Diagramas explicativos
    • Tablas organizadas
    • Guías paso a paso con ilustraciones

    El sistema detecta automáticamente cuándo una visualización puede ayudar a explicar mejor un tema, generándola dentro de la conversación. No obstante, los usuarios también pueden solicitar explícitamente elementos visuales como un gráfico o un diagrama.

    Por ejemplo, si un usuario pregunta cómo hacer un avión de papel con el pliegue Nakamura lock, Claude puede mostrar una guía visual paso a paso junto con las instrucciones escritas.

    Un avance significativo, ¿mediante MCP Apps?

    Cuando surgieron los primeros chatbots estaban muy limitados porque solo permitían interactuar con el LLM (modelo grande de lenguaje) y no podían obtener información externa en tiempo real (la hora actual o información actualizada de una base de datos transaccional). Anthropic fue el primero en atacar este problema al crear el estándar MCP (Model Context Protocol) que marcó el inicio de la era de los agentes de IA.

    A pesar de que MCP supuso una verdadera revolución, la conversación seguía siendo totalmente textual. Fue entonces cuando algunos desarrolladores vieron la posibilidad de extender MCP para que los agentes no solo pudieran responder en formato de texto sino que pudieran producir fragmentos de HTML que pudieran contener imágenes, diagramas vectoriales (SVG) y contenido dinámico mediante el uso de JavaScript. Esta tecnologia inicialmente se conoció como MCP-UI y recientemente fue renombrada como MCP Apps.

    Con MCP Apps el potencial de los chatbots crece de forma exponencial. Por ejemplo, si hacemos una búsqueda de productos, podemos ver las fotos de los resultados y realizar la compra dentro del chatbot. Esto podría significar la muerte de los browsers tradicionales a mediano plazo.

    Aunque todo apunta a que esta nueva funcionalidad de Claude está basada en MCP Apps, Anthropic no lo confirma. Probablemente se deba a que el estándar aún no está finalizado.


    No es generación de imágenes tradicional

    Anthropic subraya que esta nueva función no utiliza generación de imágenes basada en píxeles, como ocurre con muchos generadores de arte por IA.

    En su lugar, Claude crea las visualizaciones mediante:

    • Código HTML
    • Gráficos vectoriales XML (SVG)

    Esto permite generar elementos interactivos y fácilmente modificables. Entre los ejemplos mostrados por la compañía se incluyen:

    • Un diagrama estructural que explica cómo se distribuye el peso en un edificio
    • Una tabla periódica interactiva donde cada elemento puede explorarse con un clic

    Diferencia con la función Artifacts

    La actualización también se distingue de otra herramienta existente de Claude llamada Artifacts.

    Artifacts permite crear documentos, gráficos o incluso pequeñas aplicaciones que aparecen en un panel lateral y pueden guardarse o compartirse.

    Las nuevas visualizaciones conversacionales, en cambio:

    • Aparecen directamente dentro del chat
    • Son temporales y dinámicas
    • Pueden modificarse en tiempo real según evoluciona la conversación

    Esto permite a los usuarios pedir cambios o ajustes instantáneos en los gráficos o diagramas.


    Parte de una tendencia más amplia en la IA

    La actualización llega en medio de una tendencia creciente en la industria para hacer que los asistentes de inteligencia artificial sean más visuales y educativos.

    Recientemente, OpenAI añadió a ChatGPT una función similar para generar visualizaciones interactivas en temas de matemáticas y ciencia. Por su parte, Google también ofrece generación visual interactiva en su asistente Google Gemini. Sin embargo, la implementación es muy diferente. El camino adoptado por Anthropic es mucho más prometedor.


    Disponibilidad de la nueva función

    Las visualizaciones conversacionales de Claude:

    • Están activadas por defecto
    • Se están desplegando para usuarios gratuitos y de pago
    • Actualmente están disponibles solo en la versión de escritorio

    Anthropic advierte que la función aún está en fase beta, por lo que los usuarios podrían encontrar algunos errores o comportamientos inesperados mientras el sistema continúa mejorando.

    MCP Apps es el futuro de la IA mediante el uso de agentes. Es una tecnologia que tiene el potencial de acabar con los browsers tal y como estábamos acostumbrados a usarlos en estos últimos 30 años.

    Con esta actualización, Claude refuerza su posición como una herramienta especialmente útil para educación, análisis de datos y explicación de conceptos complejos, combinando texto y visualización dentro de una misma conversación.

  • Anthropic lanza revisión de código con IA para resolver el cuello de botella del “vibe coding”

    Claude, el nombre del modelo de Anthropic
    Claude, el nombre del modelo de Anthropic

    El auge del llamado “vibe coding”, una forma de desarrollo en la que los programadores generan grandes cantidades de código mediante instrucciones en lenguaje natural, está transformando la ingeniería de software. Herramientas como Claude Code han acelerado enormemente la productividad, pero también han creado un nuevo problema: un enorme cuello de botella en la revisión de código.

    Para abordar este desafío, Anthropic ha presentado Code Review, un sistema basado en múltiples agentes de inteligencia artificial diseñado para analizar automáticamente pull requests antes de que se integren en un repositorio.


    Cómo funciona el sistema de revisión con múltiples agentes

    La nueva herramienta, actualmente en fase de research preview para usuarios de Claude en planes Teams y Enterprise, se integra directamente con GitHub.

    Cuando un desarrollador realiza un pull request, el sistema despliega varios agentes especializados de IA que analizan el código simultáneamente desde diferentes perspectivas.

    Cada agente se centra en aspectos específicos, como:

    • Lógica del código
    • Posibles errores
    • Riesgos de seguridad
    • Inconsistencias estructurales

    Posteriormente, un agente agregador recopila todos los resultados, elimina duplicados y prioriza los problemas detectados. El sistema añade comentarios directamente en el pull request, explicando:

    • ¿Cuál es el problema?
    • ¿Por qué puede causar fallos?
    • ¿Cómo solucionarlo paso a paso?

    Para evitar saturar a los desarrolladores, la herramienta ignora cuestiones subjetivas de estilo y se centra únicamente en problemas funcionales y relevantes.


    Sistema de severidad por colores

    Las incidencias detectadas se clasifican con un sistema de colores para facilitar su revisión:

    • Rojo: errores críticos de alta gravedad
    • Amarillo: posibles problemas que requieren revisión humana
    • Morado: problemas relacionados con código heredado o fallos históricos

    Además, la herramienta incluye funcionalidad básica de análisis de seguridad que puede adaptarse a las políticas internas de cada empresa. Para auditorías más profundas, Anthropic ofrece otra herramienta llamada Claude Code Security.


    Resultados internos prometedores

    Anthropic desarrolló este sistema tras experimentar el problema internamente. En el último año, la empresa observó un aumento del 200% en la cantidad de código generado por ingeniero gracias a las herramientas de IA.

    Las pruebas internas mostraron mejoras significativas:

    • Antes de Code Review, solo 16% de los pull requests recibían revisiones completas
    • Con la nueva herramienta, esa cifra subió a 54%

    El sistema es especialmente eficaz con pull requests muy grandes. En cambios de más de 1.000 líneas de código, el sistema detectó problemas en 84% de los casos, con un promedio de 7,5 incidencias por revisión.

    Según los ingenieros de la empresa, solo el 1% de los hallazgos resultó incorrecto.


    Pensado para grandes empresas

    Debido a la arquitectura multiagente, cada revisión consume una cantidad considerable de recursos de computación. En promedio, un análisis se ejecuta en unos 20 minutos y el coste se basa en tokens.

    El precio estimado se sitúa entre 15 y 25 dólares por revisión, lo que posiciona el producto principalmente para clientes corporativos.


    Un desafío pendiente para el código abierto

    El enfoque empresarial también plantea un problema para la comunidad de software de código abierto, donde muchos proyectos reciben cada vez más contribuciones generadas por IA.

    Aunque Anthropic ofrece una versión gratuita más simple como acción de GitHub, esta carece del análisis profundo y multiagente disponible en la versión comercial.


    Hacia un ciclo completo de desarrollo con IA

    El lanzamiento de Code Review responde a lo que Anthropic describe como una demanda masiva del mercado. A medida que las herramientas de IA facilitan crear nuevas funciones y escribir código rápidamente, la necesidad de revisiones rigurosas también aumenta.

    La empresa planea ampliar el sistema en los próximos meses con:

    • Integración con más plataformas de control de versiones
    • Análisis de seguridad más avanzado

    Al crear una herramienta que valida automáticamente el código generado por su propia IA, Anthropic está construyendo un ecosistema de desarrollo cerrado donde las empresas pueden desarrollar software más rápido y con menos errores.

  • Claude Sonnet 4.6 trae grandes mejoras, incluso sin pagar por el servicio

    El modelo intermedio de Anthropic mejora significativamente

    El pasado 5 de febrero, Anthropic anunció su modelo más avanzado, Claude Opus 4.6. El cambio respecto a la versión anterior, Opus 4.5, representó un cambio sustancial.

    Hoy le tocó la actualización a su modelo intermedio, Claude Sonnet 4.6, que promete capacidades mejoradas que pueden ser aplicadas a una gran variedad de tareas. Esta es la primera actualización del modelo Sonnet desde septiembre de 2025 y ya está causando sensación.

    Sonnet 4.6 cuenta, al igual que Opus 4.6 con una ventana de contexto de 1 millón de tokens, cinco veces mayor que la versión anterior, lo que permite lograr interacciones más complejas y matizadas. Los desarrolladores que han tenido acceso anticipado a Sonnet 4.6 han elogiado su capacidad de programación, revisión de código y corrección de errores, citando mejoras en la consistencia y el seguimiento de instrucciones.

    Más allá de la programación (el mercado que Anthropic ha logrado dominar), Sonnet 4.6 demuestra una marcada mejora en realizar tareas de forma automatizada en computadoras. Las tareas que anteriormente requerían un modelo de clase Opus, incluyendo el manejo de aplicaciones de oficina para resolver problemas reales, lo que genera un valor económico demostrable, ahora pueden ser realizadas de forma eficiente por Sonnet 4.6. Esto incluye tareas complejas como navegar por enormes hojas de cálculo o rellenar formularios web que constan de varios pasos, como lo haría un humano.

    Los beneficios de Sonnet 4.6 también van a llegar a los usuarios de Claude de nivel gratuito ya que por defecto, este nivel ahora utiliza Sonnet 4.6.

    Claude Sonnet 4.6 representa un importante paso adelante en las capacidades de la IA, a un precio razonable, al permitir que la IA avanzada pueda llegar a un público mayor y permita realizar nuevos tipos de tareas.

  • Anthropic se burla de los anuncios en ChatGPT con un anuncio del Super Bowl

    Logotipo de OpenAI
    Logotipo de OpenAI

    Anthropic se ríe abiertamente de OpenAI en un anuncio del Superbowl

    OpenAI reveló recientemente que pronto veremos anuncios en las conversaciones de ChatGPT, y Anthropic se está divirtiendo con esto, emitiendo un anuncio durante el Super Bowl en el que no se nombra a ChatGPT, aunque queda muy claro que esa es su intención.

    El CEO de OpenAI, Sam Altman, dijo una vez que insertar anuncios en las conversaciones de ChatGPT sería «el último recurso» (para incrementar los ingresos de la compañía), pero más recientemente confirmó que, de hecho, los anuncios están en camino, aunque no aparecerán dentro de las respuestas de ChatGPT.

    Anthropic ha aprovechado esta situación para anunciar hoy que no insertará anuncios en las conversaciones con Claude.

    “Incluir anuncios en las conversaciones con Claude sería incompatible con lo que queremos que sea Claude: un asistente genuinamente útil para el trabajo y el pensamiento profundo. Queremos que Claude actúe sin ambigüedades en interés de nuestros usuarios. Así que hemos tomado una decisión: Claude seguirá sin anuncios. Nuestros usuarios no verán enlaces patrocinados junto a sus conversaciones con Claude; ni las respuestas de Claude estarán influenciadas por anunciantes o incluirán colocaciones de productos de terceros que nuestros usuarios no hayan solicitado.”

    Anthropic afirma que existen varios peligros al incluir anuncios en las conversaciones de los chatbots, incluido el sesgo potencial y la incentivación de los chatbots para mantener a los usuarios en las conversaciones durante períodos más largos.

    “Consideremos un ejemplo concreto. Un usuario menciona que tiene problemas para dormir. Un asistente sin incentivos publicitarios exploraría las diversas causas potenciales (estrés, entorno, hábitos, etc.) en función de lo que pueda ser más perspicaz para el usuario. Un asistente con publicidad tiene una consideración adicional: si la conversación presenta una oportunidad para realizar una transacción […]”

    “Tales anuncios también introducirían un incentivo para optimizar el compromiso: la cantidad de tiempo que las personas pasan usando Claude y la frecuencia con la que regresan. Estas métricas no están necesariamente alineadas con ser genuinamente útil. La interacción de IA más útil podría ser una corta, o una que resuelva la solicitud del usuario sin provocar más conversación.”

    La compañía ha publicado hoy un video de un minuto en su canal de YouTube burlándose de la idea de los anuncios en los chatbots. The Wall Street Journal informa que una versión de 30 segundos de este anuncio se emitirá durante el Super Bowl del domingo.

    El anuncio parodia la perspectiva de la publicidad intrusiva en las conversaciones de IA. La versión de 30 segundos presenta a un joven en un parque intentando hacer ejercicio, y que le pregunta a un espectador musculoso cómo lograr abdominales marcados. El hombre comienza con una respuesta detallada, aunque algo robótica, como la que los usuarios podrían obtener de un chatbot de IA, antes de escupir un anuncio de las plantillas «StepBoost Max». Puedes ver la versión de un minuto a continuación. Es realmente divertida.