gadgetsgenial.es

Etiqueta: DeepSeek

  • DeepSeek V4 desafía el dominio de Silicon Valley

    DeepSeek
    DeepSeek

    La guerra de precios de la IA se intensifica

    Poco más de un año después de que su modelo R1 sacudiera la industria y liderara el ranking de la App Store de EE. UU., el laboratorio chino DeepSeek vuelve a la carga con DeepSeek-V4-Preview, una nueva generación de modelos open-weight que promete competir directamente con los sistemas cerrados de gigantes como OpenAIAnthropic y Google, pero a una fracción del costo.

    El anuncio llegó apenas horas después del lanzamiento de GPT-5.5, acompañado de un mensaje contundente: “Bienvenidos a la era del contexto de 1 millón de tokens rentable.”


    Dos modelos con una ventana de contexto gigantesca

    La familia V4 incluye dos modelos basados en arquitectura Mixture of Experts (MoE), entrenados con 32 billones de tokens y con una ventana de contexto de 1 millón de tokens, diseñada para conversaciones largas y tareas complejas.

    DeepSeek-V4-Pro: el buque insignia

    • 1.6 billones de parámetros totales
    • Solo 49 mil millones activos por consulta (eficiencia MoE)
    • Rendimiento comparable con modelos top como:
      • Claude Opus 4.6-Max
      • GPT-5.4-xHigh
      • Gemini-3.1-Pro

    Destaca especialmente en programación y tareas autónomas, con puntuaciones líderes en SWE-Verified y Codeforces.

    DeepSeek-V4-Flash: la versión ligera

    • 284 mil millones de parámetros totales
    • 13 mil millones activos
    • Diseñado para ejecución local y respuestas ultrarrápidas

    Ambos modelos incluyen un modo gratuito “Think Max”, que fuerza el razonamiento profundo para problemas complejos.


    DeepSeek V4 rompela barrera del costo

    La gran apuesta de DeepSeek es el precio:

    DeepSeek-V4-Pro

    • $1.74 / millón tokens de entrada
    • $3.48 / millón tokens de salida

    Esto lo vuelve:

    • ~7× más barato que Claude Opus 4.7
    • ~8× más barato que GPT-5.5

    DeepSeek-V4-Flash

    • $0.14 entrada
    • $0.28 salida

    Esto significa que es hasta 100× más barato que GPT-5.5 en salida.

    Además, mantiene tarifas bajas incluso con el contexto de 1 millón de tokens, evitando las subidas drásticas de precio que aplican otros modelos tras cierto límite.

    La eficiencia se logra con:

    • Compressed Sparse Attention (CSA)
    • Heavily Compressed Attention (HCA)
    • Solo 27 % del cómputo y 10 % de caché frente a V3.2
    • Nuevo optimizador Muon en lugar de AdamW

    Diseñado para la era de los agentes

    DeepSeek posiciona V4 como el motor ideal para agentes autónomos, especialmente en entornos donde la IA interactúa directamente con computadoras y código.

    Al ser un modelo open-weight busca atraer a desarrolladores frustrados por las restricciones recientes de plataformas cerradas.


    Tensiones geopolíticas y controversias

    El avance tecnológico también llega acompañado de polémica:

    • Prohibido en agencias federales de EE. UU. por seguridad nacional
    • Corea del Sur pausó descargas por preocupaciones de privacidad
    • Funcionarios estadounidenses acusan a DeepSeek de usar chips Nvidia restringidos
    • Anthropic ha alegado uso indebido de datos de Claude

    DeepSeek no ha revelado los costos de entrenamiento ni su infraestructura.


    Un competidor que redefine el mercado

    Pese a las controversias, DeepSeek-V4 demuestra que el laboratorio chino llegó para quedarse. Con rendimiento de primer nivel, una filosofía abierta y precios agresivos, la compañía no solo compite en la carrera global de IA, sino que una vez más ha cambiado las reglas del juego.

  • Anthropic asegura que DeepSeek y otras empresas chinas aprovechan el poder de Claude para entrenar su IA

    Claude
    Anthropic se queja del robo de IA

    El gran robo de la Inteligencia Artificial: Anthropic acusa a DeepSeek y rivales chinos de copiar el talento de Claude

    La empresa ha levantado la voz de alarma ante las «campañas a escala industrial» de sus competidores extranjeros. Estos buscan recolectar ilícitamente su brillante tecnología de inteligencia artificial. Anthropic, creador del popular chatbot Claude ha acusado formalmente a tres grandes firmas chinas de IA. Hablamos de DeepSeek, Moonshot y MiniMax. Anthropic afirma que estas empresas ejecutan ataques masivos de «destilación». El objetivo es acelerar el desarrollo de sus propios modelos.

    En el sector de la IA, la destilación es un proceso fascinante. Los desarrolladores entrenan un modelo más pequeño usando los resultados de un sistema más avanzado.

    Anthropic reconoce la validez de este método de entrenamiento. Sin embargo, los portavoces de la empresa afirman con firmeza que sus rivales usan esta técnica como un atajo injusto. Así adquieren capacidades poderosas en un tiempo récord. Además, así logran reducir drásticamente el enorme coste del desarrollo desde cero.

    Las investigaciones de Anthropic revelan datos sorprendentes. Los tres laboratorios chinos crearon unas 24.000 cuentas fraudulentas. Luego, orquestaron más de 16 millones de llamadas a Claude (probablemente a través del API). Anthropic vincula estas campañas con empresas específicas con «un alto nivel de confianza». Para ello, sus expertos correlacionaron direcciones IP y analizaron metadatos. También usaron modernos indicadores de infraestructura. Además, otros líderes de la industria aportaron pruebas para confirmar estos mismos comportamientos.

    Un poco de historia

    DeepSeek revolucionó recientemente la industria tecnológica. Sus desarrolladores lanzaron modelos altamente eficientes y sorprendentemente poderosos. Ahora, esta empresa es el foco principal de las acusaciones. Anthropic asegura que DeepSeek realizó más de 150.000 llamadas al API. Estos buscaban copiar las avanzadas capacidades de razonamiento de Claude. Además, Anthropic acusa a DeepSeek de usar a Claude para esquivar sus propias restricciones regionales. La empresa china pidió a la IA estadounidense generar respuestas seguras contra la censura. Estas preguntas trataban temas políticos sensibles, como disidentes, líderes del partido y autoritarismo.

    Las implicaciones de esta minería digital van mucho más allá del robo corporativo. Anthropic advierte de un gran riesgo. Los modelos destilados ilícitamente pierden las estrictas e importantes barreras de seguridad de la IA original. La empresa alerta de que esta brecha podría ayudar a gobiernos autoritarios. Estos podrían integrar inteligencia artificial de primer nivel en sistemas militares y de vigilancia masiva. Esto podría impulsar operaciones cibernéticas ofensivas y campañas de desinformación.

    Anthropic comparte esta lucha con otros gigantes tecnológicos. Muchos competidores extranjeros intentan aprovecharse de la investigación estadounidense. A principios del año pasado, OpenAI tomó medidas contundentes. La empresa bloqueó cuentas sospechosas tras detectar que firmas rivales destilaban sus modelos. La semana pasada, OpenAI apoyó las actuales preocupaciones de Anthropic. Sus portavoces enviaron una enérgica carta a los legisladores estadounidenses. En ella, acusan a DeepSeek de «aprovecharse gratuitamente» de la innovación en IA de Estados Unidos.

    ¿Cuál será la respuesta de Anthropic?

    Como respuesta proactiva, Anthropic promete actualizar su infraestructura. Sus ingenieros harán que los ataques de destilación sean más difíciles de ejecutar y mucho más fáciles de identificar. Sin embargo, esta controversia resalta la compleja realidad del entrenamiento de modelos de IA.

    Por un lado, Anthropic señala a sus rivales extranjeros por copiar sus datos. Sin embargo, al mismo tiempo, la empresa libra sus propias batallas legales en casa. Actualmente, varios editores de música han demandado al laboratorio de IA. Ellos acusan a Anthropic de usar copias ilegales de canciones protegidas por derechos de autor para entrenar a Claude.