Etiqueta: DeepSeek

DeepSeek V4 desafía el dominio de Silicon Valley
DeepSeek

La guerra de precios de la IA se intensifica

Poco más de un año después de que su modelo R1 sacudiera la industria y liderara el ranking de la App Store de EE. UU., el laboratorio chino DeepSeek vuelve a la carga con DeepSeek-V4-Preview, una nueva generación de modelos open-weight que promete competir directamente con los sistemas cerrados de gigantes como OpenAI, Anthropic y Google, pero a una fracción del costo.

El anuncio llegó apenas horas después del lanzamiento de GPT-5.5, acompañado de un mensaje contundente: “Bienvenidos a la era del contexto de 1 millón de tokens rentable.”

🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.

🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.… pic.twitter.com/n1AgwMIymu
— DeepSeek (@deepseek_ai) April 24, 2026

Dos modelos con una ventana de contexto gigantesca

La familia V4 incluye dos modelos basados en arquitectura Mixture of Experts (MoE), entrenados con 32 billones de tokens y con una ventana de contexto de 1 millón de tokens, diseñada para conversaciones largas y tareas complejas.

DeepSeek-V4-Pro: el buque insignia
- 1.6 billones de parámetros totales
- Solo 49 mil millones activos por consulta (eficiencia MoE)
- Rendimiento comparable con modelos top como:
  - Claude Opus 4.6-Max
  - GPT-5.4-xHigh
  - Gemini-3.1-Pro
Destaca especialmente en programación y tareas autónomas, con puntuaciones líderes en SWE-Verified y Codeforces.

DeepSeek-V4-Flash: la versión ligera
- 284 mil millones de parámetros totales
- 13 mil millones activos
- Diseñado para ejecución local y respuestas ultrarrápidas
Ambos modelos incluyen un modo gratuito “Think Max”, que fuerza el razonamiento profundo para problemas complejos.

DeepSeek V4 rompela barrera del costo

La gran apuesta de DeepSeek es el precio:

DeepSeek-V4-Pro
- $1.74 / millón tokens de entrada
- $3.48 / millón tokens de salida
Esto lo vuelve:
- ~7× más barato que Claude Opus 4.7
- ~8× más barato que GPT-5.5
DeepSeek-V4-Flash
- $0.14 entrada
- $0.28 salida
Esto significa que es hasta 100× más barato que GPT-5.5 en salida.

Además, mantiene tarifas bajas incluso con el contexto de 1 millón de tokens, evitando las subidas drásticas de precio que aplican otros modelos tras cierto límite.

La eficiencia se logra con:
- Compressed Sparse Attention (CSA)
- Heavily Compressed Attention (HCA)
- Solo 27 % del cómputo y 10 % de caché frente a V3.2
- Nuevo optimizador Muon en lugar de AdamW
Diseñado para la era de los agentes

DeepSeek posiciona V4 como el motor ideal para agentes autónomos, especialmente en entornos donde la IA interactúa directamente con computadoras y código.

Al ser un modelo open-weight busca atraer a desarrolladores frustrados por las restricciones recientes de plataformas cerradas.

Tensiones geopolíticas y controversias

El avance tecnológico también llega acompañado de polémica:
- Prohibido en agencias federales de EE. UU. por seguridad nacional
- Corea del Sur pausó descargas por preocupaciones de privacidad
- Funcionarios estadounidenses acusan a DeepSeek de usar chips Nvidia restringidos
- Anthropic ha alegado uso indebido de datos de Claude
DeepSeek no ha revelado los costos de entrenamiento ni su infraestructura.

Un competidor que redefine el mercado

Pese a las controversias, DeepSeek-V4 demuestra que el laboratorio chino llegó para quedarse. Con rendimiento de primer nivel, una filosofía abierta y precios agresivos, la compañía no solo compite en la carrera global de IA, sino que una vez más ha cambiado las reglas del juego.
abril 24, 2026
Anthropic asegura que DeepSeek y otras empresas chinas aprovechan el poder de Claude para entrenar su IA

Anthropic se queja del robo de IA

El gran robo de la Inteligencia Artificial: Anthropic acusa a DeepSeek y rivales chinos de copiar el talento de Claude

La empresa ha levantado la voz de alarma ante las «campañas a escala industrial» de sus competidores extranjeros. Estos buscan recolectar ilícitamente su brillante tecnología de inteligencia artificial. Anthropic, creador del popular chatbot Claude ha acusado formalmente a tres grandes firmas chinas de IA. Hablamos de DeepSeek, Moonshot y MiniMax. Anthropic afirma que estas empresas ejecutan ataques masivos de «destilación». El objetivo es acelerar el desarrollo de sus propios modelos.

En el sector de la IA, la destilación es un proceso fascinante. Los desarrolladores entrenan un modelo más pequeño usando los resultados de un sistema más avanzado.

Anthropic reconoce la validez de este método de entrenamiento. Sin embargo, los portavoces de la empresa afirman con firmeza que sus rivales usan esta técnica como un atajo injusto. Así adquieren capacidades poderosas en un tiempo récord. Además, así logran reducir drásticamente el enorme coste del desarrollo desde cero.

Las investigaciones de Anthropic revelan datos sorprendentes. Los tres laboratorios chinos crearon unas 24.000 cuentas fraudulentas. Luego, orquestaron más de 16 millones de llamadas a Claude (probablemente a través del API). Anthropic vincula estas campañas con empresas específicas con «un alto nivel de confianza». Para ello, sus expertos correlacionaron direcciones IP y analizaron metadatos. También usaron modernos indicadores de infraestructura. Además, otros líderes de la industria aportaron pruebas para confirmar estos mismos comportamientos.

Un poco de historia

DeepSeek revolucionó recientemente la industria tecnológica. Sus desarrolladores lanzaron modelos altamente eficientes y sorprendentemente poderosos. Ahora, esta empresa es el foco principal de las acusaciones. Anthropic asegura que DeepSeek realizó más de 150.000 llamadas al API. Estos buscaban copiar las avanzadas capacidades de razonamiento de Claude. Además, Anthropic acusa a DeepSeek de usar a Claude para esquivar sus propias restricciones regionales. La empresa china pidió a la IA estadounidense generar respuestas seguras contra la censura. Estas preguntas trataban temas políticos sensibles, como disidentes, líderes del partido y autoritarismo.

Las implicaciones de esta minería digital van mucho más allá del robo corporativo. Anthropic advierte de un gran riesgo. Los modelos destilados ilícitamente pierden las estrictas e importantes barreras de seguridad de la IA original. La empresa alerta de que esta brecha podría ayudar a gobiernos autoritarios. Estos podrían integrar inteligencia artificial de primer nivel en sistemas militares y de vigilancia masiva. Esto podría impulsar operaciones cibernéticas ofensivas y campañas de desinformación.

Anthropic comparte esta lucha con otros gigantes tecnológicos. Muchos competidores extranjeros intentan aprovecharse de la investigación estadounidense. A principios del año pasado, OpenAI tomó medidas contundentes. La empresa bloqueó cuentas sospechosas tras detectar que firmas rivales destilaban sus modelos. La semana pasada, OpenAI apoyó las actuales preocupaciones de Anthropic. Sus portavoces enviaron una enérgica carta a los legisladores estadounidenses. En ella, acusan a DeepSeek de «aprovecharse gratuitamente» de la innovación en IA de Estados Unidos.

¿Cuál será la respuesta de Anthropic?

Como respuesta proactiva, Anthropic promete actualizar su infraestructura. Sus ingenieros harán que los ataques de destilación sean más difíciles de ejecutar y mucho más fáciles de identificar. Sin embargo, esta controversia resalta la compleja realidad del entrenamiento de modelos de IA.

Por un lado, Anthropic señala a sus rivales extranjeros por copiar sus datos. Sin embargo, al mismo tiempo, la empresa libra sus propias batallas legales en casa. Actualmente, varios editores de música han demandado al laboratorio de IA. Ellos acusan a Anthropic de usar copias ilegales de canciones protegidas por derechos de autor para entrenar a Claude.

febrero 23, 2026

Etiqueta: DeepSeek

DeepSeek V4 desafía el dominio de Silicon Valley

La guerra de precios de la IA se intensifica

Dos modelos con una ventana de contexto gigantesca

DeepSeek-V4-Pro: el buque insignia

DeepSeek-V4-Flash: la versión ligera

DeepSeek V4 rompela barrera del costo

Diseñado para la era de los agentes

Tensiones geopolíticas y controversias

Un competidor que redefine el mercado

Anthropic asegura que DeepSeek y otras empresas chinas aprovechan el poder de Claude para entrenar su IA

El gran robo de la Inteligencia Artificial: Anthropic acusa a DeepSeek y rivales chinos de copiar el talento de Claude

Un poco de historia

¿Cuál será la respuesta de Anthropic?