IA
IAUtiles
Industria

Se acabó la IA barata: los modelos frontera suben de precio en 2026 y DeepSeek se convierte en la alternativa

26 de junio de 20266 minpor IAUtiles

La tendencia de precios a la baja en IA (2023-2025) se invirtió en 2026: GPT-5.5 duplicó el precio de GPT-5.4, Gemini 3.5 Flash cuesta ~3x que 3.1 Flash, Fable 5 sale a 10$/50$. DeepSeek fija V4-Pro en 0,44$/0,87$ de forma permanente.

La tendencia que definió el mercado de IA entre 2023 y 2025 —precios por token que caían con cada generación de modelo— se invirtió en 2026. GPT-5.5 duplicó el precio de GPT-5.4 en su lanzamiento, Gemini 3.5 Flash cuesta unas 3 veces más que Gemini 3.1 Flash, y Claude Fable 5 salió a 10 $/50 $ por millón de tokens frente a los 5 $/25 $ de Opus 4.8. La excepción: DeepSeek V4-Pro, fijado de forma permanente en junio en 0,44 $/0,87 $.

Qué ha pasado exactamente

En 2026, los tres grandes laboratorios occidentales subieron precios en sus modelos frontera en lugar de bajarlos. OpenAI lanzó GPT-5.5 con un precio por token que duplicó el de GPT-5.4: de 1,25 $/7,50 $ a 2,50 $/15 $ en contexto corto, según la tabla de precios que documentó XDA Developers al comparar ambas generaciones. Google posicionó Gemini 3.5 Flash a aproximadamente 1,50 $/9,00 $ por millón de tokens de entrada y salida —unas 3 veces más que Gemini 3.1 Flash— pese a mejorar en capacidad. Anthropic lanzó Claude Fable 5 a 10 $/50 $, el doble de los 5 $/25 $ de Opus 4.8.

La economía de fondo explica por qué el subsidio no puede continuar. OpenAI gastó aproximadamente 1,35 $ por cada dólar que ingresó en 2025, según los datos recogidos en el resumen del 26 de junio de Build Fast with AI. El coste de servir ChatGPT se proyecta en 14.000 millones de dólares en 2026 frente a 3.700 millones de ingresos el año anterior en ese segmento. Servir modelos frontera a los precios a los que se acostumbraron los clientes durante tres años nunca fue sostenible: era una cuenta pendiente que las empresas están cobrando ahora.

La primera empresa en demostrar que el modelo puede dar beneficio es Anthropic: está encaminada a su primer beneficio operativo de aproximadamente 559 millones de dólares en el Q2 de 2026, con una tasa de ingresos anualizada que superó los 47.000 millones, según Reuters y materiales de fundraising citados por el WSJ. La excepción al alza de precios occidentales llegó desde China: DeepSeek hizo permanente en junio de 2026 su recorte promocional del 75% de mayo sobre V4-Pro, fijándolo en ~0,44 $ por millón de tokens de entrada y 0,87 $ de salida. La variante ligera V4-Flash baja aún más: 0,14 $ de entrada y 0,28 $ de salida.

Por qué importa

La comparación relevante para presupuestos ajustados ya no es OpenAI contra Anthropic. Es modelos frontera occidentales contra alternativas chinas de pesos abiertos. DeepSeek V4-Pro deja a GPT-5.5 (2,50 $/15 $) por debajo en más de 5 veces en entrada y 17 veces en salida, y a Gemini 3.5 Flash (1,50 $/9 $) en torno a 3 veces en entrada y 10 veces en salida. Para un pipeline que procesa 10 millones de tokens de salida al mes, la diferencia entre GPT-5.5 y DeepSeek V4-Pro es de 150 $ frente a 8,70 $ —una brecha de más de 141 dólares mensuales en un solo componente de coste.

El recorte permanente de DeepSeek no es un experimento de captación de mercado con fecha de caducidad: es una señal estratégica de suelo de precio para el tier de pesos abiertos chino. La arquitectura V4 usa un diseño híbrido de atención dispersa que, con 1 millón de tokens de contexto, funciona con aproximadamente el 27% del cómputo por token y el 10% de la memoria de su predecesor, según el paper técnico publicado por DeepSeek. Eso explica cómo puede ofrecer esos precios sin reportar pérdidas, mientras OpenAI y Google suben tarifas para acercarse a la rentabilidad.

Para pipelines sensibles al presupuesto que necesiten una alternativa occidental o un segundo proveedor, GLM-5.2 vía la API de Z.ai es otra opción en el segmento chino de pesos abiertos, con licencia MIT y precios por debajo de los modelos frontera americanos. Pero la decisión de arquitectura de costes en 2026 ya no pasa por elegir entre ChatGPT y Claude: pasa por decidir si el 5-10% de tareas que requieren el modelo más capaz justifica pagar 17 veces más en salida que con V4-Pro para el otro 90%.

Qué significa en España

Según el Digital Economy Scoreboard (DES) 2026, un 35% de las pymes españolas prevé invertir en IA este año y un 57% destinará hasta el 20% de su presupuesto de digitalización a herramientas de inteligencia artificial. Para ese segmento —empresas con presupuestos de digitalización de entre 5.000 y 50.000 euros anuales— el precio por token no es un detalle técnico: es el factor que decide si la IA entra en el flujo de trabajo diario o se queda en una prueba piloto de tres meses que no se renueva.

El uso de modelos de pesos abiertos chinos plantea un riesgo concreto que las pymes españolas están subestimando: la IA sombra. Empleados que suben extractos de facturación, contratos con clientes o fragmentos de código propietario a chats públicos gratuitos —ya sea ChatGPT, Claude o interfaces no autorizadas de DeepSeek— constituyen una de las mayores fugas de propiedad intelectual de 2026. Un desarrollador que pega 200 líneas de un módulo interno en un chat gratuito para depurar un error está enviando datos que pueden quedar en los logs del proveedor, entrenar futuras versiones del modelo o quedar expuestos en una brecha de seguridad. El ahorro de 0,44 $ por millón de tokens no compensa una demanda por violación de secreto empresarial.

El Reglamento Europeo de IA (EU AI Act) entra en vigor en su siguiente fase el 2 de agosto de 2026 y condiciona qué modelos y con qué garantías pueden desplegar las empresas españolas en sectores regulados. Abajar coste con un modelo chino de pesos abiertos no exime de cumplir: un sistema de IA de alto riesgo —fintech con licencia CNMV, diagnóstico médico, administración pública— necesita documentación de trazabilidad del modelo, evaluación de sesgos y registro en la base de datos de la UE. Elegir DeepSeek V4-Pro por precio sin evaluar el marco de cumplimiento es un error que puede costar más que la factura de tokens ahorrada.

Para datos sensibles —nóminas, expedientes clínicos, código fuente de producto, estrategia comercial— la recomendación práctica no es elegir entre OpenAI y DeepSeek por precio de lista, sino plantear IA local o privada en servidor propio en lugar de enviar datos a APIs públicas. Un servidor con GPU en un datacenter español o un despliegue on-premise con modelos cuantizados elimina el riesgo de fuga por IA sombra y simplifica el cumplimiento del AI Act al mantener los datos dentro de la jurisdicción europea. El TCO real incluye el coste del hardware, pero para una pyme con 15 empleados que maneja datos de clientes, un despliegue local de un modelo de 30-70B parámetros puede resultar más barato que 12 meses de API frontier occidental a precios de 2026.

Análisis

El titular real no es "DeepSeek es más barato". Es la era del subsidio terminó. Entre 2023 y 2025, cada nueva generación de modelo llegaba con precios más bajos por token y capacidades mayores: los laboratorios absorbían la diferencia entre coste de inferencia y precio de venta para ganar cuota de mercado. En 2026, OpenAI, Google y Anthropic suben precios porque servir frontera a tarifas de 2024 nunca fue rentable —OpenAI lo demuestra con un ratio gasto/ingreso de 1,35:1 en 2025— y el coste real ya recae en el usuario, ya sea en la factura de API o en el salto de una suscripción plana a facturación por tokens.

Anthropic es la excepción que confirma la regla: es la única que está demostrando que el modelo puede dar beneficio operativo (~559 M$ en Q2 2026) porque su base de ingresos —desarrolladores que consumen millones de tokens con Claude Code— paga tarifas alineadas con el coste real. OpenAI sigue quemando caja mientras proyecta 14.000 M$ en costes de servicio de ChatGPT en 2026. La paradoja es que Anthropic también subió precios (Fable 5 al doble de Opus 4.8), pero su estructura de costes y su mix de clientes enterprise le permiten llegar a positivo antes que su rival.

Para una pyme española, la decisión no es ideológica —occidental contra chino— sino de TCO y cumplimiento. La métrica a vigilar en los próximos trimestres no es el precio de lista del próximo modelo frontier, sino si tu factura mensual de tokens se ha multiplicado desde que migraste de suscripción plana a facturación por uso. Si la respuesta es sí —y los informes de enterprise hablan de saltos de hasta 7 veces en el primer día de facturación por tokens—, entonces el routing inteligente (tareas rutinarias en DeepSeek V4-Flash a 0,14 $/0,28 $, tareas críticas en frontier occidental) deja de ser optimización técnica y pasa a ser supervivencia presupuestaria.

Herramientas relacionadas

  • ChatGPT / GPT-5.5 — ficha con precios actualizados a 2,50 $/15 $ por millón de tokens; referencia para calcular el coste real de tu uso frente a alternativas chinas.
  • Claude — familia Opus 4.8 (5 $/25 $) y Fable 5 (10 $/50 $); Anthropic es la única frontier que ya demuestra beneficio operativo en Q2 2026.
  • Gemini — Gemini 3.5 Flash a 1,50 $/9 $: el caso más claro de subida de precio (~3x) pese a mejoras de capacidad respecto a 3.1 Flash.
  • DeepSeek V4-Pro — modelo de referencia en precio (0,44 $/0,87 $) para pipelines de alto volumen que no requieren frontier occidental.

Fuentes