Opus 4.8 lidera con un 92% en SWE-bench Verified
El ranking mensual de modelos de IA actualizado para junio de 2026 confirma a Claude Opus 4.8, lanzado por Anthropic el 28 de mayo, como el modelo más capaz de la frontera general. Opus 4.8 alcanza un 92% en SWE-bench Verified y un 89% en SWE-bench Pro, los registros más altos publicados hasta ahora para programación agéntica.
GPT-5.5 y Gemini 3.1 Pro completan el podio, aunque con planteamientos distintos: OpenAI ha subido el precio de su modelo insignia mientras reduce la generación de tokens en prompts largos, mientras que Google mantiene estable el precio de Gemini 3.1 Pro desde febrero.
Gemini 3.1 Pro, la mejor relación calidad-precio entre los premium
Google consolida Gemini 3.1 Pro como la opción con mejor relación calidad-precio entre los modelos premium del mercado. Tras mantener su precio sin cambios desde febrero, el modelo de Google acumula puntos entre los equipos de desarrollo que buscan maximizar el rendimiento por dólar gastado.
El ranking refleja un mercado en plena maduración donde las diferencias de rendimiento entre los modelos líderes se estrechan, y la estrategia de precios y el enfoque en casos de uso específicos se convierten en los principales diferenciadores competitivos.