¿Qué es Claude 3.5 Sonnet?

Claude 3.5 Sonnet es el modelo de la familia Claude 3.5 posicionado en el tier de máxima capacidad con velocidad razonable. Su lanzamiento en junio de 2025 fue notable por dos razones: rendimiento en benchmarks de código que superó a GPT-4o y Gemini 1.5 Pro en el momento del lanzamiento, y la introducción en beta pública de computer use.

La familia Claude 3.5 mantiene tres niveles: Haiku (velocidad y costo), Sonnet (equilibrio) y Opus (máxima inteligencia). Sonnet es el más usado en producción por su ratio costo-rendimiento para casos de uso empresariales.

Por qué importa

Claude 3.5 Sonnet resolvió el 49% de los problemas reales del benchmark SWE-bench Verified — issues auténticos de repositorios GitHub de producción. GPT-4o estaba en 33% al momento del lanzamiento. Es el primer modewhat supera al humano promedio en esta tarea.

Computer Use: la IA que opera interfaces

Computer use es la capacidad para percibir capturas de pantalla y ejecutar acciones sobre una computadora: mover el cursor, hacer clic, escribir en formularios, navegar por la web. No es integración con APIs específicas — el modelo ve la pantalla como una persona y decide qué acción tomar.

El flujo técnico básico: el sistema captura la pantalla, la envía al modelo junto con la instrucción, el modelo responde con acciones estructuradas (click(x,y), type("texto")), el sistema ejecuta y repite hasta completar la tarea.

// Respuesta típica de computer use { "type": "tool_use", "name": "computer", "input": { "action": "left_click", "coordinate": [842, 156] } }

Rendimiento en benchmarks

49%
SWE-bench Verified
(bugs reales GitHub)
92%
HumanEval
(generación de código)
#1
LMSYS Chatbot Arena
(preferencia humana)

Los benchmarks de laboratorio no siempre reflejan producción, pero la consistencia de Sonnet siendo primero en todas las categorías de código es significativa. El salto respecto a Claude 3 Opus es sustancial en razonamiento y velocidad simultáneamente.

Casos de uso habilitados

Computer use abre tres categorías de automatización que antes requerían RPA tradicional o APIs específicas: backoffice sin API (ERPs legacy, portales gubernamentales), QA automatizado con comprensión semántica de la pantalla, y onboarding de software donde hay que configurar múltiples plataformas a la vez.

En VuraOS utilizamos Claude 3.5 Sonnet como modelo principal en agentes de atención al cliente. La mejora en seguimiento de instrucciones complejas se traduce directamente en menos escaladas a humanos y mayor precisión en la extracción de datos de mensajes no estructurados.

Disponibilidad y precios

Claude 3.5 Sonnet está disponible vía API de Anthropic ($3 por millón de tokens de entrada / $15 salida), Amazon Bedrock y Google Cloud Vertex AI. Computer use requiere habilitar explícitamente el tool computer en la llamada al modelo claude-3-5-sonnet-20241022.

Conclusión

Claude 3.5 Sonnet establece un nuevo estándar en dos frentes: rendimiento en código con la barra más alta en SWE-bench, y autonomía operativa real con computer use. Para las empresas, la pregunta ya no es si la IA puede hacer cierta tarea, sino cómo diseñar los flujos de trabajo para aprovechar estas capacidades de manera segura.