¿Qué es Llama 3?

Llama 3 es la tercera generación de los modelos de lenguaje de código abierto de Meta. A diferencia de sus predecesores, Llama 3 fue entrenado con más de 15 billones de tokens de datos curados, incluyendo código y razonamiento matemático, con una ventana de contexto de 8.192 tokens por defecto.

La familia incluye tres tamaños: 8B parámetros (optimizado para dispositivos con recursos limitados), 70B (el punto dulce para la mayoría de los casos de uso) y 405B (el flagship que compite con los modelos cerrados de frontera). Todos son descargables libremente con una licencia que permite uso comercial bajo ciertos términos.

Impacto inmediato

En las primeras semanas después del lanzamiento, Llama 3 fue descargado millones de veces en Hugging Face y Meta AI, superando todos los registros de descarga de la familia Llama anterior. La versión 70B se convirtió en el modelo más ejecutado en infraestructura propia por empresas tech.

El modelo 405B: cuando open source toca la frontera

405B
Parámetros del
modelo flagship
15T
Tokens de
entrenamiento
87.3%
MMLU — equipara
GPT-4 (87.2%)

El modelo 405B alcanzó el 87.3% en MMLU (frente al 87.2% de GPT-4), 89.0% en HumanEval de código y superó a GPT-4 en algunas categorías de razonamiento. Es la primera vez que un modelo de código abierto alcanza este nivel de rendimiento de forma consistente en múltiples benchmarks.

Por qué Meta apuesta por el open source

Mark Zuckerberg fue explícito: "Creemos que la IA abierta es fundamentalmente más segura porque más personas pueden identificar problemas, y crea un ecosistema más saludable donde ninguna empresa puede monopolizar el acceso a la tecnología más transformadora de nuestra era."

Pero la estrategia también tiene lógica comercial: Meta construye productos de consumo (Instagram, WhatsApp, Facebook) que se benefician directamente de mejores modelos de IA. No necesitan vender acceso a modelos — su negocio es la atención del usuario. Liberar Llama erosiona la ventaja de OpenAI y Anthropic sin canibalizar ningún producto de Meta.

Comparativa de rendimiento

MMLU (conocimiento general): Llama 3 405B: 87.3% | GPT-4: 87.2% | Claude 3 Opus: 86.8% HumanEval (código): Llama 3 405B: 89.0% | GPT-4: 87.1% | Claude 3 Opus: 84.9% MATH (matemáticas): Llama 3 405B: 73.8% | GPT-4: 72.6% | Claude 3 Opus: 60.1%

Qué significa para las empresas

Para las empresas, Llama 3 abre tres opciones antes poco viables: deployments on-premise sin dependencia de APIs externas, fine-tuning completo en datos propietarios sin compartirlos con terceros, y costo marginal cercano a cero una vez amortizada la infraestructura GPU.

Conclusión

Llama 3 405B cerró la brecha entre el open source y los modelos cerrados de frontera. No es que los modelos cerrados dejaron de ser mejores en ciertos aspectos — Claude 3.5 Sonnet y GPT-4o los superan en tareas específicas. Pero la ventaja ya no es lo suficientemente grande para justificar el costo y la dependencia de API en todos los casos de uso.