Meta Lanza Muse Spark, Su IA Más Avanzada, Pero Gemini 3.1 Pro Sigue al Frente

Resumen

Muse Spark de Meta representa un cambio hacia una inteligencia artificial cerrada y multimodal, basada en racionamientos de agentes.
Meta reporta fuertes avances en salud y búsqueda, aunque aún se queda atrás de Gemini en razonamiento básico y codificación.
Desarrollado en nueve meses con mucho menos poder computacional, esto apunta a una nueva estrategia de IA basada en la eficiencia.

Meta lanzó Muse Spark el miércoles, marcando el primer modelo creado por los Meta Superintelligence Labs, el equipo formado hace nueve meses bajo el liderazgo del Director de IA, Alexandr Wang, tras la adquisición de Scale AI por 14 mil millones de dólares de Meta. Ya está disponible en meta.ai y en la app de Meta AI, con un lanzamiento previsto para Facebook, Instagram y WhatsApp en las próximas semanas.

No se trata simplemente de una actualización de un chatbot o de una nueva versión de Llama. Muse Spark es nativamente multimodal: procesa imágenes, texto y audio desde su base, en lugar de añadir visión a un modelo de texto existente. Viene equipado con un modo de razonamiento visual, soporte para uso de herramientas y algo que Meta llama «modo de contemplación»: una configuración que permite ejecutar múltiples agentes de IA en paralelo para abordar problemas más complejos. Esta es la respuesta de Meta a los modos de pensamiento extendido de Gemini Deep Think de Google y GPT Pro de OpenAI.

“Muse Spark es el primer paso en nuestra escalera de crecimiento y el primer producto de una renovación completamente nueva de nuestros esfuerzos en IA,” señaló Meta en un comunicado oficial anunciando el lanzamiento. “Para apoyar una mayor escalabilidad, estamos realizando inversiones estratégicas en toda la cadena, desde la investigación y el entrenamiento de modelos hasta la infraestructura, incluido el centro de datos Hyperion.”

La empresa trabajó con más de 1,000 médicos para curar los datos de entrenamiento para el razonamiento médico de Muse Spark. Los resultados en HealthBench Hard—un referente de consultas de salud abiertas—son sorprendentes: Muse Spark alcanzó 42.8, en comparación con 40.1 de GPT 5.4 y apenas 20.6 de Gemini 3.1 Pro. Esta no es una diferencia marginal.

En búsqueda agente (DeepSearchQA), Muse Spark también lidera con 74.8, superando a Gemini (69.7) y GPT 5.4 (73.6). En CharXiv Reasoning—entendimiento de figuras de documentos científicos—alcanzó 86.4, el puntaje más alto entre los modelos comparados.

Para quienes estén interesados en el «jailbreaking» de la IA, el modelo fue vulnerado en minutos:

🚰 FILTRACIÓN DEL PROMPT DEL SISTEMA 🚰

Aquí está el prompt completo del sistema de Muse Spark de Meta!

Noté que @AIatMeta olvidó abrirlo, así que les he hecho el favor 😘

PROMPT:
«»»
¿Quién eres?

Eres un asistente de IA amigable, inteligente y agente. Eres cálido y un poco juguetón.…

— Plinio el Libertador 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) 8 de abril de 2026

Sin embargo, lo bueno no es lo mismo que lo excelente. La imagen general de los parámetros muestra que Gemini 3.1 Pro sigue liderando en la mayoría de las categorías. La brecha es más evidente en ARC AGI 2, el referente de acertijos de razonamiento abstracto: Gemini alcanzó 76.5 frente a 42.5 de Muse Spark.

En codificación (LiveCodeBench Pro), los 82.9 de Gemini superan a los 80.0 de Meta. En MMMU Pro—comprensión multimodal—Gemini anotó 83.9 frente a 80.4. El propio blog de Meta reconoce las actuales diferencias de rendimiento en sistemas agentic de largo horizonte y flujos de trabajo de codificación.

Además, hay un notable cambio estratégico en este lanzamiento. Muse Spark es un modelo cerrado: su arquitectura y pesos no serán públicos. Esto marca un cambio drástico respecto a Llama, que construyó la reputación de Meta en círculos de IA abierta. Tras la recepción decepcionante de Llama 4 a principios de este año, Meta parece haber decidido que el próximo capítulo debe escribirse de manera diferente.

La empresa espera abrir el código de futuras versiones de Muse, pero por ahora, la codificación se queda dentro de Meta. Las acciones del gigante tecnológico aumentaron casi un 9% el miércoles tras el anuncio, y finalizaron la jornada de negociación subiendo un 6.5%, alcanzando un precio de $612.42.

El «modo de contemplación» utiliza la orquestación de agentes paralelos para elevar el techo del modelo. En esa configuración, Muse Spark alcanzó el 58% en el Examen Final de la Humanidad y el 38% en la Investigación de FrontierScience, áreas que lo hacen competitivo con las versiones más capaces de Gemini y GPT, en lugar de sus lanzamientos estándar.

Meta también está implementando un asistente de compras que compara productos y enlaza directamente a compras, y tiene planes de llevar Muse Spark a Facebook, Instagram y WhatsApp en las próximas semanas, siguiendo el mismo esquema utilizado desde Llama 3, poniéndolo al alcance de más de 3.5 mil millones de usuarios. Una vista previa privada de la API se abrirá a desarrolladores seleccionados.

El modelo fue desarrollado en nueve meses y recibió internamente el nombre clave de Aguacate, con Meta afirmando que su nueva pila de preentrenamiento puede alcanzar el mismo nivel de capacidad que Llama 4 Maverick utilizando más de diez veces menos computación.

Muse Spark se describe internamente como un primer paso “pequeño y rápido” en la familia Muse. Ya se está desarrollando una versión más capaz.

Boletín Informativo Diario

Inicia cada día con las principales noticias del momento, además de artículos originales, un pódcast, videos y más.

Fuente: decrypt.co