MAGI-1, el nuevo modelo de Sand AI que desafía a los gigantes
Sand AI, un laboratorio tecnológico con sede en China, ha desarrollado MAGI-1, una inteligencia artificial de código abierto enfocada en la creación de videos hiperrealistas. Este modelo representa una nueva etapa en la evolución de la generación audiovisual mediante inteligencia artificial, desafiando directamente a propuestas como Sora de OpenAI y Gemini de Google.
MAGI-1 se destaca por implementar una arquitectura de difusión autorregresiva, orientada a la producción continua de video a partir de una imagen inicial. Su estructura permite una consistencia temporal superior, garantizando la cohesión entre fotogramas consecutivos, lo que es esencial para la fluidez del contenido visual.
Tecnología de vanguardia con propósito específico
A diferencia de otros modelos de difusión, MAGI-1 emplea un sistema basado en transformadores mejorado con técnicas avanzadas de entrenamiento. Una de sus características clave es la programación progresiva de ruido durante la etapa de aprendizaje. Esta técnica fortalece la capacidad del modelo para interpretar la causalidad visual y mantener la integridad narrativa entre escenas.
Cada clip se divide en bloques de 24 fotogramas, los cuales se procesan secuencialmente. MAGI-1 elimina el ruido de cada bloque antes de avanzar al siguiente, lo que permite un procesamiento paralelo sin perder fidelidad. Este diseño incrementa notablemente el rendimiento y facilita su integración en aplicaciones de transmisión en tiempo real.
MAGI-1 redefine la edición de video con control detallado
Una de las funcionalidades más innovadoras de MAGI-1 es el sistema de indicaciones por fragmentos. Esta herramienta permite a los usuarios establecer variaciones narrativas dentro de diferentes partes del video, sin comprometer la coherencia estética o semántica. Además, la IA admite ediciones basadas en texto con una precisión notable, incluso durante la reproducción en vivo.
Comparativa con modelos líderes del sector
En múltiples evaluaciones, MAGI-1 ha superado tanto a soluciones abiertas como cerradas. Frente a modelos como Wan-2.1 y HunyuanVideo, lideró en categorías como movimiento realista y cumplimiento de instrucciones. Incluso frente a sistemas comerciales como Sora y Kling, MAGI-1 ofreció resultados competitivos, especialmente en fluidez y control creativo.
Particularmente, en el exigente benchmark Physics-IQ, MAGI-1 demostró un entendimiento profundo del comportamiento físico, ejecutando tareas de predicción y continuidad con gran precisión. Esta capacidad lo posiciona como una herramienta clave para proyectos que requieren verosimilitud científica o simulación física precisa.
Código abierto y validación de expertos
MAGI-1 está disponible como código abierto en GitHub, incluyendo la base de inferencia y los modelos entrenados. Personalidades influyentes, como Kai-Fu Lee de Microsoft Research Asia, han respaldado públicamente el avance que representa esta tecnología. Tal como sucedió con DeepSeek, MAGI-1 podría convertirse en un nuevo referente en la generación de video mediante inteligencia artificial.
Más noticias:
Revocatoria a Pabel Muñoz enfrenta su primer reto ciudadano
Fuente: