MiniMax presenta M3, un nuevo modelo open-weight centrado en codigo y agentes, con multimodalidad nativa y contexto de hasta un millon de tokens.
MiniMax ha lanzado M3, un modelo de pesos abiertos orientado a programación, agentes y tareas multimodales con una ventana de contexto de hasta un millón de tokens.
El modelo puede recibir texto, imágenes y vídeo, y también operar un ordenador dentro de flujos agentivos. MiniMax afirma que es el primer modelo open-weight que reúne esas capacidades con contexto de esa longitud.
M3 utiliza MiniMax Sparse Attention, una arquitectura de atención dispersa diseñada para reducir el coste de procesar conversaciones y documentos muy largos. La compañía indica que, con un millón de tokens, el cálculo por token es una fracción del utilizado por su generación anterior.
El entrenamiento multimodal se realizó desde el inicio, en lugar de añadir módulos independientes al final. Esto permite combinar en una misma tarea la lectura de documentos visuales, el seguimiento de registros extensos y la ejecución de código o acciones.
MiniMax Code se ha actualizado para aprovechar M3 en proyectos largos. Su sistema Agent Team reparte el trabajo entre agentes productores y verificadores y permite que el usuario intervenga durante la ejecución para añadir requisitos o corregir la dirección.
M3 está disponible a través de MiniMax Code, los planes de tokens y la API. El modelo permite activar o desactivar el razonamiento según se priorice profundidad o velocidad.