Boletín Semanal Best-IA #115

Aprende IA, día a día.

Noticias

MiniMax M2: el “agente nativo” open source más eficiente

MiniMax ha liberado M2, un modelo abierto especializado en agentes y programación, que promete un rendimiento 2 veces más rápido que Claude Sonnet y un coste un 92 % inferior. Está disponible gratis hasta el 7 de noviembre vía API y MiniMax Agent.

🔑 Puntos clave:

  1. Arquitectura hiper-eficiente: 200 B parámetros totales, pero solo 10 B activos por inferencia, lo que le permite operar con 4 GPUs H100 en precisión FP8.

  2. Potencia en agentes y herramientas: Optimizado para uso prolongado de toolchains (mcp, shell, navegador, código) y seguimiento de instrucciones.

  3. Economía y rendimiento: Su precio por millón de tokens es extremadamente bajo ($0.3 / $1.2 input/output), aunque tiende a ser muy verboso.

  4. Estrategia china de liderazgo open source: Con M2, MiniMax consolida el avance de los laboratorios chinos en modelos abiertos, siguiendo la estela de DeepSeek, Qwen3 y Moonshot AI.

🎯 M2 MiniMax alcanza un nuevo récord en el Artificial Analysis Intelligence Index para un modelo de peso abierto, y refuerza el dominio de China en el ecosistema open-source.

MiniMax Speech 2.6: voz instantánea y multilingüe

MiniMax también ha presentado Speech 2.6, su modelo de voz más avanzado, con latencia inferior a 250 ms, clonación vocal completa y soporte para más de 40 idiomas con cambio fluido entre ellos. Diseñado para conversaciones naturales y en tiempo real.

OpenAI 

GPT-OSS-Safeguard: modelos abiertos para políticas de seguridad personalizables

OpenAI presenta GPT-OSS-Safeguard, dos modelos de razonamiento abierto (120B y 20B) diseñados para clasificar contenidos según políticas de seguridad definidas por los desarrolladores, con licencia Apache 2.0 y disponibles en Hugging Face.

🔑 Claves del lanzamiento

  • Políticas dinámicas y explicables: Los modelos interpretan políticas en tiempo real y generan una cadena de razonamiento visible, permitiendo revisar cómo llegan a sus decisiones.

  • Flexibilidad total: El desarrollador define y modifica sus propias políticas sin necesidad de reentrenar el modelo, útil en dominios donde los riesgos cambian rápidamente.

  • Rendimiento competitivo: En pruebas internas, los modelos superaron a GPT-5-Thinking en precisión multi-política, pese a ser más pequeños y abiertos.

  • Aplicaciones amplias: Desde foros que detectan trampas en videojuegos hasta plataformas que filtran reseñas falsas, cada caso puede ajustar sus propios límites de seguridad.

  • Ecosistema abierto y colaborativo: Desarrollado junto a ROOST, Discord y SafetyKit, inaugura la ROOST Model Community, dedicada a compartir prácticas y evaluaciones de modelos abiertos de seguridad.

  • LINK: https://openai.com/index/introducing-gpt-oss-safeguard/

GPT-5 mejora su respuesta ante conversaciones sensibles

OpenAI publica un anexo a la System Card de GPT-5, destacando una actualización que mejora el reconocimiento y apoyo en casos de angustia emocional, desarrollada junto a 170 expertos en salud mental, reduciendo fallos de respuesta entre 65 % y 80 %.

Aardvark: el nuevo agente de seguridad

Aardvark es un agente basado en GPT-5 que analiza código como un investigador humano, detecta errores reales y sugiere correcciones. Supervisa commits, valida en sandbox y anota el código automáticamente sin frenar el ciclo de desarrollo.

“Agent Mode” en ChatGPT

OpenAI ha lanzado en modo preliminar su nueva función Agent Mode, que permite a ChatGPT investigar, planificar y ejecutar acciones mientras el usuario navega. Está disponible para los planes Plus, Pro y Business.

Microsoft y OpenAI: una nueva era en su alianza

Desde 2019, Microsoft y OpenAI han compartido una alianza estratégica. Ahora, ambos anuncian un nuevo acuerdo: OpenAI se transforma en una Public Benefit Corporation (PBC) y Microsoft amplía su papel como socio clave.

OpenAI alerta a la Casa Blanca sobre el “cuello de botella eléctrico” de la IA

OpenAI advierte que la energía es el principal límite del crecimiento de la IA y propone generar 100 GW anuales de nueva capacidad. El memo insta a tratar la infraestructura de IA como activo de seguridad nacional, con incentivos y reservas estratégicas de materiales clave.

Cursor 2.0: Nueva versión con modelo propio para programación con agentes inteligentes

Cursor lanza Composer, su primer modelo de IA para programación, junto con una interfaz multiagente. El objetivo: convertir el flujo de trabajo en un ecosistema colaborativo entre humanos y agentes.

🔑 Claves del lanzamiento

  • Composer, el nuevo modelo de codificación: Diseñado para tareas complejas de programación con baja latencia, es 4 veces más rápido que modelos equivalentes y completa la mayoría de las iteraciones en menos de 30 segundos.

  • Entendimiento profundo del código: Entrenado con herramientas de semantic search a nivel de repositorio, permite trabajar eficazmente en grandes bases de código y proyectos de múltiples archivos.

  • Interfaz centrada en agentes: Cursor 2.0 sustituye el enfoque basado en archivos por un entorno centrado en objetivos, donde múltiples agentes trabajan en paralelo gracias a git worktrees o máquinas remotas.

  • Colaboración competitiva: El sistema puede ejecutar varios modelos sobre la misma tarea y seleccionar el mejor resultado, mejorando la calidad final del código generado.

  • Automatización de revisión y testing: Incorpora un navegador nativo para probar los cambios y permitir que el propio Cursor itere hasta lograr el resultado correcto.

🎯 Los entornos de programación se están convirtiendo en ecosistemas inteligentes y colaborativos impulsados por IA.

Sonic-3: la nueva generación de modelos conversacionales en tiempo real

Cartesia ha anunciado el lanzamiento de su modelo Sonic-3, diseñado para ofrecer conversaciones en tiempo real con un nivel de naturalidad sin precedentes.

🔑 Claves del avance:

  • Conversación humana y emocional: Sonic-3 puede expresar risas, matices emocionales y un tono natural al hablar.

  • Velocidad récord: alcanza una latencia de 90 ms a nivel de modelo y 190 ms de extremo a extremo, siendo el sistema más rápido del mercado.

  • Multilingüe: soporta 42 idiomas en tiempo real.

  • Arquitectura innovadora: utiliza State Space Models (SSM) en lugar de Transformers, lo que le permite recordar el contexto general de la conversación —como un humano— sin “releer” todo el historial cada vez que genera una respuesta.

  • Aplicaciones empresariales: compañías como ServiceNow, Cresta y Decagon ya emplean Sonic para millones de interacciones mensuales.

🎯 Los SSM, impulsados por la investigación de Stanford (S4, Mamba), podrían redefinir la arquitectura base de la IA generativa en tiempo real.

En breve

Nueva investigación de Anthropic: Signos de introspección en los LLM

Un nuevo estudio de Anthropic demuestra que Claude Opus 4 y 4.1 empiezan a mostrar una forma incipiente de introspección funcional: pueden detectar, reconocer y describir algunos de sus propios estados internos cuando se alteran sus activaciones neuronales. Aunque esta capacidad es inconsistente y no implica conciencia subjetiva, sugiere que los sistemas de IA están desarrollando mecanismos de autoevaluación interna, con implicaciones para la transparencia, el control y la seguridad de modelos futuros.

Extropic presenta su chip de Computación Probabilística: 10.000x más eficiente que una GPU

La startup Extropic ha presentado un nuevo tipo de chip de Computación Probabilística que aprovecha el ruido térmico natural en lugar de suprimirlo, logrando —según sus pruebas— hasta 10.000 veces menos consumo energético que una GPU convencional en tareas generativas simples.

Google lanza Pomelli: su agente de marketing con IA

Google presenta Pomelli, un agente inteligente capaz de analizar marcas y crear campañas de marketing completas. Disponible inicialmente en EE. UU., Canadá, Australia y Nueva Zelanda, marca otro paso en el auge de los agentes de IA comerciales.

La IA de DeepMind que descubre nuevos algoritmos de aprendizaje por refuerzo

Google DeepMind presenta un sistema capaz de autodescubrir algoritmos de reinforcement learning más avanzados que los diseñados por humanos. Liderado por David Silver, creador de AlphaGo, este avance impulsa la evolución autónoma de la propia IA.

NVIDIA CodonFM: IA para diseño de ARN mensajero

NVIDIA presenta CodonFM en Hugging Face, un modelo capaz de predecir codones en secuencias de ARNm, optimizando variantes genéticas y mejorando el diseño de terapias basadas en ARN mensajero.

Suno supera el “test de Turing musical”

Un nuevo estudio ha revelado que sólo el 50 % de los oyentes distinguió entre música creada por humanos y por Suno 3.5. Con la versión actual Suno v5, la frontera entre creatividad humana y artificial se vuelve casi imperceptible.

Kimi Linear: una nueva arquitectura híbrida más rápida y eficiente

Kimi Linear combina atención lineal y global para superar a la atención completa en tareas de razonamiento, comprensión y contextos largos. Su diseño reduce la memoria un 75 %, acelera la decodificación ×6 y mantiene la calidad, permitiendo LLMs más escalables y eficientes.

MiniMax Music 2.0: la IA que compone, canta y produce música completa

Music 2.0 es un modelo capaz de crear canciones de hasta cinco minutos con voces realistas, instrumentación profesional y control total del estilo, desde pop hasta jazz, rock o folk.

Cognition lanza SWE-1.5: un agente de código ultrarrápido

Cognition ha presentado SWE-1.5, un modelo especializado en programación que alcanza un rendimiento cercano al estado del arte y destaca por su velocidad sin precedentes. Ya está disponible en la plataforma Windsurf.

Robots

NEO Home Robot ya está a la venta

El robot doméstico NEO, enfocado en productividad y asistencia personal, abre su fase de reservas con dos modalidades de acceso y entregas programadas para 2026 en EEUU.

  1. Modalidades de acceso

    • Standard: Suscripción mensual de $499, incluye paquete básico de productividad y entrega estándar.

    • Early Access: Opción de propiedad por $20,000, con garantía de 3 años, soporte premium y entrega prioritaria.

🎯 El lanzamiento de NEO marca la entrada del robot doméstico en fase comercial.

Reflexiones Finales

La IA es IMPARABLE: Chema Alonso sobre Ciberestafas, Metaverso y el futuro de la tecnología