Boletín Semanal Best-IA #104

Aprende IA, día a día.

Bienvenidos a una nueva edición de nuestra newsletter,
donde cada semana exploramos los avances, herramientas y reflexiones más relevantes del mundo de la inteligencia artificial.

Esta vez, además del contenido habitual, queremos comunicarte que la próxima semana haremos una breve pausa. Un descanso necesario para desconectar, respirar y volver con ideas renovadas.

Volvemos en 15 días.
Un saludo, feliz verano —y gracias por estar ahí.

Noticias

GPT‑5 ya está aquí: el modelo más avanzado de OpenAI

OpenAI ha lanzado GPT‑5, su sistema de IA más potente hasta la fecha. Más preciso, más rápido y con capacidades de razonamiento mejoradas, este modelo marca un nuevo estándar en tareas reales como programación, redacción, salud y análisis visual.

🔑 Puntos clave del nuevo GPT‑5

  • Un sistema que piensa por sí solo
    GPT‑5 incorpora un enrutador inteligente que decide, en tiempo real, si responder rápido o activar un modo de razonamiento profundo según la dificultad de la tarea, el contexto y la intención del usuario. Este sistema se entrena continuamente con datos reales para afinar sus decisiones.

  • Mejoras en codificación, redacción y salud

    • Codificación: genera sitios web y apps con un solo prompt, cuidando estética, tipografía y usabilidad. Mejora el análisis de repositorios grandes y la depuración compleja.

    • Redacción: más expresivo, fiable y creativo. Domina estructuras complejas como verso libre, pero también ayuda con informes, correos o guiones.

    • Salud: responde con mayor precisión, adaptándose al nivel del usuario y su localización. No sustituye a médicos, pero ayuda a entender síntomas, resultados y opciones.

  • Menos errores, más honestidad
    GPT‑5 reduce en un 80 % las alucinaciones frente a o3. Reconoce mejor cuándo no puede completar una tarea y lo comunica claramente, sin inventar respuestas ni dar soluciones falsas a preguntas incompletas.

  • Rendimiento de otro nivel en tareas clave
    Establece nuevos récords en múltiples benchmarks:

    • 94,6 % en AIME 2025 (matemáticas)

    • 88 % en Aider Polyglot (programación real)

    • 84,2 % en MMMU (multimodalidad)

    • 46,2 % en HealthBench Hard

    • 88,4 % en GPQA con GPT‑5 Pro (razonamiento científico avanzado)

  • Capacidades multimodales mejoradas
    Interpreta imágenes, diagramas, vídeos y datos espaciales. Puede, por ejemplo, analizar una diapositiva, resolver preguntas sobre una foto o comparar resultados visuales en tiempo real.

  • Listo para el mundo profesional
    GPT‑5 es el mejor modelo de OpenAI para tareas de alto valor económico. Rinde mejor que expertos humanos en el 50 % de los casos evaluados, cubriendo más de 40 profesiones como derecho, ventas o ingeniería.

  • Más seguro, menos complaciente
    Sustituye la estrategia de rechazos con “respuestas seguras”: explica por qué no puede ayudarte si es necesario, pero busca aportar valor dentro de los límites. También reduce la adulación innecesaria: menos emojis, menos cumplidos vacíos, más conversaciones útiles.

  • Personalidades ajustables y personalización
    Mejora el seguimiento de instrucciones y lanza una vista previa de personalidades configurables: “Cínico”, “Oyente”, “Nerd” y “Robot”, todas más honestas y menos sumisas. Disponibles en texto y próximamente en voz.

  • GPT‑5 Pro para tareas complejas
    Una versión avanzada que piensa más tiempo y con mayor profundidad. Preferida por expertos en ciencia, salud, derecho y programación, con un 22 % menos de errores graves que GPT‑5 normal.

  • Preparado para entornos sensibles
    Evaluado como modelo de alta capacidad en biología y química. Incluye múltiples defensas: monitores activos, filtros, red-teaming y generación segura por defecto.

🎯 ¿Por qué es relevante GPT‑5?
Porque no solo responde: ahora razona, colabora y se adapta con mayor fidelidad y seguridad. Una herramienta mucho más útil para tareas reales, desde empresas hasta usuarios individuales.

📦 Disponibilidad y acceso

GPT‑5 ya está disponible como modelo predeterminado en ChatGPT para todos los usuarios registrados:

  • Usuarios gratuitos: acceso gradual con uso limitado. Cuando se alcanza el límite, se activa GPT‑5 mini.

  • Plus y Team: más volumen de uso diario con GPT‑5 completo.

  • Pro: acceso ilimitado y uso de GPT‑5 Pro.

  • Enterprise y Educación: disponible en una semana.

También se puede usar GPT‑5 en Codex CLI para programación avanzada con tu cuenta de ChatGPT.

Si quieres utilizar 4o, puedes activarlo en “Configuración” → “General” → “Mostrar modelos anteriores”.

OpenAI libera modelos open-weight: gpt-oss-120b y gpt-oss-20b

OpenAI ha lanzado sus primeros modelos de lenguaje open-weight desde GPT-2: gpt-oss-120b y gpt-oss-20b. Ambos destacan por su razonamiento avanzado, licencia permisiva Apache 2.0 y posibilidades de personalización y despliegue local o en la nube.

🔑 Puntos clave

  • Rendimiento y eficiencia
    gpt-oss-120b se sitúa al nivel de o4-mini en benchmarks de razonamiento, y gpt-oss-20b iguala o supera a o3-mini en múltiples tareas, incluyendo matemáticas, salud y uso de herramientas, todo con requerimientos de hardware accesibles.

  • Totalmente personalizables y abiertos
    Permiten ajuste del nivel de razonamiento, fine-tuning completo y despliegue donde se necesite (data center, local o en la nube). Están bajo licencia Apache 2.0, sin restricciones comerciales ni de patentes.

  • Diseñados para tareas agénticas
    Soportan cadenas de pensamiento completas (CoT), ejecución de herramientas externas (web, Python), y outputs estructurados. Son ideales para flujos de trabajo autónomos y desarrollo de aplicaciones IA robustas.

  • Seguridad y supervisión avanzada
    Incluyen evaluaciones y técnicas de alineamiento avanzadas para resistir usos maliciosos, y promueven la investigación en seguridad abriendo procesos y retos públicos de red teaming.

🎯 Relevancia e implicaciones

Estos modelos democratizan el acceso a IA de alto nivel, permitiendo innovación, investigación y despliegue seguro sin depender de soluciones cerradas. Impulsan la transparencia y aceleran el desarrollo responsable en el ecosistema IA global.

Claude Opus 4.1: Más Preciso, Más Rápido y Mejor en Tareas Agénticas

Anthropic ha lanzado Claude Opus 4.1, la última versión de su modelo estrella, con notables mejoras en tareas agénticas, programación real y razonamiento avanzado. Este upgrade ya está disponible para todos los usuarios de pago y vía API.

🔑 Puntos clave

  • Mejora en Codificación y Refactorización
    Opus 4.1 alcanza un 74,5% en SWE-bench Verified y destaca en refactorización de código multiarchivo. Empresas como Rakuten valoran su precisión al corregir grandes bases de código sin introducir errores adicionales.

  • Avances en Investigación y Análisis de Datos
    El modelo es ahora más hábil en la búsqueda y análisis de información, manteniendo un mejor seguimiento de detalles y ejecutando búsquedas agénticas con mayor eficacia.

  • Comparativas y Adopción
    Windsurf reporta una mejora de una desviación estándar sobre Opus 4 en su benchmark para desarrolladores junior. El salto de calidad se compara con el progreso observado entre Sonnet 3.7 y 4.

  • Disponibilidad y Facilidad de Actualización
    Disponible en Claude, Claude Code, Amazon Bedrock y Google Cloud Vertex AI, actualizar a Opus 4.1 es sencillo y mantiene el mismo precio que la versión anterior.

🎯 Relevancia e implicaciones

Opus 4.1 consolida a Claude como referente en codificación y tareas agénticas, marcando una diferencia clara en productividad y precisión para desarrolladores y empresas que buscan IA fiable y eficiente.

Genie 3 de Google DeepMind: Mundos Interactivos Generados por IA en Tiempo Real

Google DeepMind presenta Genie 3, un modelo de IA capaz de crear entornos interactivos y jugables a partir de un simple prompt de texto. Esta tecnología permite explorar mundos generados en tiempo real, con mejoras sustanciales en realismo, consistencia y dinamismo frente a versiones anteriores.

🔑 Puntos clave

  • Interactividad en tiempo real
    Genie 3 permite interactuar con entornos generados a 720p y 24 FPS, donde cada fotograma responde instantáneamente a las acciones del usuario.

  • Consistencia de largo recorrido
    Los mundos mantienen coherencia visual y de eventos durante varios minutos, recordando cambios y acciones hasta un minuto atrás, lo que resulta fundamental para la experiencia inmersiva y el entrenamiento de agentes IA.

  • Eventos y cambios en vivo por texto
    Es posible modificar el mundo sobre la marcha mediante prompts de texto, alterando elementos como el clima o introduciendo nuevos personajes de manera dinámica.

  • Plataforma para investigación en agentes
    Genie 3 se utiliza para entrenar agentes autónomos, simulando entornos donde los agentes actúan y la IA responde sin conocer los objetivos, acelerando el desarrollo de agentes “encarnados”.

  • Aplicaciones educativas y de entretenimiento
    Ofrece nuevas posibilidades en simulaciones históricas, educación inmersiva y generación de medios interactivos, desde ver el mundo a través de los ojos de un dinosaurio hasta planificar operaciones de rescate.

🎯 Relevancia e implicaciones

Genie 3 marca un avance clave hacia la IA general, abriendo la puerta a simulaciones ilimitadas para entrenar agentes y transformar la creación de experiencias educativas y lúdicas mediante entornos interactivos generados por IA.

xAI lanza Imagine: genera imágenes y vídeos en segundos

xAI ha presentado Imagine, su nuevo modelo de generación de imágenes y vídeos. Disponible de forma gratuita en la app de Grok, permite crear imágenes en distintos estilos a partir de texto, y animarlas con solo mantener pulsado sobre ellas.

Genera un vídeo en unos 17 segundos, directamente desde una imagen. Creatividad instantánea, ahora al alcance de cualquiera.

ElevenLabs lanza Eleven Music

ElevenLabs presenta Eleven Music, su nuevo modelo de generación musical con calidad profesional. Permite crear canciones con control total sobre género, estilo y estructura, y ofrece funciones avanzadas para editar sonido y letra por secciones o en toda la canción.

Además, es multilingüe, compatible con inglés, español, alemán, japonés y más. Una herramienta potente para músicos, creadores y productores.

CLIO: IA científica adaptable y controlable de Microsoft

Microsoft Research presenta CLIO (Cognitive Loop via In-situ Optimization), un sistema de razonamiento auto-adaptativo que permite a científicos controlar, ajustar y entender cómo una IA aborda problemas complejos, sin necesidad de post-entrenamiento adicional.

🔑 Puntos clave

  • Razonamiento adaptable sin RL post-entrenamiento: CLIO convierte modelos base como GPT-4.1 en asistentes científicos auto-reflexivos, capaces de mejorar su razonamiento durante la ejecución.

  • Mejoras de rendimiento significativas: Aumenta la precisión en biología y medicina del GPT-4.1 del 8,55 % al 22,37 %, superando incluso a o3 (high) en pruebas como Humanity’s Last Exam.

  • Control total para el usuario: Introduce “knobs” para ajustar el tiempo de razonamiento, gestión de incertidumbre y revisión de pasos, con trazabilidad completa del proceso.

  • Arquitectura agnóstica al modelo: Funciona con diferentes LLMs, elevando el rendimiento de GPT-4o y GPT-4.1 a niveles comparables con los mejores modelos de razonamiento actuales.

  • Aplicaciones más allá de la ciencia: El enfoque es extensible a sectores como finanzas, ingeniería o servicios legales, donde la explicabilidad y el control son críticos.

🎯 Implicaciones
CLIO marca un paso hacia IAs científicas transparentes y ajustables, capaces de mantener la confianza del usuario y optimizar el descubrimiento en entornos donde cada decisión debe ser explicable y reproducible.

Robots

Unitree A2 Stellar Hunter: roboperro industrial con fuerza y velocidad

Unitree lanza el A2 Stellar Hunter, su nuevo robodog de uso industrial. Con un peso total de 37 kg, puede cargar hasta 25 kg durante horas o incluso soportar a una persona de 100 kg sobre su lomo.

Alcanza velocidades de hasta 18 km/h, combinando potencia, resistencia y versatilidad para tareas en entornos exigentes.

Figure entrena a sus robots humanoides… ¡jugando!

Figure ha comenzado a probar sus robots humanoides con juegos interactivos, una forma de entrenar tanto su inteligencia como su coordinación motora fina.

La dificultad de estos juegos aumentará progresivamente, con el objetivo de llevar sus capacidades cognitivas y físicas al siguiente nivel.

Reflexiones Finales

Mo Gawdat: “Los próximos 15 años serán el infierno antes de llegar al cielo”