- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #104
Boletín Semanal Best-IA #104
Aprende IA, día a día.
Bienvenidos a una nueva edición de nuestra newsletter,
donde cada semana exploramos los avances, herramientas y reflexiones más relevantes del mundo de la inteligencia artificial.
Esta vez, además del contenido habitual, queremos comunicarte que la próxima semana haremos una breve pausa. Un descanso necesario para desconectar, respirar y volver con ideas renovadas.
Volvemos en 15 días.
Un saludo, feliz verano —y gracias por estar ahí.
Noticias
GPT‑5 ya está aquí: el modelo más avanzado de OpenAI
OpenAI ha lanzado GPT‑5, su sistema de IA más potente hasta la fecha. Más preciso, más rápido y con capacidades de razonamiento mejoradas, este modelo marca un nuevo estándar en tareas reales como programación, redacción, salud y análisis visual.
🔑 Puntos clave del nuevo GPT‑5
Un sistema que piensa por sí solo
GPT‑5 incorpora un enrutador inteligente que decide, en tiempo real, si responder rápido o activar un modo de razonamiento profundo según la dificultad de la tarea, el contexto y la intención del usuario. Este sistema se entrena continuamente con datos reales para afinar sus decisiones.Mejoras en codificación, redacción y salud
Codificación: genera sitios web y apps con un solo prompt, cuidando estética, tipografía y usabilidad. Mejora el análisis de repositorios grandes y la depuración compleja.
Redacción: más expresivo, fiable y creativo. Domina estructuras complejas como verso libre, pero también ayuda con informes, correos o guiones.
Salud: responde con mayor precisión, adaptándose al nivel del usuario y su localización. No sustituye a médicos, pero ayuda a entender síntomas, resultados y opciones.
Menos errores, más honestidad
GPT‑5 reduce en un 80 % las alucinaciones frente a o3. Reconoce mejor cuándo no puede completar una tarea y lo comunica claramente, sin inventar respuestas ni dar soluciones falsas a preguntas incompletas.Rendimiento de otro nivel en tareas clave
Establece nuevos récords en múltiples benchmarks:94,6 % en AIME 2025 (matemáticas)
88 % en Aider Polyglot (programación real)
84,2 % en MMMU (multimodalidad)
46,2 % en HealthBench Hard
88,4 % en GPQA con GPT‑5 Pro (razonamiento científico avanzado)
Capacidades multimodales mejoradas
Interpreta imágenes, diagramas, vídeos y datos espaciales. Puede, por ejemplo, analizar una diapositiva, resolver preguntas sobre una foto o comparar resultados visuales en tiempo real.Listo para el mundo profesional
GPT‑5 es el mejor modelo de OpenAI para tareas de alto valor económico. Rinde mejor que expertos humanos en el 50 % de los casos evaluados, cubriendo más de 40 profesiones como derecho, ventas o ingeniería.Más seguro, menos complaciente
Sustituye la estrategia de rechazos con “respuestas seguras”: explica por qué no puede ayudarte si es necesario, pero busca aportar valor dentro de los límites. También reduce la adulación innecesaria: menos emojis, menos cumplidos vacíos, más conversaciones útiles.Personalidades ajustables y personalización
Mejora el seguimiento de instrucciones y lanza una vista previa de personalidades configurables: “Cínico”, “Oyente”, “Nerd” y “Robot”, todas más honestas y menos sumisas. Disponibles en texto y próximamente en voz.GPT‑5 Pro para tareas complejas
Una versión avanzada que piensa más tiempo y con mayor profundidad. Preferida por expertos en ciencia, salud, derecho y programación, con un 22 % menos de errores graves que GPT‑5 normal.Preparado para entornos sensibles
Evaluado como modelo de alta capacidad en biología y química. Incluye múltiples defensas: monitores activos, filtros, red-teaming y generación segura por defecto.
🎯 ¿Por qué es relevante GPT‑5?
Porque no solo responde: ahora razona, colabora y se adapta con mayor fidelidad y seguridad. Una herramienta mucho más útil para tareas reales, desde empresas hasta usuarios individuales.
📦 Disponibilidad y acceso
GPT‑5 ya está disponible como modelo predeterminado en ChatGPT para todos los usuarios registrados:
Usuarios gratuitos: acceso gradual con uso limitado. Cuando se alcanza el límite, se activa GPT‑5 mini.
Plus y Team: más volumen de uso diario con GPT‑5 completo.
Pro: acceso ilimitado y uso de GPT‑5 Pro.
Enterprise y Educación: disponible en una semana.
También se puede usar GPT‑5 en Codex CLI para programación avanzada con tu cuenta de ChatGPT.
Si quieres utilizar 4o, puedes activarlo en “Configuración” → “General” → “Mostrar modelos anteriores”.
OpenAI libera modelos open-weight: gpt-oss-120b y gpt-oss-20b
OpenAI ha lanzado sus primeros modelos de lenguaje open-weight desde GPT-2: gpt-oss-120b y gpt-oss-20b. Ambos destacan por su razonamiento avanzado, licencia permisiva Apache 2.0 y posibilidades de personalización y despliegue local o en la nube.
🔑 Puntos clave
Rendimiento y eficiencia
gpt-oss-120b se sitúa al nivel de o4-mini en benchmarks de razonamiento, y gpt-oss-20b iguala o supera a o3-mini en múltiples tareas, incluyendo matemáticas, salud y uso de herramientas, todo con requerimientos de hardware accesibles.Totalmente personalizables y abiertos
Permiten ajuste del nivel de razonamiento, fine-tuning completo y despliegue donde se necesite (data center, local o en la nube). Están bajo licencia Apache 2.0, sin restricciones comerciales ni de patentes.Diseñados para tareas agénticas
Soportan cadenas de pensamiento completas (CoT), ejecución de herramientas externas (web, Python), y outputs estructurados. Son ideales para flujos de trabajo autónomos y desarrollo de aplicaciones IA robustas.Seguridad y supervisión avanzada
Incluyen evaluaciones y técnicas de alineamiento avanzadas para resistir usos maliciosos, y promueven la investigación en seguridad abriendo procesos y retos públicos de red teaming.
🎯 Relevancia e implicaciones
Estos modelos democratizan el acceso a IA de alto nivel, permitiendo innovación, investigación y despliegue seguro sin depender de soluciones cerradas. Impulsan la transparencia y aceleran el desarrollo responsable en el ecosistema IA global.
Claude Opus 4.1: Más Preciso, Más Rápido y Mejor en Tareas Agénticas
Anthropic ha lanzado Claude Opus 4.1, la última versión de su modelo estrella, con notables mejoras en tareas agénticas, programación real y razonamiento avanzado. Este upgrade ya está disponible para todos los usuarios de pago y vía API.
🔑 Puntos clave
Mejora en Codificación y Refactorización
Opus 4.1 alcanza un 74,5% en SWE-bench Verified y destaca en refactorización de código multiarchivo. Empresas como Rakuten valoran su precisión al corregir grandes bases de código sin introducir errores adicionales.Avances en Investigación y Análisis de Datos
El modelo es ahora más hábil en la búsqueda y análisis de información, manteniendo un mejor seguimiento de detalles y ejecutando búsquedas agénticas con mayor eficacia.Comparativas y Adopción
Windsurf reporta una mejora de una desviación estándar sobre Opus 4 en su benchmark para desarrolladores junior. El salto de calidad se compara con el progreso observado entre Sonnet 3.7 y 4.Disponibilidad y Facilidad de Actualización
Disponible en Claude, Claude Code, Amazon Bedrock y Google Cloud Vertex AI, actualizar a Opus 4.1 es sencillo y mantiene el mismo precio que la versión anterior.
🎯 Relevancia e implicaciones
Opus 4.1 consolida a Claude como referente en codificación y tareas agénticas, marcando una diferencia clara en productividad y precisión para desarrolladores y empresas que buscan IA fiable y eficiente.
Genie 3 de Google DeepMind: Mundos Interactivos Generados por IA en Tiempo Real
Google DeepMind presenta Genie 3, un modelo de IA capaz de crear entornos interactivos y jugables a partir de un simple prompt de texto. Esta tecnología permite explorar mundos generados en tiempo real, con mejoras sustanciales en realismo, consistencia y dinamismo frente a versiones anteriores.
🔑 Puntos clave
Interactividad en tiempo real
Genie 3 permite interactuar con entornos generados a 720p y 24 FPS, donde cada fotograma responde instantáneamente a las acciones del usuario.Consistencia de largo recorrido
Los mundos mantienen coherencia visual y de eventos durante varios minutos, recordando cambios y acciones hasta un minuto atrás, lo que resulta fundamental para la experiencia inmersiva y el entrenamiento de agentes IA.Eventos y cambios en vivo por texto
Es posible modificar el mundo sobre la marcha mediante prompts de texto, alterando elementos como el clima o introduciendo nuevos personajes de manera dinámica.Plataforma para investigación en agentes
Genie 3 se utiliza para entrenar agentes autónomos, simulando entornos donde los agentes actúan y la IA responde sin conocer los objetivos, acelerando el desarrollo de agentes “encarnados”.Aplicaciones educativas y de entretenimiento
Ofrece nuevas posibilidades en simulaciones históricas, educación inmersiva y generación de medios interactivos, desde ver el mundo a través de los ojos de un dinosaurio hasta planificar operaciones de rescate.
🎯 Relevancia e implicaciones
Genie 3 marca un avance clave hacia la IA general, abriendo la puerta a simulaciones ilimitadas para entrenar agentes y transformar la creación de experiencias educativas y lúdicas mediante entornos interactivos generados por IA.
I am speechless. Pay attention to how exactly the playback is displayed on different monitors.
Genie 3 is mindblowing. I can’t even imagine what we will see end of this year.
— Chubby♨️ (@kimmonismus)
8:00 PM • Aug 6, 2025
xAI lanza Imagine: genera imágenes y vídeos en segundos
xAI ha presentado Imagine, su nuevo modelo de generación de imágenes y vídeos. Disponible de forma gratuita en la app de Grok, permite crear imágenes en distintos estilos a partir de texto, y animarlas con solo mantener pulsado sobre ellas.
Genera un vídeo en unos 17 segundos, directamente desde una imagen. Creatividad instantánea, ahora al alcance de cualquiera.
ElevenLabs lanza Eleven Music
ElevenLabs presenta Eleven Music, su nuevo modelo de generación musical con calidad profesional. Permite crear canciones con control total sobre género, estilo y estructura, y ofrece funciones avanzadas para editar sonido y letra por secciones o en toda la canción.
Además, es multilingüe, compatible con inglés, español, alemán, japonés y más. Una herramienta potente para músicos, creadores y productores.
Introducing Eleven Music. The highest quality AI music model.
- Complete control over genre, style, and structure
- Multi-lingual, including English, Spanish, German, Japanese and more
- Edit the sound and lyrics of individual sections or the whole song— ElevenLabs (@elevenlabsio)
3:30 PM • Aug 5, 2025
CLIO: IA científica adaptable y controlable de Microsoft
Microsoft Research presenta CLIO (Cognitive Loop via In-situ Optimization), un sistema de razonamiento auto-adaptativo que permite a científicos controlar, ajustar y entender cómo una IA aborda problemas complejos, sin necesidad de post-entrenamiento adicional.
🔑 Puntos clave
Razonamiento adaptable sin RL post-entrenamiento: CLIO convierte modelos base como GPT-4.1 en asistentes científicos auto-reflexivos, capaces de mejorar su razonamiento durante la ejecución.
Mejoras de rendimiento significativas: Aumenta la precisión en biología y medicina del GPT-4.1 del 8,55 % al 22,37 %, superando incluso a o3 (high) en pruebas como Humanity’s Last Exam.
Control total para el usuario: Introduce “knobs” para ajustar el tiempo de razonamiento, gestión de incertidumbre y revisión de pasos, con trazabilidad completa del proceso.
Arquitectura agnóstica al modelo: Funciona con diferentes LLMs, elevando el rendimiento de GPT-4o y GPT-4.1 a niveles comparables con los mejores modelos de razonamiento actuales.
Aplicaciones más allá de la ciencia: El enfoque es extensible a sectores como finanzas, ingeniería o servicios legales, donde la explicabilidad y el control son críticos.
🎯 Implicaciones
CLIO marca un paso hacia IAs científicas transparentes y ajustables, capaces de mantener la confianza del usuario y optimizar el descubrimiento en entornos donde cada decisión debe ser explicable y reproducible.
Robots
Unitree A2 Stellar Hunter: roboperro industrial con fuerza y velocidad
Unitree lanza el A2 Stellar Hunter, su nuevo robodog de uso industrial. Con un peso total de 37 kg, puede cargar hasta 25 kg durante horas o incluso soportar a una persona de 100 kg sobre su lomo.
Alcanza velocidades de hasta 18 km/h, combinando potencia, resistencia y versatilidad para tareas en entornos exigentes.
Unitree Introducing | Unitree A2 Stellar Hunter 🤩
Total weight: ~37kg | Unloaded range: ~20km
Lighter, Stronger and Faster. Engineered for Industrial Applications.— Unitree (@UnitreeRobotics)
10:06 AM • Aug 5, 2025
Figure entrena a sus robots humanoides… ¡jugando!
Figure ha comenzado a probar sus robots humanoides con juegos interactivos, una forma de entrenar tanto su inteligencia como su coordinación motora fina.
La dificultad de estos juegos aumentará progresivamente, con el objetivo de llevar sus capacidades cognitivas y físicas al siguiente nivel.
We now test our humanoid robots by having its onboard neural network play games that challenge its intelligence and fine motor skills
— Brett Adcock (@adcock_brett)
9:40 PM • Aug 7, 2025