Best-IA Newsletter
Posts
Boletín Semanal Best-IA #101

Boletín Semanal Best-IA #101

Aprende IA, día a día.

Best-IA
21 de julio de 2025

Tutoriales

Cómo Crear un Informe, Dashboard y App Inteligente con Sólo 4 Prompts (Usando Minimax)

¿Imaginas reemplazar el trabajo de un analista, un consultor, un diseñador y un desarrollador sólo con inteligencia artificial?

En este tutorial paso a paso, descubrirás cómo usar un agente de IA como Minimax para transformar una base de datos en un informe ejecutivo completo, una presentación profesional, un dashboard interactivo y una app para tomar decisiones.

Noticias

OpenAI lanza su “ChatGPT Agent”

OpenAI ha lanzado oficialmente ChatGPT Agent, una evolución radical que convierte a ChatGPT en algo más que un chatbot: ahora puede actuar por sí mismo, usando un ordenador virtual para ejecutar tareas completas, desde navegar por la web hasta generar informes complejos o planificar cenas temáticas. Esto marca un antes y un después en la automatización asistida por IA.

🔑 Claves del avance

Unificación de capacidades: pensamiento + acción
ChatGPT combina ahora la navegación web visual, un navegador de texto, terminal, ejecución de código, y conectores a apps como Gmail o GitHub. Así puede, por ejemplo, hacer un benchmark de competidores, generar presentaciones editables y entregar informes con datos actualizados, todo en una misma sesión.
Agente con autonomía supervisada
Aunque la IA puede actuar de forma proactiva, siempre pide permiso antes de ejecutar acciones sensibles (compras, correos, etc.) y permite al usuario interrumpir, tomar el control o pausar cualquier tarea. Esto garantiza transparencia y control total.
Resultados líderes en benchmarks
ChatGPT Agent alcanza el nuevo estado del arte en múltiples pruebas: supera a humanos en tareas de data science (DSBench), modelado financiero y navegación web (BrowseComp, WebArena), con mejoras claras respecto a versiones anteriores como o3 y deep research.
Aplicaciones prácticas inmediatas
Desde actualizar hojas de cálculo con formato intacto, hasta programar reuniones según tu calendario, organizar viajes o planear una cena basada en Romance de los Tres Reinos. El agente trabaja tanto para tareas cotidianas como para procesos de alto valor profesional.
Seguridad y riesgos emergentes
OpenAI reconoce que esta capacidad también introduce nuevos desafíos: el modelo puede ser vulnerable a prompt injections (instrucciones ocultas en sitios web) y a errores con consecuencias reales. Para mitigar esto, han implementado supervisión activa, límites de acceso a datos, confirmación explícita y evaluaciones de bioseguridad más estrictas.
Disponibilidad
El despliegue de ChatGPT Agent comienza hoy para usuarios Pro, Plus y Team, siendo los Pro los primeros en acceder. En las próximas semanas llegará a Enterprise y Education. Los usuarios Pro disponen de 400 mensajes mensuales, mientras que el resto tiene 40, con opciones adicionales mediante créditos. Aún no está disponible en el Espacio Económico Europeo ni Suiza.

🎯 Relevancia y proyección

Este paso representa la transición de los LLMs pasivos a agentes autónomos capaces de ejecutar tareas completas en el mundo real. El potencial para redefinir la productividad, la investigación y la gestión personal/profesional es inmenso, aunque también exige un nuevo marco de seguridad y responsabilidad compartida.

LINK: https://openai.com/index/introducing-chatgpt-agent/

OpenAI casi vence a los humanos en el AtCoder World Tour Finals

La batalla entre humanos y máquinas continúa, y esta vez tuvo lugar en el prestigioso AtCoder World Tour Finals en Tokio. Un nuevo modelo de OpenAI compitió contra los mejores programadores del mundo... y casi los vence a todos, obteniendo el segundo puesto.

🔑 Puntos clave:

El último humano en pie
El campeón fue Psyho, un programador polaco que superó al agente de OpenAI por un margen de 9,5%.
Dos rondas, dos desafíos
El torneo incluyó una ronda algorítmica (5 problemas clásicos en 300 minutos) y una heurística (1 problema NP-hard en 600 minutos), exigiendo tanto precisión como pensamiento lateral.
Modelos colaborativos al acecho
Sakana AI también puso a prueba su agente ALE-Agent V2, un sistema multi-LLM que habría quedado 5º. La colaboración entre modelos pequeños está demostrando gran potencial.
Fortalezas y límites de la IA
Mientras la IA destaca por su velocidad, memoria perfecta y resistencia inagotable, aún le cuesta hacer saltos creativos o adaptarse rápidamente a nuevas estrategias.

🎯 Implicaciones:
Este duelo refuerza que la IA ya rivaliza con los mejores humanos en programación competitiva. Aunque aún necesita creatividad humana para cerrar el juego, no por mucho tiempo. El año que viene, tal vez ya no haya Psyho que valga.

LINK: https://x.com/sama/status/1945540005805658440

🥇 La IA de OpenAI conquista la Olimpiada Matemática Internacional

OpenAI ha anunciado que su nuevo modelo de lenguaje generalista resolvió 5 de los 6 problemas del IMO 2025, alcanzando una puntuación equivalente a una medalla de oro bajo las reglas oficiales de la competencia. Este logro no proviene de un sistema especializado en matemáticas, sino de un modelo de propósito general que incorpora nuevas técnicas de verificación paso a paso y búsqueda eficiente de soluciones.

Este hito marca un punto de inflexión en el desarrollo de inteligencia artificial: por primera vez, una IA logra resolver problemas que requieren demostraciones matemáticas complejas, lógica rigurosa y pensamiento abstracto de alto nivel. Más allá del IMO, esta arquitectura abre la puerta a aplicaciones similares en ciencia, programación y razonamiento formal sin necesidad de entrenamientos específicos por dominio.

Aunque la compañía lanzará GPT-5 en breve, aclaran que se trata de un modelo experimental que integra técnicas de investigación que se usarán en versiones futuras. No esperan liberar públicamente un modelo con el nivel de razonamiento necesario para alcanzar el oro en la IMO en los próximos meses, aunque este avance marca un paso firme hacia una inteligencia general auténtica.

1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).
— Alexander Wei (@alexwei_)
7:50 AM • Jul 19, 2025

🥇 Gemini también logra oro en la Olimpiada Matemática: la carrera del razonamiento AI se intensifica

Google DeepMind ha confirmado que una versión avanzada de Gemini con el modo Deep Think ha alcanzado el nivel de medalla de oro en la IMO 2025, resolviendo 5 de los 6 problemas bajo las mismas condiciones oficiales que los participantes humanos. El modelo obtuvo 35 de 42 puntos posibles, abordando áreas complejas como álgebra, combinatoria, geometría y teoría de números, y produciendo demostraciones completas en lenguaje natural.

A diferencia de enfoques anteriores que requerían traducción a lenguajes formales como Lean, Gemini resolvió los problemas directamente en inglés. Esto fue posible gracias a más tiempo de razonamiento, entrenamiento con datos de pruebas matemáticas y soluciones anteriores, así como la capacidad de explorar múltiples rutas lógicas en paralelo antes de elegir una definitiva. DeepMind ha anunciado que esta versión de Gemini se probará primero con usuarios de confianza antes de llegar a los suscriptores de Google AI Ultra.

LINK: https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/

🗣️ Voxtral: el nuevo rey del reconocimiento de voz llega de la mano de Mistral AI

Mistral AI ha presentado Voxtral, su nuevo modelo de reconocimiento de voz que supera al popular Whisper large-v3 de OpenAI, y además deja atrás a rivales como GPT-4o mini Transcribe, Gemini 2.5 Flash y ElevenLabs Scribe. Con esto, Mistral eleva el listón del ASR (Automatic Speech Recognition) de código abierto.

🔑 Puntos clave:

Superioridad en benchmarks
Voxtral alcanza resultados state-of-the-art en tareas de transcripción en inglés y multilingüe, sobresaliendo en datasets como Mozilla Common Voice.
Transcripción + Comprensión
Más allá de transcribir, permite preguntas y resúmenes directos sobre el contenido de audio, sin necesidad de encadenar modelos adicionales.
Contexto largo
Procesa hasta 32.000 tokens (~30-40 minutos de audio), ideal para entrevistas, podcasts o reuniones extensas sin fragmentación.
Multilingüismo real
Detecta automáticamente el idioma y ofrece transcripciones precisas en varios idiomas, incluyendo español, francés, alemán, hindi e italiano.
Interacción por voz con sistemas
Gracias a su capacidad de function calling desde audio, convierte intenciones habladas en acciones automáticas sobre APIs o software.

🎯 Implicaciones y relevancia
Voxtral redefine los estándares del reconocimiento de voz abierto, acercando la automatización por voz a nuevos niveles de precisión, contexto y utilidad, con un enfoque realmente multilingüe. Ideal para apps globales, asistentes inteligentes y flujos automatizados sin fricción.

LINK: https://mistral.ai/news/voxtral

Hume EVI 3: voz, estilo y lenguaje con IA en tiempo real

Hume ha presentado EVI 3, su nuevo modelo de voz que no solo imita tu tono, sino también tu estilo al hablar y el idioma. Ya disponible vía API o demo web, se integra fácilmente con modelos como Claude 4, Gemini 2.5 o Kimi K2.

Ideal para compañeros virtuales, entrevistas, coaching o educación, EVI 3 permite respuestas naturales y rápidas. También puedes usar Octave, su modelo TTS expresivo, ya desplegado en plataformas como Vapi, Twilio y Vercel.

El soporte para español y alemán llega la próxima semana, seguido de portugués, japonés, francés y más.

2024: Voice Cloning
2025: What about personality cloning?
Hume’s voice AI can now not only mimic your voice but also speaking style and language.
It’s now available via our TTS and new speech-to-speech model, EVI 3, which is also launching today.
— Hume AI (@hume_ai)
5:37 PM • Jul 17, 2025

LTXV: vídeos de 60 segundos generados por IA… en tiempo récord

LTX Video lanza LTXV, el primer modelo open source capaz de generar vídeos nativos de larga duración (hasta 60 segundos), con un nivel de control superior a cualquier alternativa actual.

🔑 Lo que destaca

8× más largo que otros modelos generativos
Hasta 100× más rápido y barato
Corre en GPUs de consumo
Compatible con pose, profundidad y LoRAs de control

Un nuevo estándar para creadores, desarrolladores y herramientas creativas con IA.

60-second AI video generation just got unlocked!
LTXV is the first model to generate native long-form video, with controllability that beats every open source model.
- 8× longer than typical gen video
- 10–100× faster & cheaper
- Runs even on consumer GPUs
- Pose, depth &
— LTX Video (@LTX_Video)
12:49 PM • Jul 16, 2025

🧠 OpenReasoning-Nemotron: Los nuevos modelos destilados por NVIDIA para tareas de razonamiento

NVIDIA ha presentado OpenReasoning-Nemotron, una familia de modelos de lenguaje diseñados específicamente para tareas complejas de razonamiento en matemáticas, ciencia y programación. Destilados del modelo DeepSeek R1 0528 671B, estos modelos de 1.5B, 7B, 14B y 32B parámetros marcan un nuevo estándar de rendimiento en múltiples benchmarks.

🔑 Puntos Clave

1. Modelos optimizados para el razonamiento
Los modelos OpenReasoning-Nemotron se entrenaron exclusivamente con fine-tuning supervisado a partir de datos generados por el potente DeepSeek R1. No utilizan técnicas de refuerzo (RL), lo que demuestra la efectividad de una buena destilación de datos para lograr resultados de última generación.

2. Conjuntos de datos generados masivamente
El entrenamiento se basó en un corpus de 5 millones de soluciones razonadas de alta calidad en matemáticas, código y ciencia. Aunque el dataset completo se publicará más adelante, el código para generarlo y entrenar modelos ya está disponible vía NeMo-Skills.

3. Resultados sobresalientes en benchmarks
El modelo de 32B parámetros alcanzó un 80% en MMLU-PRO y más del 89% en AIME24, superando ampliamente a los modelos anteriores de su clase. Incluso el modelo de 7B muestra un rendimiento notable, lo que lo hace accesible para investigadores con menos recursos computacionales.

4. GenSelect mejora aún más los resultados
Implementando la técnica GenSelect —una combinación de múltiples respuestas generadas y selección de la mejor solución—, los modelos Nemotron-32B alcanzan niveles comparables o superiores a o3 (High) en tareas de razonamiento, especialmente en matemáticas y código.

5. Fundación sólida para investigación futura
Estos modelos ofrecen una excelente base para investigar RL enfocado en razonamiento, técnicas de optimización de tokens y personalización de modelos para tareas específicas. También permiten explorar la eficiencia de inferencia y la combinación de habilidades entre agentes.

🎯 Relevancia e Implicaciones

OpenReasoning-Nemotron impulsa el desarrollo de modelos accesibles, potentes y especializados en razonamiento complejo. Al liberar herramientas, código y modelos de alto rendimiento, NVIDIA refuerza el ecosistema open-source y abre nuevas puertas para la investigación en IA lógica y simbólica.

LINK: https://huggingface.co/blog/nvidia/openreasoning-nemotron

MirageLSD: IA en tiempo real para transformar cualquier vídeo en otro mundo

Decart AI ha presentado MirageLSD, el primer modelo de difusión para livestreams (LSD). Permite transformar en tiempo real —con menos de 40 ms de latencia— cualquier fuente de vídeo: una cámara, una videollamada, una pantalla o incluso un videojuego.

Una puerta abierta a mundos alternativos generados por IA mientras el vídeo se reproduce en directo. Ideal para creadores, streamers y experiencias inmersivas.

Introducing MirageLSD: The First Live-Stream Diffusion (LSD) AI Model
Input any video stream, from a camera or video chat to a computer screen or game, and transform it into any world you desire, in real-time (<40ms latency).
Here’s how it works (w/ demo you can use!):
— Decart (@DecartAI)
8:44 PM • Jul 17, 2025

🛠️ Kiro: El IDE con agentes que piensan como tú

Kiro es una nueva plataforma de desarrollo con IA que transforma cómo pasamos de la idea al producto. Más que un editor con funciones inteligentes, Kiro introduce un enfoque centrado en "specs" (especificaciones) y "hooks" (automatizaciones), lo que lo convierte en un copiloto ideal para construir software de verdad, no solo prototipos rápidos.

🔑 Puntos Clave

De una idea a requisitos detallados
- Con solo un prompt, Kiro genera historias de usuario completas con criterios de aceptación usando EARS. Así convierte suposiciones difusas en especificaciones claras y auditables desde el inicio.
Diseño técnico automatizado
- A partir de las specs, crea documentación técnica: interfaces, esquemas de base de datos, diagramas de flujo y endpoints API. Todo adaptado a tu código base y listo para revisión.
Tareas secuenciadas y trazables
- Genera y ordena tareas técnicas vinculadas a requisitos, incluyendo tests, estados de carga, accesibilidad y diseño responsive. Todo trazable y auditable, con seguimiento visual de progreso.
Hooks que piensan como un senior dev
- Automatiza tareas cuando guardas o creas archivos. Por ejemplo, actualiza tests, documentación o revisa seguridad al hacer commits. Puedes incluso exigir principios como SRP (Single Responsibility Principle) en nuevos componentes.
Todo lo que esperas y más
- Compatible con extensiones de VS Code, integra modelos externos vía MCP y permite chats contextuales con agentes. Incluye reglas para guiar el comportamiento de la IA en todo el proyecto.

🎯 Relevancia e Implicaciones

Kiro representa un paso firme hacia entornos de desarrollo verdaderamente colaborativos entre humanos y agentes de IA. Al incorporar rigor, trazabilidad y automatización desde el diseño hasta la producción, sienta las bases para una nueva era del software guiado por especificaciones y automatización inteligente.

LINK: https://kiro.dev/blog/introducing-kiro/

Robots

Walker S2

La compañía china UBTECH presentó Walker S2, su robot humanoide de próxima generación para usos industriales.
La compañía afirma que es el primer humanoide capaz de cambiar su batería de manera autónoma para garantizar una operación continua las 24 horas del día.

#WalkerS2 - The World's First #HumanoidRobot Capable of Autonomous Battery Swapping.
→ Anthropomorphic Bipedal Locomotion → Autonomous hot-swappable battery system→ Autonomous battery swapping, 24/7 continuous operations
Swarm Intelligence 2.0 is coming soon!
— UBTECH Robotics (@UBTECHRobotics)
9:06 AM • Jul 17, 2025

Reflexiones Finales

OpenAI habla de IA, empleos y economía en su nuevo podcast

En el episodio 3 del podcast de OpenAI, el Chief Economist Ronnie Chatterji y el COO Brad Lightcap analizan el impacto de la inteligencia artificial en el futuro del trabajo y la economía global.

Una conversación clave para entender cómo la IA está reconfigurando industrias, profesiones y modelos económicos.

A Chief Economist and a COO walk into a podcast...
@RonnieChatterji and @bradlightcap talk about the future of jobs and the economy in the age of AI on Episode 3 of the OpenAI podcast, now live.
— OpenAI (@OpenAI)
3:02 PM • Jul 15, 2025