Best-IA Newsletter
Posts
Boletín Semanal Best-IA #119

Boletín Semanal Best-IA #119

Aprende IA, día a día.

Best-IA
1 de diciembre de 2025

Best-IA. ¡Aprende IA, día a día!

Tutoriales

Ejemplos de Uso de Google Antigravity

Nuevas funciones en la API de Gemini 3: Tutorial paso a paso

Noticias

Anthropic lanza Claude Opus 4.5: más rápido, más preciso y con pensamiento prolongado

Anthropic ha presentado Claude Opus 4.5, una mejora significativa de su modelo insignia, optimizado para tareas complejas, razonamiento más profundo y una experiencia más interactiva tanto en texto como en visión.

El modelo introduce mejoras en rendimiento, eficiencia y memoria funcional, destacando nuevas capacidades en razonamiento estructurado, generación precisa y análisis de documentos largos.

🔑 Claves del anuncio

Mayor capacidad de razonamiento prolongado
Opus 4.5 mantiene mejor el hilo en tareas multietapa, resoluciones largas y análisis detallados, reduciendo errores acumulativos típicos en respuestas extensas.
Rendimiento superior en benchmarks
Mejora sus puntuaciones en razonamiento, matemáticas, codificación y comprensión, superando a modelos previos de Anthropic y acercándose a la frontera de los modelos top del mercado.
Más rápido y más eficiente
La inferencia es notablemente más veloz, reduciendo la latencia en consultas complejas, lo que permite usarlo en flujos de trabajo más pesados sin perder calidad.
Visión y análisis multimodal mejorados
El modelo analiza imágenes con más precisión, maneja gráficos, tablas, fotos de documentos y realiza descripciones y razonamientos visuales más consistentes.
Mejor alineación y seguridad
Anthropic destaca mejoras en la capacidad del modelo para seguir instrucciones, detectar errores, rechazar solicitudes inseguras y argumentar decisiones.

🎯 Este lanzamiento confirma la competencia directa entre los grandes modelos generalistas, reforzando la tendencia hacia sistemas más rápidos y capaces de sostener razonamientos largos. Marca otro paso en la integración de IA multimodal avanzada en productos cotidianos y acelera la carrera por assistants más fiables y persistentes.

LINK: https://www.anthropic.com/news/claude-opus-4-5
System Card: https://assets.anthropic.com/m/64823ba7485345a7/Claude-Opus-4-5-System-Card.pdf

Nuevas funciones del ecosistema Anthropic

Con Claude Opus 4.5, también llegan otras novedades importantes en herramientas, extensiones y productividad para usuarios y desarrolladores.

🔑 Claves del anuncio

Conversaciones infinitas en la app de Claude
Claude resume dinámicamente el contexto anterior, permitiendo mantener chats continuos sin perder coherencia aunque la sesión dure horas o días.
Nuevas capacidades para desarrolladores
Incorporan tool search, programmatic tool calling y ejemplos avanzados de uso de herramientas. Junto con effort control y context compaction, Claude puede ejecutar flujos largos con menos intervención humana.
Claude Code llega a la app de escritorio
Múltiples sesiones paralelas para programar, investigar y actualizar tareas. Plan Mode se refuerza con Opus 4.5, haciendo preguntas clave al inicio y operando luego de forma más autónoma.
Claude para Chrome y Excel se amplía
- La extensión de Chrome se abre a todos los usuarios Max.
- Claude for Excel entra en beta, permitiendo usar el modelo directamente desde hojas de cálculo.
Disponibilidad ampliada
Opus 4.5 ya está accesible vía API.

🎯 La hoja de ruta de Anthropic anticipa asistentes más autónomos y persistentes, capaces de ejecutar planes largos, operar herramientas reales y mantenerse en contexto durante sesiones extendidas. Esto acelera la convergencia hacia agentes prácticos para trabajo profesional, análisis de código y soporte técnico avanzado.

OpenAI lanza “shopping research” en ChatGPT

OpenAI presenta shopping research, una nueva experiencia integrada en ChatGPT que investiga por ti para ayudarte a elegir el producto adecuado sin tener que revisar decenas de páginas web.

Esta función convierte la búsqueda de productos en una conversación guiada: te hace preguntas, compara opciones en tiempo real y termina creando una guía personalizada de compra basada en tus necesidades y tus preferencias previas.

🔑 Puntos clave

Guías de compra personalizadas
ChatGPT hace preguntas inteligentes sobre presupuesto, uso, características o gustos, y construye un buyer’s guide adaptado a cada usuario.
Investigación profunda y actualizada
El sistema analiza precios, disponibilidad, especificaciones e imágenes directamente de sitios web fiables, descartando fuentes de baja calidad.
Interacción en tiempo real
Puedes marcar productos como “No me interesa” o “Más como este” para que la búsqueda se refine dinámicamente mientras avanza.
Integración con Pulse
Para usuarios Pro, Pulse podrá sugerir guías de compra relevantes basadas en conversaciones anteriores, como accesorios si estuviste hablando de e-bikes.
Nuevo modelo especializado
Está impulsado por una versión de GPT-5 mini entrenada con refuerzo específicamente para tareas de shopping, enfocada en precisión, citación y síntesis de múltiples fuentes.

🎯 Esta novedad refuerza el camino hacia agentes especializados capaces de ejecutar investigaciones complejas de forma autónoma. Muestra cómo los modelos empiezan a entender preferencias persistentes, integrar fuentes en tiempo real y producir análisis prácticos, acercando la IA a funciones de asistente personal verdaderamente útil en decisiones cotidianas.

LINK: https://openai.com/index/chatgpt-shopping-research/

ChatGPT Voice ahora integrado en el chat

OpenAI ha integrado ChatGPT Voice directamente en la vista de chat: puedes hablar, ver respuestas en tiempo real y recibir imágenes o mapas sin cambiar de modo. Está disponible en móvil y web; solo requiere actualizar la app.

— (@)

DeepSeekMath-V2: el primer modelo open-source que obtiene una medalla de oro en la IMO

DeepSeek irrumpe de nuevo con Math-V2, el primer modelo open source que alcanza rendimiento de medalla de oro en la International Mathematical Olympiad. Esto permite, por primera vez, descargar libremente un sistema con razonamiento matemático de élite y estudiarlo, modificarlo o acelerarlo sin restricciones.

🔑 Claves ampliadas

Arquitectura basada en verificación rigurosa
El sistema combina:
1) un generador que escribe pruebas completas,
2) un verificador que evalúa la coherencia lógica (0 / 0.5 / 1),
3) un meta-verificador que comprueba si la revisión está bien hecha.
Esto evita premiar respuestas correctas con razonamientos rotos.
Entrenamiento iterativo tipo “agente científico”
DeepSeek usa un bucle de propuesta → revisión → refinamiento.
El modelo resuelve problemas, revisa sus propios pasos, recibe evaluaciones, corrige y vuelve a probar.
Con miles de ciclos, aprende a producir pruebas cada vez más fiables y a detectar fallos sutiles.
Rendimiento competitivo con humanos top
El sistema alcanza 118/120 en Putnam 2024 y nivel oro en IMO 2025, superando ampliamente modelos del mismo tamaño entrenados solo con respuestas finales.
Aprendizaje desde soluciones humanas y autocorrección masiva
Parte de soluciones reales evaluadas por humanos y luego genera miles de variantes autocriticadas por los revisores automáticos. Esto expande el dataset con nuevos pasos lógicos coherentes y detecta errores habituales.
Prueba del método para otros dominios
El enfoque —generador + dos verificadores + refinamiento autónomo— se plantea como plantilla general para tareas estructuradas: derecho, ingeniería, física, programación competitiva o análisis financiero complejo.

🎯 DeepSeekMath-V2 demuestra que los LLM pueden transformarse en razonadores verificables mediante ciclos automáticos de generación y crítica. Es un anticipo de agentes especializados capaces de producir, revisar y validar soluciones complejas con estándares similares a los de expertos humanos.

PAPER: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

Aristotle resuelve de manera autónoma un problema abierto desde hace 30 años

El modelo “Aristotle”, de Harmonic Math, ha demostrado en Lean el Problema de Erdős #124, abierto desde hace casi tres décadas. Ejecutado por Boris Alexeev con una versión beta mejorada, el sistema logró la prueba de forma autónoma. Este avance, ligado al auge de modelos como DeepSeekMath-V2, apunta a una inminente “superinteligencia matemática” capaz de acelerar de forma radical la investigación en matemáticas y disciplinas dependientes.

LINK: https://www.erdosproblems.com/forum/thread/124#post-1892
PAPER: https://arxiv.org/abs/2510.01346

Tencent impulsa la generación de vídeo con HunyuanVideo-1.5

Tencent ha dado un paso importante en vídeo generativo con HunyuanVideo-1.5, un modelo sorprendentemente compacto —8.3B parámetros— que aun así alcanza calidad y coherencia de movimiento al nivel de los mejores modelos del mercado. Su principal logro: ofrecer rendimiento “state-of-the-art” sin necesidad de hardware de gama alta.

🔑 Detalles ampliados

Arquitectura optimizada para eficiencia
Utiliza un DiT avanzado con Selective & Sliding Tile Attention (SSTA), que reduce el coste computacional manteniendo detalles finos y movimiento estable.
Comprensión bilingüe mejorada
Un glyph-aware text encoder permite interpretar mejor prompts en chino e inglés, aumentando fidelidad semántica y control creativo.
Entrenamiento progresivo + post-training
Un pipeline meticuloso de preentrenamiento y ajuste posterior asegura estabilidad de movimiento y consistencia escena a escena.
Super-resolución de vídeo integrada
Incluye un módulo especializado que permite generar o escalar vídeo de forma eficiente sin sacrificar calidad.
Framework unificado
Soporta texto→vídeo e imagen→vídeo en diversas duraciones y resoluciones, desde clips cortos hasta secuencias largas más cinematográficas.
Código y pesos open-source
Tencent libera la implementación completa, facilitando investigación, afinado y despliegue en GPUs de consumo, democratizando la creación de vídeo avanzado.

🎯 HunyuanVideo-1.5 demuestra que la próxima ola de modelos de vídeo será más ligera, más rápida y más accesible, acelerando la creatividad y abriendo el camino a herramientas profesionales que podrán ejecutarse incluso fuera de la nube.

— (@)

PAPER: https://huggingface.co/papers/2511.18870

Suno se asocia con Warner Music Group para una nueva era de música interactiva

Suno anuncia una alianza estratégica con Warner Music Group (WMG) para impulsar una nueva generación de modelos musicales y experiencias interactivas entre fans, creadores y artistas.

Suno, con casi 100 millones de usuarios, busca combinar sus herramientas de creación con el catálogo y el talento de WMG para transformar cómo se hace, consume y comparte la música.

🔑 Claves del anuncio

Una plataforma más rica y colaborativa
La alianza permitirá nuevas funciones creativas, experiencias interactivas y colaboraciones con artistas reales, sin perder la esencia accesible de Suno.
Participación de artistas WMG (opt-in)
Algunos artistas permitirán el uso de su nombre, imagen, voz y estilo para experiencias de creación musical, con compensación integrada para ellos.
Cambios en descargas y planes de pago
Las descargas seguirán existiendo, pero solo para cuentas de pago con un número mensual limitado.
Suno Studio seguirá ofreciendo descargas ilimitadas y seguirá siendo el entorno profesional intacto.
Nuevas experiencias para fans
Llegarán formas interactivas de “crear con” artistas que participen, abriendo vías de ingresos y nuevos modos de relación artista-fan.

🎯 La alianza señala un cambio profundo: los modelos musicales se entrenarán con catálogos licenciados y las majors empiezan a integrarse en la IA generativa. Esto acelera el futuro de la música interactiva y redefine la relación entre creadores, fans y artistas mediante modelos que combinan creatividad abierta y derechos gestionados.0

LINK: https://suno.com/blog/wmg-partnership

“Genesis Mission”: la apuesta de EE. UU. por una plataforma nacional de IA para acelerar la ciencia

La Casa Blanca ha anunciado Genesis Mission, una iniciativa para crear una plataforma nacional de inteligencia artificial capaz de usar supercomputación, grandes datasets federales y colaboración multisectorial para automatizar investigación científica y acelerar descubrimientos en energía, salud, materiales y seguridad nacional.

🔑 Claves del anuncio

Plataforma integrada de IA y supercomputación
Reunirá la potencia HPC del Departamento de Energía con los vastos datos científicos federales, creando un entorno unificado para investigación avanzada.
Modelos fundacionales científicos y agentes autónomos
Se entrenarán modelos especializados capaces de diseñar experimentos, ejecutar simulaciones, predecir resultados y optimizar procesos completos de investigación.
Coordinación nacional entre sectores
Participan el DOE, laboratorios nacionales, universidades, empresas privadas y el National Science and Technology Council, bajo orden ejecutiva del presidente.
Tecnologías implicadas
Supercomputación, IA especializada, agentes científicos autónomos y potenciales laboratorios robotizados para experimentación automatizada.
Áreas de impacto estratégico
Energía (fusión/fisión, redes), biotecnología y salud, materiales críticos y semiconductores, ciencia fundamental y seguridad nacional.

🎯 Esta misión refleja la transición de los gobiernos hacia infraestructuras científicas impulsadas por IA, donde agentes especializados y modelos fundacionales reconfiguran la investigación. Si funciona, podría duplicar la productividad científica estadounidense y consolidar una nueva era de descubrimiento acelerado por inteligencia artificial.

LINK: https://www.whitehouse.gov/presidential-actions/2025/11/launching-the-genesis-mission/

El MIT estima que la IA ya puede reemplazar el 11,7% del empleo en EE. UU.

Un nuevo estudio del Instituto Tecnológico de Massachusetts expone que, a día de hoy, la IA ya podría sustituir al 11,7% de la fuerza laboral estadounidense, afectando hasta 1,2 billones de dólares en salarios en sectores como finanzas, salud, RR. HH., logística y trabajos administrativos.

El nuevo Iceberg Index permite simular el impacto por código postal para anticipar formación y planes de recualificación antes de que ocurran los desplazamientos laborales.

LINK: https://iceberg.mit.edu/report.pdf

McKinsey: la IA podría reemplazar hasta el 40% de los empleos en EE. UU.

Según un nuevo informe de McKinsey, la tecnología actual —agentes de IA y robots— ya está preparada para automatizar 57% de las horas de trabajo en EE. UU., lo que podría traducirse en una sustitución potencial del 40% de los empleos.

LINK: https://www.thetimes.com/business/economics/article/ai-could-replace-half-of-american-jobs-says-report-fbr8glxj2

Robots

Agile One: el nuevo humanoide de Agile Robotics

La alemana Agile Robotics presenta Agile One, un humanoide de tamaño completo capaz de manipular tornillos diminutos, usar pantallas táctiles y desplazarse “sintiendo” su entorno. Su entrenamiento se realizó íntegramente en el mundo real usando IA.

LINK: https://www.agile-robots.com/en/news/detail/agile-robots-launches-humanoid-robot-for-industry-agile-one/

China despliega humanoides Walker S2 para patrullar su frontera

China empezará a usar robots humanoides Walker S2 en la frontera con Vietnam para asistencia a viajeros, inspecciones, patrullas y logística. El modelo destaca por su batería intercambiable automática, 52 grados de libertad y planificación autónoma vía BrainNet 2.0. UBTech ya acumula 1.1 mil millones de yuanes en pedidos, prevé entregar 500 unidades este año y escalar producción hasta 10,000 anuales para 2027. Los humanoides dejan de ser prototipos: se convierten en infraestructura desplegada.

LINK: https://interestingengineering.com/innovation/ubtech-secures-us37-million-deal

Boletín Semanal Best-IA #119

Aprende IA, día a día.

Tutoriales

Ejemplos de Uso de Google Antigravity

Nuevas funciones en la API de Gemini 3: Tutorial paso a paso

Noticias

Anthropic lanza Claude Opus 4.5: más rápido, más preciso y con pensamiento prolongado

Nuevas funciones del ecosistema Anthropic

OpenAI lanza “shopping research” en ChatGPT

ChatGPT Voice ahora integrado en el chat

DeepSeekMath-V2: el primer modelo open-source que obtiene una medalla de oro en la IMO

Aristotle resuelve de manera autónoma un problema abierto desde hace 30 años

Tencent impulsa la generación de vídeo con HunyuanVideo-1.5

Suno se asocia con Warner Music Group para una nueva era de música interactiva

“Genesis Mission”: la apuesta de EE. UU. por una plataforma nacional de IA para acelerar la ciencia

El MIT estima que la IA ya puede reemplazar el 11,7% del empleo en EE. UU.

McKinsey: la IA podría reemplazar hasta el 40% de los empleos en EE. UU.

Robots

Agile One: el nuevo humanoide de Agile Robotics

China despliega humanoides Walker S2 para patrullar su frontera

Reflexiones Finales

Ilya Sutskever : La AGI será como un “súperaprendiz”, no un oráculo