Boletín Semanal Best-IA #119

Aprende IA, día a día.

Tutoriales

Ejemplos de Uso de Google Antigravity

Nuevas funciones en la API de Gemini 3: Tutorial paso a paso

Noticias

Anthropic lanza Claude Opus 4.5: más rápido, más preciso y con pensamiento prolongado

Anthropic ha presentado Claude Opus 4.5, una mejora significativa de su modelo insignia, optimizado para tareas complejas, razonamiento más profundo y una experiencia más interactiva tanto en texto como en visión.

El modelo introduce mejoras en rendimiento, eficiencia y memoria funcional, destacando nuevas capacidades en razonamiento estructurado, generación precisa y análisis de documentos largos.

🔑 Claves del anuncio

  • Mayor capacidad de razonamiento prolongado
    Opus 4.5 mantiene mejor el hilo en tareas multietapa, resoluciones largas y análisis detallados, reduciendo errores acumulativos típicos en respuestas extensas.

  • Rendimiento superior en benchmarks
    Mejora sus puntuaciones en razonamiento, matemáticas, codificación y comprensión, superando a modelos previos de Anthropic y acercándose a la frontera de los modelos top del mercado.

  • Más rápido y más eficiente
    La inferencia es notablemente más veloz, reduciendo la latencia en consultas complejas, lo que permite usarlo en flujos de trabajo más pesados sin perder calidad.

  • Visión y análisis multimodal mejorados
    El modelo analiza imágenes con más precisión, maneja gráficos, tablas, fotos de documentos y realiza descripciones y razonamientos visuales más consistentes.

  • Mejor alineación y seguridad
    Anthropic destaca mejoras en la capacidad del modelo para seguir instrucciones, detectar errores, rechazar solicitudes inseguras y argumentar decisiones.

🎯 Este lanzamiento confirma la competencia directa entre los grandes modelos generalistas, reforzando la tendencia hacia sistemas más rápidos y capaces de sostener razonamientos largos. Marca otro paso en la integración de IA multimodal avanzada en productos cotidianos y acelera la carrera por assistants más fiables y persistentes.

Nuevas funciones del ecosistema Anthropic

Con Claude Opus 4.5, también llegan otras novedades importantes en herramientas, extensiones y productividad para usuarios y desarrolladores.

🔑 Claves del anuncio

  • Conversaciones infinitas en la app de Claude
    Claude resume dinámicamente el contexto anterior, permitiendo mantener chats continuos sin perder coherencia aunque la sesión dure horas o días.

  • Nuevas capacidades para desarrolladores
    Incorporan tool search, programmatic tool calling y ejemplos avanzados de uso de herramientas. Junto con effort control y context compaction, Claude puede ejecutar flujos largos con menos intervención humana.

  • Claude Code llega a la app de escritorio
    Múltiples sesiones paralelas para programar, investigar y actualizar tareas. Plan Mode se refuerza con Opus 4.5, haciendo preguntas clave al inicio y operando luego de forma más autónoma.

  • Claude para Chrome y Excel se amplía

    • La extensión de Chrome se abre a todos los usuarios Max.

    • Claude for Excel entra en beta, permitiendo usar el modelo directamente desde hojas de cálculo.

  • Disponibilidad ampliada
    Opus 4.5 ya está accesible vía API.

🎯 La hoja de ruta de Anthropic anticipa asistentes más autónomos y persistentes, capaces de ejecutar planes largos, operar herramientas reales y mantenerse en contexto durante sesiones extendidas. Esto acelera la convergencia hacia agentes prácticos para trabajo profesional, análisis de código y soporte técnico avanzado.

OpenAI lanza “shopping research” en ChatGPT

OpenAI presenta shopping research, una nueva experiencia integrada en ChatGPT que investiga por ti para ayudarte a elegir el producto adecuado sin tener que revisar decenas de páginas web.

Esta función convierte la búsqueda de productos en una conversación guiada: te hace preguntas, compara opciones en tiempo real y termina creando una guía personalizada de compra basada en tus necesidades y tus preferencias previas.

🔑 Puntos clave

  • Guías de compra personalizadas
    ChatGPT hace preguntas inteligentes sobre presupuesto, uso, características o gustos, y construye un buyer’s guide adaptado a cada usuario.

  • Investigación profunda y actualizada
    El sistema analiza precios, disponibilidad, especificaciones e imágenes directamente de sitios web fiables, descartando fuentes de baja calidad.

  • Interacción en tiempo real
    Puedes marcar productos como “No me interesa” o “Más como este” para que la búsqueda se refine dinámicamente mientras avanza.

  • Integración con Pulse
    Para usuarios Pro, Pulse podrá sugerir guías de compra relevantes basadas en conversaciones anteriores, como accesorios si estuviste hablando de e-bikes.

  • Nuevo modelo especializado
    Está impulsado por una versión de GPT-5 mini entrenada con refuerzo específicamente para tareas de shopping, enfocada en precisión, citación y síntesis de múltiples fuentes.

🎯 Esta novedad refuerza el camino hacia agentes especializados capaces de ejecutar investigaciones complejas de forma autónoma. Muestra cómo los modelos empiezan a entender preferencias persistentes, integrar fuentes en tiempo real y producir análisis prácticos, acercando la IA a funciones de asistente personal verdaderamente útil en decisiones cotidianas.

ChatGPT Voice ahora integrado en el chat

OpenAI ha integrado ChatGPT Voice directamente en la vista de chat: puedes hablar, ver respuestas en tiempo real y recibir imágenes o mapas sin cambiar de modo. Está disponible en móvil y web; solo requiere actualizar la app.

DeepSeekMath-V2: el primer modelo open-source que obtiene una medalla de oro en la IMO

DeepSeek irrumpe de nuevo con Math-V2, el primer modelo open source que alcanza rendimiento de medalla de oro en la International Mathematical Olympiad. Esto permite, por primera vez, descargar libremente un sistema con razonamiento matemático de élite y estudiarlo, modificarlo o acelerarlo sin restricciones.

🔑 Claves ampliadas

  • Arquitectura basada en verificación rigurosa
    El sistema combina:
    1) un generador que escribe pruebas completas,
    2) un verificador que evalúa la coherencia lógica (0 / 0.5 / 1),
    3) un meta-verificador que comprueba si la revisión está bien hecha.
    Esto evita premiar respuestas correctas con razonamientos rotos.

  • Entrenamiento iterativo tipo “agente científico”
    DeepSeek usa un bucle de propuesta → revisión → refinamiento.
    El modelo resuelve problemas, revisa sus propios pasos, recibe evaluaciones, corrige y vuelve a probar.
    Con miles de ciclos, aprende a producir pruebas cada vez más fiables y a detectar fallos sutiles.

  • Rendimiento competitivo con humanos top
    El sistema alcanza 118/120 en Putnam 2024 y nivel oro en IMO 2025, superando ampliamente modelos del mismo tamaño entrenados solo con respuestas finales.

  • Aprendizaje desde soluciones humanas y autocorrección masiva
    Parte de soluciones reales evaluadas por humanos y luego genera miles de variantes autocriticadas por los revisores automáticos. Esto expande el dataset con nuevos pasos lógicos coherentes y detecta errores habituales.

  • Prueba del método para otros dominios
    El enfoque —generador + dos verificadores + refinamiento autónomo— se plantea como plantilla general para tareas estructuradas: derecho, ingeniería, física, programación competitiva o análisis financiero complejo.

🎯 DeepSeekMath-V2 demuestra que los LLM pueden transformarse en razonadores verificables mediante ciclos automáticos de generación y crítica. Es un anticipo de agentes especializados capaces de producir, revisar y validar soluciones complejas con estándares similares a los de expertos humanos.

Aristotle resuelve de manera autónoma un problema abierto desde hace 30 años

El modelo “Aristotle”, de Harmonic Math, ha demostrado en Lean el Problema de Erdős #124, abierto desde hace casi tres décadas. Ejecutado por Boris Alexeev con una versión beta mejorada, el sistema logró la prueba de forma autónoma. Este avance, ligado al auge de modelos como DeepSeekMath-V2, apunta a una inminente “superinteligencia matemática” capaz de acelerar de forma radical la investigación en matemáticas y disciplinas dependientes.

Tencent impulsa la generación de vídeo con HunyuanVideo-1.5

Tencent ha dado un paso importante en vídeo generativo con HunyuanVideo-1.5, un modelo sorprendentemente compacto —8.3B parámetros— que aun así alcanza calidad y coherencia de movimiento al nivel de los mejores modelos del mercado. Su principal logro: ofrecer rendimiento “state-of-the-art” sin necesidad de hardware de gama alta.

🔑 Detalles ampliados

  • Arquitectura optimizada para eficiencia
    Utiliza un DiT avanzado con Selective & Sliding Tile Attention (SSTA), que reduce el coste computacional manteniendo detalles finos y movimiento estable.

  • Comprensión bilingüe mejorada
    Un glyph-aware text encoder permite interpretar mejor prompts en chino e inglés, aumentando fidelidad semántica y control creativo.

  • Entrenamiento progresivo + post-training
    Un pipeline meticuloso de preentrenamiento y ajuste posterior asegura estabilidad de movimiento y consistencia escena a escena.

  • Super-resolución de vídeo integrada
    Incluye un módulo especializado que permite generar o escalar vídeo de forma eficiente sin sacrificar calidad.

  • Framework unificado
    Soporta texto→vídeo e imagen→vídeo en diversas duraciones y resoluciones, desde clips cortos hasta secuencias largas más cinematográficas.

  • Código y pesos open-source
    Tencent libera la implementación completa, facilitando investigación, afinado y despliegue en GPUs de consumo, democratizando la creación de vídeo avanzado.

🎯 HunyuanVideo-1.5 demuestra que la próxima ola de modelos de vídeo será más ligera, más rápida y más accesible, acelerando la creatividad y abriendo el camino a herramientas profesionales que podrán ejecutarse incluso fuera de la nube.

Suno se asocia con Warner Music Group para una nueva era de música interactiva

Suno anuncia una alianza estratégica con Warner Music Group (WMG) para impulsar una nueva generación de modelos musicales y experiencias interactivas entre fans, creadores y artistas.

Suno, con casi 100 millones de usuarios, busca combinar sus herramientas de creación con el catálogo y el talento de WMG para transformar cómo se hace, consume y comparte la música.

🔑 Claves del anuncio

  • Una plataforma más rica y colaborativa
    La alianza permitirá nuevas funciones creativas, experiencias interactivas y colaboraciones con artistas reales, sin perder la esencia accesible de Suno.

  • Participación de artistas WMG (opt-in)
    Algunos artistas permitirán el uso de su nombre, imagen, voz y estilo para experiencias de creación musical, con compensación integrada para ellos.

  • Cambios en descargas y planes de pago
    Las descargas seguirán existiendo, pero solo para cuentas de pago con un número mensual limitado.
    Suno Studio seguirá ofreciendo descargas ilimitadas y seguirá siendo el entorno profesional intacto.

  • Nuevas experiencias para fans
    Llegarán formas interactivas de “crear con” artistas que participen, abriendo vías de ingresos y nuevos modos de relación artista-fan.

🎯 La alianza señala un cambio profundo: los modelos musicales se entrenarán con catálogos licenciados y las majors empiezan a integrarse en la IA generativa. Esto acelera el futuro de la música interactiva y redefine la relación entre creadores, fans y artistas mediante modelos que combinan creatividad abierta y derechos gestionados.0

“Genesis Mission”: la apuesta de EE. UU. por una plataforma nacional de IA para acelerar la ciencia

La Casa Blanca ha anunciado Genesis Mission, una iniciativa para crear una plataforma nacional de inteligencia artificial capaz de usar supercomputación, grandes datasets federales y colaboración multisectorial para automatizar investigación científica y acelerar descubrimientos en energía, salud, materiales y seguridad nacional.

🔑 Claves del anuncio

  • Plataforma integrada de IA y supercomputación
    Reunirá la potencia HPC del Departamento de Energía con los vastos datos científicos federales, creando un entorno unificado para investigación avanzada.

  • Modelos fundacionales científicos y agentes autónomos
    Se entrenarán modelos especializados capaces de diseñar experimentos, ejecutar simulaciones, predecir resultados y optimizar procesos completos de investigación.

  • Coordinación nacional entre sectores
    Participan el DOE, laboratorios nacionales, universidades, empresas privadas y el National Science and Technology Council, bajo orden ejecutiva del presidente.

  • Tecnologías implicadas
    Supercomputación, IA especializada, agentes científicos autónomos y potenciales laboratorios robotizados para experimentación automatizada.

  • Áreas de impacto estratégico
    Energía (fusión/fisión, redes), biotecnología y salud, materiales críticos y semiconductores, ciencia fundamental y seguridad nacional.

🎯 Esta misión refleja la transición de los gobiernos hacia infraestructuras científicas impulsadas por IA, donde agentes especializados y modelos fundacionales reconfiguran la investigación. Si funciona, podría duplicar la productividad científica estadounidense y consolidar una nueva era de descubrimiento acelerado por inteligencia artificial.

El MIT estima que la IA ya puede reemplazar el 11,7% del empleo en EE. UU.

Un nuevo estudio del Instituto Tecnológico de Massachusetts expone que, a día de hoy, la IA ya podría sustituir al 11,7% de la fuerza laboral estadounidense, afectando hasta 1,2 billones de dólares en salarios en sectores como finanzas, salud, RR. HH., logística y trabajos administrativos.

El nuevo Iceberg Index permite simular el impacto por código postal para anticipar formación y planes de recualificación antes de que ocurran los desplazamientos laborales.

McKinsey: la IA podría reemplazar hasta el 40% de los empleos en EE. UU.

Según un nuevo informe de McKinsey, la tecnología actual —agentes de IA y robots— ya está preparada para automatizar 57% de las horas de trabajo en EE. UU., lo que podría traducirse en una sustitución potencial del 40% de los empleos.

Robots

Agile One: el nuevo humanoide de Agile Robotics

La alemana Agile Robotics presenta Agile One, un humanoide de tamaño completo capaz de manipular tornillos diminutos, usar pantallas táctiles y desplazarse “sintiendo” su entorno. Su entrenamiento se realizó íntegramente en el mundo real usando IA.

China despliega humanoides Walker S2 para patrullar su frontera

China empezará a usar robots humanoides Walker S2 en la frontera con Vietnam para asistencia a viajeros, inspecciones, patrullas y logística. El modelo destaca por su batería intercambiable automática, 52 grados de libertad y planificación autónoma vía BrainNet 2.0. UBTech ya acumula 1.1 mil millones de yuanes en pedidos, prevé entregar 500 unidades este año y escalar producción hasta 10,000 anuales para 2027. Los humanoides dejan de ser prototipos: se convierten en infraestructura desplegada.

Reflexiones Finales

Ilya Sutskever : La AGI será como un “súperaprendiz”, no un oráculo