Boletín Semanal Best-IA #111

Aprende IA, día a día

Tutoriales

Recursos de OpenAI para mejorar tus agentes de IA

  • 📘 Guía de Context Engineering (28 páginas): enseña cuándo recortar, resumir, prevenir el drift y protegerte contra el context poisoning.
    👉 Ver guía

  • 🧪 Cookbook oficial de OpenAI: colección práctica de recetas, técnicas y ejemplos para trabajar con modelos de OpenAI.
    👉 Explorar cookbook

  • 💼 Prompt Packs: más de 300 prompts adaptables para departamentos como IT, HR, ventas o producto.
    👉 Acceder a los packs

21 cosas nuevas para las que deberías usar IA

Noticias

Sora 2: video realista con audio sincronizado y “Cameos”

OpenAI lanzó Sora 2, su nuevo modelo de generación de video que ahora incluye audio y diálogo sincronizados, junto con una app social que permite crear, mezclar e insertarse en videos mediante la función “Cameos”.

🔑 Puntos clave:

  • Audio y video integrados: Sora 2 genera videos de 5 a 10 segundos con sonido y diálogos sincronizados, añadiendo realismo a escenas con múltiples estilos y cambios complejos.

  • Mejor física y coherencia: el modelo muestra mejoras notables en la simulación del movimiento y las interacciones físicas, ofreciendo resultados más naturales y consistentes.

  • Función Cameos: los usuarios pueden grabar su imagen y aparecer en videos generados por IA, potenciando la creatividad y el contenido viral.

  • Nueva app social: disponible gratuitamente en EE. UU. y Canadá con límites de uso; los suscriptores Pro acceden a Sora 2 Pro y tendrán próximamente API.

  • Potencial viral: la integración de video, sonido y presencia humana apunta a un nuevo tipo de plataforma creativa impulsada por IA.

🎯 Sora 2 amplía los límites de la generación audiovisual con IA, combinando realismo técnico y participación social, marcando un paso clave hacia experiencias creativas interactivas y personalizadas.

ChatGPT ahora también compra por ti: llega Instant Checkout

OpenAI lanza Instant Checkout en colaboración con Etsy, Shopify y Stripe, permitiendo a los usuarios de ChatGPT comprar directamente desde la conversación.

🔑 Puntos clave

  • 🧠 ChatGPT ya ayudaba a decidir qué comprar, ahora finaliza la compra por ti.

  • 🛍️ Funciona con Etsy (EE.UU.) y llegará pronto a más de 1 millón de tiendas Shopify.

  • 🔓 Agentic Commerce Protocol ha sido liberado como código abierto, para que más desarrolladores lo integren.

  • 💳 Integra pagos usando la infraestructura de Stripe.

  • 👥 Disponible para usuarios Free, Plus y Pro de EE.UU.

🎯 Esta función lleva la IA un paso más allá: de asistente conversacional a agente transaccional, capaz de ejecutar compras reales en tu nombre.

OpenAI lanza controles parentales para ChatGPT

OpenAI introduce controles parentales en ChatGPT, permitiendo a padres y adolescentes enlazar sus cuentas para aplicar límites, reducir riesgos y personalizar el uso de la IA en el hogar.

🔑 Puntos clave

  • Padres pueden vincular cuentas con sus hijos adolescentes para activar salvaguardas automáticas.

  • Opciones configurables incluyen:

    • Filtrado de contenido sensible

    • Activar o desactivar la memoria de ChatGPT

    • Participación en el entrenamiento del modelo

    • Establecer “horas silenciosas”

    • Bloquear voz o generación de imágenes

  • La privacidad se respeta: los padres no ven las conversaciones, salvo en casos de riesgo grave detectado por los sistemas.

  • El adolescente debe aceptar la invitación para activar el vínculo.

  • Se lanza una página de recursos para ayudar a las familias a gestionar el uso responsable.

  • LINK: https://chatgpt.com/parent-resources

Claude Sonnet 4.5: el nuevo referente en codificación y agentes complejos

Anthropic presentó Claude Sonnet 4.5, su modelo más avanzado en codificación, razonamiento y uso de computadoras, reforzando su posición en la construcción de agentes inteligentes.

🔑 Puntos clave:

  • Mejor en programación y agentes: Sonnet 4.5 se posiciona como el modelo líder en codificación, con avances notables en razonamiento matemático y ejecución de agentes complejos.

  • Nuevas herramientas para desarrolladores: lanzamiento de Claude Code renovado, con interfaz de terminal mejorada, extensión para VS Code y sistema de checkpoints para ejecutar tareas largas con opción de retroceder al instante.

  • Funciones avanzadas en API: incorporación de context editing para limpiar contexto obsoleto y de la memory tool para almacenar y consultar información fuera de la ventana de contexto.

  • Ampliación de accesibilidad: disponible en la plataforma de desarrolladores de Claude, además de Amazon Bedrock y Google Cloud Vertex AI, manteniendo el mismo precio que Sonnet 4.

🎯 Claude Sonnet 4.5 refuerza el estándar en IA para programación y agentes inteligentes, consolidando un entorno más robusto y práctico para desarrolladores en tareas de gran escala.

Zhipu AI lanza GLM-4.6: un modelo abierto con gran memoria y eficiencia

Zhipu AI presentó GLM-4.6, su nuevo modelo de lenguaje abierto, posicionado como alternativa competitiva frente a Claude Sonnet 4.

🔑 Puntos clave:

  • Más memoria de contexto: pasa de 128K a 200K tokens, un aumento del 56% que permite manejar proyectos largos, trazas complejas de herramientas y sesiones de navegación extensas en una sola ejecución.

  • Eficiencia mejorada: reduce en un 15% el uso de tokens respecto a la versión 4.5 y en un 30% frente a algunos modelos locales, disminuyendo costos y latencia en bucles largos sin caché.

  • Mejor integración y estilo: la planificación multi-paso se ejecuta con mayor fiabilidad, y la escritura o role-play siguen instrucciones de estilo con más precisión.

  • Rendimiento competitivo: en pruebas de tareas multi-turno, alcanza un 48.6% de victorias frente a Claude Sonnet 4, con 9.5% de empates.

  • Apertura y accesibilidad: los pesos están disponibles bajo licencia MIT en Hugging Face y ModelScope, compatibles con vLLM, SGLang y varias plataformas de agentes.

🎯 GLM-4.6 fortalece el ecosistema open-source al ofrecer gran contexto y eficiencia para agentes y codificación, aunque quienes busquen la máxima precisión en programación aún podrían preferir alternativas propietarias como Sonnet 4.5.

DeepSeek lanza V3.2-Exp: eficiencia con Sparse Attention y precios reducidos

DeepSeek presentó V3.2-Exp, un modelo experimental que introduce DeepSeek Sparse Attention (DSA) para optimizar rendimiento y costos en contextos largos.

🔑 Puntos clave:

  • Nueva técnica de atención: DSA permite una atención dispersa de grano fino, acelerando el entrenamiento y la inferencia en tareas de largo contexto sin afectar la calidad de salida.

  • Rendimiento estable: las pruebas muestran resultados comparables a la versión anterior (V3.1-Terminus), manteniendo la solidez mientras gana eficiencia.

  • Reducción de coste: el precio de la API un 50%, ofreciendo acceso más económico a desarrolladores y empresas.

  • Disponibilidad abierta: el modelo ya está activo en la App, Web y API, y sus pesos están publicados en Hugging Face junto a un informe técnico en GitHub.

🎯 DeepSeek V3.2-Exp democratiza el acceso a modelos eficientes y de gran contexto, impulsando la adopción de IA avanzada con menor costo computacional y económico.

Tinker: una API para experimentar y afinar modelos de lenguaje

Thinking Machines Lab presentó Tinker, una nueva API que facilita el fine-tuning de modelos de lenguaje, ofreciendo control total sobre algoritmos y datos mientras automatiza la complejidad del entrenamiento distribuido.

🔑 Puntos clave:

  • Flexibilidad total para investigadores: Tinker permite ajustar desde modelos pequeños hasta grandes arquitecturas mixture-of-experts como Qwen-235B-A22B, con solo cambiar una línea de código.

  • Infraestructura gestionada: el sistema corre en los clústeres internos de Thinking Machines, manejando asignación de recursos, programación y recuperación de fallos, lo que agiliza el inicio de experimentos.

  • Eficiencia y bajo costo: emplea LoRA para compartir cómputo entre múltiples sesiones de entrenamiento, reduciendo significativamente los costos.

  • Herramientas abiertas: junto con la API, se lanza la Tinker Cookbook, una biblioteca open source con implementaciones modernas de métodos de post-training.

  • Adopción temprana: equipos de Princeton, Stanford, Berkeley y Redwood Research ya usan Tinker para tareas avanzadas de razonamiento, química, RL y control de IA.

🎯 Tinker democratiza la investigación en ajuste fino de modelos de IA, acercando capacidades de entrenamiento avanzado a universidades, laboratorios y desarrolladores sin grandes recursos de infraestructura.

Opera presenta Neon: el navegador con IA que actúa por ti

Opera lanzó Opera Neon, un navegador diseñado para integrar IA agentiva, capaz de actuar dentro del flujo de trabajo del usuario y transformar la navegación en una experiencia colaborativa con inteligencia artificial.

🔑 Puntos clave:

  • Navegación agentiva: Neon no solo busca información, sino que ejecuta acciones dentro del navegador —abrir, cerrar o gestionar pestañas— según el contexto de la tarea.

  • Tasks inteligentes: introduce Neon Tasks, espacios de trabajo autónomos donde la IA analiza y compara información de múltiples fuentes dentro de un contexto específico.

  • Neon Cards: sistema de prompts reutilizables que permiten guardar y combinar comportamientos de IA, con acceso a una tienda de tarjetas creadas por la comunidad.

  • Creación con IA: la herramienta Neon Make permite generar sitios web, videos, juegos o informes mediante agentes colaborativos, entregando resultados editables y compartibles.

  • Disponibilidad: Opera Neon llega en fase inicial para usuarios del programa Neon Founders, como servicio de suscripción paga para Windows y Mac.

🎯 Relevancia:
Opera Neon marca un paso decisivo hacia la navegación asistida por IA, donde el navegador se convierte en un colaborador activo capaz de entender, crear y ejecutar tareas complejas en tiempo real.

Perplexity libera su navegador Comet con IA integrada

Perplexity AI ha abierto Comet, su navegador con asistente de IA incorporado, de forma gratuita a nivel global. Lanzado en julio de 2025 con acceso exclusivo a usuarios premium ($200/mes), ahora llega a todos en Windows y Mac. Versión móvil en camino.

🔑 Puntos clave

  • 🧠 Comet incluye IA integrada para rellenar formularios, resumir emails y hacer investigaciones.

  • 📡 Colabora con medios y plataformas como CNN, The Washington Post, Rumble y Slice.

  • 💼 Usuarios iniciales reportan mayor productividad y fluidez en tareas diarias.

  • 🔒 Se presenta como una alternativa más privada frente a gigantes como Google Chrome.

🎯 Comet refuerza la tendencia de integrar IA directamente en la experiencia de navegación, marcando un nuevo frente competitivo en el ecosistema de navegadores con enfoque en productividad y privacidad.

Tunee: el asistente creativo que une música y vídeo

Tunee es un asistente conversacional que funciona como productor musical, letrista y director de vídeo al mismo tiempo. Desde una idea o una demo, puede generar canciones completas con voces sintéticas y convertirlas en videoclips sincronizados.

🔑 Lo más destacado

  • Música
    • Composición desde cero a partir de moods, textos o briefs.
    • Generación de temas en el estilo de una referencia sin copiar.
    • Reimaginar tu canción en otro género, tempo o producción.
    • Arreglos e instrumentación: guitarras, pads, cuerdas, percusiones, etc.
    • Letras y melodías vocales con voces sintéticas multilingües.
    • Exportables: pista final y stems (según plan).

  • Vídeo (MV)
    • Storyboard sincronizado con los beats.
    • Cinematografía detallada: planos, movimientos y transiciones.
    • Keyframes en estilos visuales (anime, retro, cine, etc.).
    • Render de videoclips en formatos 9:16 o 16:9.

🎯 Tunee ofrece un flujo creativo integral donde música y vídeo se producen de forma conjunta, reduciendo tiempos y ampliando posibilidades para músicos, creadores de contenido y marcas.

Robots

Tesla Optimus aprendiendo Kung Fu

Reflexiones Finales

Emad Mostaque: Cómo terminará el capitalismo (antes de 2030)