- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #124
Boletín Semanal Best-IA #124
Aprende IA, día a día.
Tutoriales
OpenAI Codex
Crea ASISTENTES más POTENTES con Gemini Gems
Noticias
Anthropic
Cowork: Claude deja de chatear y empieza a trabajar contigo
Anthropic lanza Cowork, un research preview que convierte a Claude en un compañero de trabajo con agencia real: acceso a carpetas locales, capacidad para planificar tareas y ejecución autónoma más allá de la conversación tradicional.
🔑 Claves del anuncio
De chat a ejecución real: Claude puede leer, editar y crear archivos en carpetas concretas del usuario, desde reorganizar descargas hasta generar informes o hojas de cálculo.
Más agencia, menos microgestión: una vez asignada la tarea, Claude planifica y la completa de forma progresiva, informando del estado sin requerir interacción constante.
Accesible para no programadores: hereda la potencia de Claude Code, pero en un formato pensado para trabajo cotidiano no técnico.
Conectores y habilidades: integración con fuentes externas, creación de documentos y presentaciones, y posibilidad de actuar vía navegador junto a Claude en Chrome.
Control y riesgos explícitos: el usuario define accesos, valida acciones importantes y debe considerar riesgos como borrado accidental o prompt injection.
🎯 Cowork refuerza el paso hacia agentes de IA con autonomía operativa, donde los modelos gestionan flujos de trabajo completos. Es un avance clave hacia asistentes que actúan como colaboradores persistentes, no simples interfaces conversacionales.
Claude Code incorpora Tool Search para optimizar el uso de herramientas MCP
Claude Code lanza MCP Tool Search, una mejora clave que permite cargar herramientas de forma dinámica y reducir drásticamente el consumo de contexto en agentes que trabajan con servidores MCP complejos.
🔑 Claves de la actualización
Lazy Load de herramientas: cuando las descripciones de herramientas superan el 10 % del contexto, Claude Code deja de precargarlas y las busca bajo demanda.
Menos consumo de tokens: soluciona configuraciones con múltiples servidores MCP que llegaban a consumir decenas de miles de tokens solo en contexto.
🎯 Tool Search refleja un cambio estructural en agentes avanzados: pasar de contextos cargados estáticamente a descubrimiento dinámico de capacidades, clave para escalar sistemas multiagente sin que el contexto se convierta en el principal cuello de botella.
Claude Code añade vista diff en web y desktop
Claude Code incorpora una vista diff integrada que permite ver exactamente qué cambios ha realizado Claude en el código, directamente desde la app y sin salir del flujo de trabajo.
Openwork: alternativa open source a Claude Cowork para agentes de computer-use
Openwork se presenta como una alternativa abierta y gratuita a Claude Cowork, ofreciendo un agente de computer-use más rápido, seguro y flexible, diseñado para ejecutar tareas reales en el ordenador sin depender de entornos cerrados o propietarios.
🔑 Claves del anuncio
Alternativa directa a Claude Cowork: reproduce el concepto de agente con agencia real sobre el sistema, pero bajo licencia MIT y sin dependencia de un proveedor único.
Modelo a elección del usuario: permite usar cualquier modelo o API compatible con OpenCode, facilitando portabilidad y control de costes.
Mayor eficiencia y velocidad: hasta 4× más rápido y más eficiente en tokens que Claude para Chrome/Cowork, gracias a un navegador de desarrollo aislado.
Seguridad reforzada: no utiliza la sesión principal del navegador, reduciendo riesgos ante prompt injections y accesos no deseados a servicios personales.
100 % open source y gratuito: disponible para macOS (por ahora) mediante descarga directa o clonando el repositorio.
🎯 Openwork refuerza la tendencia hacia agentes autónomos controlados por el usuario, donde la apertura, la seguridad y la interoperabilidad compiten directamente con soluciones cerradas, marcando un punto de inflexión en el futuro de los AI coworkers.
Google Veo 3.1: vídeo generativo más expresivo, vertical y en 4K
Google ha anunciado nuevas mejoras en Veo 3.1, su modelo de generación de vídeo por IA, ampliando las capacidades creativas tanto para creadores casuales como para profesionales del vídeo, con foco claro en formatos móviles y calidad de producción.
🔑 Claves de la actualización
Ingredients to Video más potente: mayor control narrativo a partir de imágenes base, manteniendo consistencia de personajes, fondos y objetos, y mezclando estilos visuales con fluidez.
Vídeo vertical nativo: generación en formato retrato optimizada para móviles, sin recortes ni pérdida de calidad, pensada para Shorts y plataformas sociales.
Resoluciones profesionales: soporte para 1080p y 4K con upscaling avanzado, orientado a edición, pantallas grandes y producciones exigentes.
Despliegue amplio: disponible en Gemini, Flow, Google Vids, Vertex AI, la API de Gemini y, por primera vez, integrado directamente en YouTube Shorts y YouTube Create.
Verificación de contenido: Gemini permite comprobar si un vídeo ha sido generado con IA de Google, ampliando las herramientas de detección ya existentes para imágenes.
🎯 Veo 3.1 consolida la generación de vídeo como eje central de la IA creativa, acercando calidad cinematográfica, formatos sociales y trazabilidad del contenido.
Google Personal Intelligence: Gemini se adapta a tu vida digital
Google anuncia Personal Intelligence, una nueva capa de personalización en la Gemini App que permite ofrecer respuestas más relevantes y contextualizadas usando información del propio ecosistema del usuario, siempre bajo control explícito.
🔑 Claves del anuncio
Personalización profunda: con permiso del usuario, Gemini puede razonar usando datos de Gmail, YouTube, Google Photos y Search para generar respuestas adaptadas a cada persona.
Control y privacidad: la función está desactivada por defecto y el usuario decide qué aplicaciones conectar y cuándo.
Asistencia contextual real: desde planes de viaje basados en fotos personales hasta recomendaciones de gimnasio según objetivos previamente compartidos.
Despliegue progresivo: en beta para suscriptores Google AI Pro y AI Ultra en EE. UU., con planes de expansión a usuarios gratuitos, más países y al modo IA de Search.
🎯 Personal Intelligence refuerza la transición hacia asistentes verdaderamente contextuales, donde la IA deja de ser genérica y empieza a operar como una extensión cognitiva del usuario, alineada con privacidad, memoria y utilidad práctica diaria.
Google Antigravity Agent Skills: extensiones reutilizables para agentes de IA
Google Antigravity presenta Agent Skills, un estándar abierto para ampliar las capacidades de los agentes mediante paquetes reutilizables de conocimiento, instrucciones y recursos que guían su comportamiento en tareas específicas.
🔑 Claves del sistema
Skills como unidades modulares: cada skill es una carpeta con un archivo
SKILL.mdque define cuándo y cómo debe actuar el agente.Descubrimiento automático: el agente ve los nombres y descripciones de las skills disponibles y decide cuál aplicar según el contexto.
Ámbito local y global: las skills pueden ser específicas de un proyecto o reutilizables en todos los entornos del usuario.
Estructura extensible: además de instrucciones, pueden incluir scripts, ejemplos y recursos como plantillas.
Diseño orientado a buenas prácticas: foco en especialización, descripciones claras y patrones de decisión para tareas complejas.
🎯 Agent Skills apunta a una estandarización del comportamiento de agentes, facilitando flujos reproducibles y escalables. Es un paso clave hacia ecosistemas de agentes configurables, comparables y reutilizables, más cercanos a software modular que a simples prompts.
TranslateGemma: modelos abiertos de traducción multilingüe
Google DeepMind lanza TranslateGemma, una nueva familia de modelos abiertos de traducción compatibles con 55 idiomas, disponibles en tamaños de 4B, 12B y 27B parámetros, optimizados para eficiencia sin perder calidad.
OpenAI
OpenAI y Cerebras se asocian para acelerar la inferencia de modelos de IA
OpenAI ha anunciado una alianza estratégica con Cerebras Systems para ampliar la capacidad de inferencia de modelos avanzados, apoyándose en hardware especializado diseñado para ejecutar IA a gran escala con mayor eficiencia.
GPT-5.2 ejecutándose de forma autónoma durante una semana completa
Un experimento liderado por el CEO de Cursor, integrando GPT-5.2 en Cursor, demuestra un nuevo nivel de agencia: el modelo trabajó sin interrupción durante siete días para construir un navegador completo en Rust, con motor de renderizado, HTML, CSS y una VM de JavaScript funcional.
Open Responses: estándar abierto para interfaces LLM interoperables
OpenAI Developers presenta Open Responses, una especificación open source diseñada para crear interfaces de LLM interoperables y multi-proveedor, construidas sobre la API Responses original de OpenAI y pensadas para flujos reales con agentes.
🔑 Claves del anuncio
Multi-proveedor por defecto: permite trabajar con distintos modelos sin rehacer la arquitectura en cada cambio.
Orientado a flujos reales: pensado para sistemas agentivos en producción, no solo demos o prototipos.
Interoperabilidad sin fragmentación: extensible sin romper compatibilidad entre proveedores y herramientas.
Base en Responses API: aprovecha un modelo de interacción ya conocido y probado por desarrolladores.
OpenAI invierte en Merge Labs para impulsar interfaces cerebro-computadora
OpenAI anuncia su inversión en Merge Labs, un laboratorio centrado en desarrollar interfaces cerebro-computadora seguras y de alto ancho de banda, combinando biología, dispositivos y IA para crear nuevas formas de interacción directa entre humanos y sistemas inteligentes.
xAI
Colossus 2: xAI pone en marcha el primer clúster de entrenamiento de IA a escala gigavatio
xAI ha activado Colossus 2, el primer superordenador de entrenamiento de IA del mundo que opera a 1 GW, con planes de ampliación a 1,5 GW en abril, evidenciando cómo los centros de datos de IA están alcanzando consumos energéticos equivalentes a los de una gran ciudad.
Grok activa memoria y personalización en Europa
xAI ha desplegado en Europa la función de memoria de Grok, permitiendo historial de conversaciones y respuestas personalizadas tras adaptarla a los requisitos de protección de datos, ampliando así la experiencia contextual para usuarios de la UE.
FLUX.2 [klein]: imágenes de alta calidad en menos de un segundo
Black Forest Labs presenta FLUX.2 [klein], un modelo de generación de imágenes ultrarrápido pensado para iterar ideas, cambiar estilos y crear desde cero con gran calidad visual, disponible vía API y para ejecución local con licencias abiertas.
Robots
1X y el salto a los world models que aprenden por sí mismos
1X presenta su enfoque de world model self-learning: sistemas robóticos que aprenden directamente de la interacción con el mundo real, construyendo modelos internos del entorno sin depender exclusivamente de datos etiquetados o simulaciones cerradas.
🔑 Claves del enfoque
Aprendizaje desde la experiencia directa: el robot observa las consecuencias de sus acciones y ajusta su comportamiento en tiempo real, sin supervisión humana constante.
World models internos: el sistema construye representaciones dinámicas del entorno que permiten anticipar resultados y planificar acciones.
Menos dependencia de simulación: el aprendizaje ocurre principalmente en el mundo físico, reduciendo la brecha entre simulación y realidad.
Adaptación continua: el modelo se actualiza de forma incremental, mejorando su desempeño a medida que acumula experiencia.
Base para robots generalistas: este enfoque apunta a robots capaces de realizar múltiples tareas en entornos no estructurados.
🎯 Este avance refuerza la transición hacia IA encarnada que aprende como un agente autónomo, acercando la robótica a sistemas más flexibles, escalables y alineados con el aprendizaje continuo observado en sistemas biológicos, clave para la próxima generación de robots inteligentes.
Aletta: extracción de sangre totalmente automatizada
Aletta es un robot clínico que automatiza por completo la extracción de sangre: localiza la vena mediante ultrasonido, posiciona el brazo, obtiene la muestra y coloca el vendaje sin intervención humana.
China fusiona biología y robótica con MetaBOC
Científicos chinos han desarrollado MetaBOC, un sistema brain-on-chip basado en células madre humanas que actúa como un “cerebro biológico” integrado en robótica, con capacidad de aprendizaje más rápida y mayor eficiencia que los modelos de IA actuales.
Reflexiones Finales
Mustafa Suleyman anticipa la llegada de compañeros de IA personales
Mustafa Suleyman, CEO de IA en Microsoft, afirma que en cinco años cada persona tendrá un compañero de IA que la conocerá en profundidad y la acompañará de forma continua en la toma de decisiones y desafíos vitales.
