- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #118
Boletín Semanal Best-IA #118
Aprende IA, día a día.
Tutoriales
Guía para desarrolladores de Gemini 3, con todas las nuevas funciones de la API
Aprende los conceptos básicos de Google Antigravity
Descárgalo en: https://antigravity.google/
Documentación: https://antigravity.google/docs/get-started
Noticias
Gemini 3: la nueva era de inteligencia multimodal y razonamiento profundo
Google presenta Gemini 3, su modelo más avanzado hasta la fecha. Con mejoras radicales en razonamiento, multimodalidad y capacidades agenticas, la compañía lo despliega desde el primer día en Search, la app Gemini, AI Studio, Vertex AI y su nueva plataforma de desarrollo agent-first: Google Antigravity.
Gemini 3 no sólo supera a sus competidores en todos los benchmarks clave, también introduce un salto en interacción: entiende mejor la intención, genera visualizaciones complejas, opera de forma autónoma herramientas y planifica tareas de largo recorrido.
🔑 Claves del anuncio
Modelo más inteligente de Google
Razona con más profundidad y precisión, superando ampliamente a Gemini 2.5 Pro y liderando LMArena (1501 Elo), GPQA Diamond (91.9%) y Humanity’s Last Exam (37.5%).
La variante Gemini 3 Deep Think va aún más lejos en razonamiento avanzado.Multimodalidad extrema + contexto 1M tokens
Combina texto, imágenes, vídeo, audio y código, con hitos como:81% en MMMU-Pro
87.6% en Video-MMMU
72.1% en SimpleQA Verified
Puede procesar desde libros enteros hasta largas sesiones de vídeo y generar visualizaciones, flashcards y simulaciones interactivas.
Capacidades agenticas de nueva generación
Más autónomo y consistente usando herramientas y tomando decisiones complejas:76.2% en SWE-bench Verified
Líder en WebDev Arena
54.2% en Terminal-Bench 2.0
Mejora la planificación a largo plazo con resultados sobresalientes en Vending-Bench 2.
Google Antigravity: plataforma agent-first
Un entorno donde los agentes pueden planificar y ejecutar tareas complejas end-to-end, con acceso directo al editor, terminal y navegador.
Potencia la creación de software con agentes que validan su propio código.Integración masiva desde el día uno
Gemini 3 llega a Search con AI Mode, la app Gemini, Google AI Studio, Vertex AI, Gemini CLI y servicios empresariales.
Deep Think se lanzará más adelante tras nuevas evaluaciones de seguridad.

🎯 Gemini 3 marca un salto en modelos avanzados orientados al razonamiento profundo, agentes autónomos y multimodalidad real. Acelera la convergencia entre IA interactiva y herramientas prácticas, y refuerza la carrera hacia sistemas más interpretables, autónomos y útiles en escenarios cotidianos y profesionales.
Nano Banana Pro: el nuevo modelo de imagen de Gemini 3 Pro
Google AI Studio presenta Nano Banana Pro, un modelo de generación de imágenes con control avanzado, calidad de estudio y precisión extrema.
🔑 Claves
Texto perfecto: Renderizado y localización de texto en nivel SOTA.
Control físico y lumínico: Ajustes granulares de iluminación y física.
Calidad 4K: Imágenes estilo estudio con alta definición.
Coherencia de personajes: Consistencia precisa entre variaciones.
🎯 Estas mejoras sitúan a Gemini en la vanguardia de la generación visual profesional, potenciando flujos creativos y aplicaciones donde la coherencia y el control son esenciales.
Google Antigravity: la nueva plataforma agent-first de desarrollo
Google ha presentado Antigravity, una evolución del IDE pensada para trabajar con agentes que operan a nivel de tareas. Permite orquestar agentes en paralelo, ejecutar flujos complejos en múltiples espacios y construir cualquier cosa con Gemini 3 Pro integrado desde el núcleo.
Visita https://antigravity.google/download para descargar la versión pública preliminar sin coste. Disponible para macOS, Windows y Linux.
WeatherNext 2: la nueva IA de Google para predicciones meteorológicas ultrarrápidas y precisas
Google DeepMind presenta WeatherNext 2, su modelo más avanzado para generar pronósticos globales de alta resolución. Gracias a una arquitectura novedosa, ofrece escenarios completos en segundos, superando a los sistemas basados en física tradicional.
🔑 Claves
Functional Generative Network: Nueva arquitectura que genera todas las posibilidades meteorológicas en un solo paso.
Velocidad extrema: Explora cientos de escenarios en menos de un minuto; los modelos físicos tardan horas.
Predicciones “marginales” y “joint”: Desde temperatura exacta en un punto hasta estimar potencia eólica combinando múltiples variables.
Mejora significativa: 8 veces más rápido y más preciso en el 99,9% de variables (viento, temperatura, humedad, presión).
Integración en productos Google: Ya impulsa Search, Gemini, Pixel Weather y pronto Maps.
🎯 La evolución de modelos generativos aplicados al clima muestra cómo la IA empieza a superar límites históricos en simulación física, acercando pronósticos más fiables y accesibles a escala global.
Grok 4.1: la gran actualización de xAI con mejor EQ, creatividad y menos errores
xAI ha lanzado Grok 4.1, una actualización que mejora de forma notable la calidad conversacional, la inteligencia emocional y la fiabilidad del modelo. Ya está disponible para todos, incluso usuarios gratuitos, en http://grok.com, http://grok.x.com y en la aplicación móvil.
🔑 Claves
Segundo en LMArena: 1483 Elo, a 17 puntos de Gemini 3 Pro, y 33 puntos por encima del siguiente modelo no-xAI.
Salto en inteligencia emocional: 1586 en EQ-Bench, reflejando avances en empatía y comunicación.
Creatividad ampliada: 1722 Elo en Creative Writing v3, +600 puntos sobre la versión anterior.
Mayor fiabilidad: Hasta 3 veces menos alucinaciones que Grok 4.0.
🎯 Esta actualización consolida a Grok como uno de los asistentes más pulidos del mercado, acelerando la tendencia hacia modelos más empáticos, creativos y robustos en el uso cotidiano.
Grok 4.1 Fast y la nueva Agent Tools API: xAI lleva los agentes autónomos al siguiente nivel
xAI presenta Grok 4.1 Fast, una versión optimizada de Grok con enfoque en tool calling, velocidad y rendimiento en contextos largos. Junto a la nueva Agent Tools API, la plataforma permite crear agentes autónomos listos para producción.
🔑 Claves
Modelo orientado a agentes: Grok 4.1 Fast destaca en tareas reales gracias a RL en entornos con herramientas variadas.
Contexto de 2M tokens: Rendimiento estable en escenarios multi-turno y planificación a largo plazo.
API para agentes autónomos: Acceso a datos en tiempo real de X, web search, ejecución de código, retrieval y MCP.
Operación completa en xAI: Grok invoca herramientas, gestiona búsquedas y ejecuta código sin infra adicional del desarrollador.
Costes competitivos: $0.20/1M tokens input, $0.5/1M output y herramientas desde $5/1000 llamadas (gratis hasta el 3 de diciembre).
🎯 Esta actualización posiciona a Grok 4.1 Fast como una de las plataformas más potentes para agentes autónomos, integrando búsqueda en vivo, razonamiento prolongado y tool-calling avanzado en un ecosistema unificado.
GPT-5.1-Codex-Max: el nuevo modelo para código capaz de trabajar durante horas
OpenAI ha lanzado GPT-5.1-Codex-Max, un modelo diseñado específicamente para programación avanzada y tareas agenticas complejas. Destaca por su razonamiento mejorado, su capacidad para trabajar sobre millones de tokens mediante compaction y su integración directa con Codex en CLI, IDE y cloud.
🔑 Puntos clave
Modelo entrenado para tareas reales de ingeniería
Preparado para PRs, revisiones de código, frontend, Q&A y entornos Windows. Funciona como un colaborador experto dentro del flujo de trabajo del desarrollador.Razonamiento más eficiente y menor coste
Produce mejores resultados usando un 30% menos de “thinking tokens”. Permite elegir niveles de razonamiento (medium y xhigh) según la necesidad. Reduce significativamente el coste en generación de interfaces y código complejo.Trabajo de larga duración con “compaction”
El modelo recicla su propio contexto, preservando lo importante y permitiendo refactors de gran escala, sesiones de depuración profundas y loops agenticos de varias horas. Probado internamente con tareas de más de 24 horas.Seguridad y ciberdefensa reforzadas
Aunque no alcanza el nivel “High” en ciberseguridad del Preparedness Framework, es el modelo más capaz hasta la fecha. Corre en sandbox, limita escrituras y bloquea red por defecto. Incluye monitorización activa y mitigaciones contra usos maliciosos.Disponibilidad y despliegue progresivo
Sustituye a GPT-5.1-Codex como modelo por defecto en Codex para Plus, Pro, Business, Edu y Enterprise. API próximamente. Pensado solo para tareas de programación agentica.
🎯 Este avance mejora la autonomía de los agentes de código, acerca el desarrollo a ciclos totalmente automatizados y prepara el terreno para sistemas capaces de sostener proyectos complejos sin supervisión constante, un paso significativo hacia IA más general y fiable.
Chats de grupo en ChatGPT: colaboración real con personas y IA en una misma conversación
OpenAI inicia las pruebas de los chats de grupo, una nueva función que permite a varias personas colaborar con ChatGPT en un único espacio compartido. Esta experiencia combina planificación, toma de decisiones y trabajo conjunto sin mezclar las memorias privadas de cada usuario.
Olmo 3: el nuevo modelo abierto de Ai2 que apuesta por la transparencia total
Ai2 presenta Olmo 3, una familia de modelos totalmente abiertos que no sólo libera los pesos finales, sino toda la cadena de entrenamiento: datos, recetas, fases intermedias y código. Su objetivo es facilitar la personalización, la investigación abierta y un ecosistema de modelos razonadores accesibles para todos.
🔑 Claves del anuncio
Apertura radical del “model flow”
Ai2 publica preentrenamiento, mid-training y post-training, incluyendo datos Dolma 3, criterios de decontaminación y pipelines completos. Esto permite estudiar cómo surge cada capacidad.Tres variantes principales
Olmo 3-Base (7B, 32B): modelos fundacionales con fuerte desempeño en código, matemáticas y comprensión lectora.
Olmo 3-Instruct (7B): optimizado para chat multirturno y uso de herramientas.
Olmo 3-Think (7B, 32B): modelos que muestran su razonamiento paso a paso.
El modelo estrella: Olmo 3-Think 32B
Considerado el mejor modelo de razonamiento totalmente abierto en su tamaño. Ai2 lo sitúa en el “sweet spot”: mucho más potente que 7B, pero aún entrenable y ajustable para investigadores y empresas con hardware moderado.Entrenamiento en 6T tokens + contexto largo
Con Dolma 3 y nuevos datasets de post-training (más limpios y ricos en tareas complejas). Además, soporta contextos de ~65K tokens, suficiente para libros, papers completos y análisis extensos.Rendimiento competitivo
Olmo 3-Think 32B: líder entre modelos abiertos de su tamaño.
Olmo 3-Base: supera a Marin y Apertus; cerca de Qwen 2.5 y Gemma 3.
Olmo 3-Instruct (7B): empata o supera a Qwen 2.5, Gemma 3 y Llama 3.1.
Nuevas herramientas en Ai2 Playground
Incluye modo “thinking”, tool calling y OlmoTrace, que permite estudiar cómo el modelo aprendió partes de su respuesta.
🎯 Este lanzamiento refuerza la tendencia hacia modelos abiertos orientados al razonamiento y la interpretabilidad. En plena carrera por la “IA entendible”, Olmo 3 ofrece un punto intermedio poderoso (32B) que permite investigar, auditar y ajustar sin depender de modelos cerrados gigantes, aportando transparencia en un momento donde la gobernanza de la IA es prioritaria.
Pruébalo en: https://playground.allenai.org/
Cogito v2.1 (671B): el nuevo líder open-weight estadounidense
DeepCogito presenta Cogito v2.1, un modelo de 671B parámetros que se posiciona como el LLM open-weight más potente lanzado por una empresa de EE. UU., compitiendo de tú a tú con modelos cerrados y superando a GPT-OSS, Nemotron y Llama.
🔑 Claves del anuncio
Razonamiento más eficiente
Entrenado con process supervision, desarrolla mejores trayectorias de búsqueda y necesita menos tokens para razonar que modelos de capacidad similar.Mejoras sustanciales de uso real
Avances notables en seguimiento de instrucciones, coding, consultas largas, diálogos multi-turn y creatividad.Acceso amplio y flexible
Puede probarse gratis en chat.deepcogito.com, descargarse en Hugging Face y usarse en OpenRouter, Together, Fireworks, Ollama, RunPod, Baseten o ejecutarse localmente con Ollama o Unsloth.Modelo open-weight de gran escala
Los pesos de 671B ya están disponibles, reforzando el avance hacia modelos plenamente abiertos orientados al razonamiento avanzado.
🎯 Con Cogito v2.1, el ecosistema open-weight estadounidense da un salto relevante: un modelo enorme, eficiente en tokens y competitivo con modelos cerrados, que impulsa la apertura en un terreno dominado por supermodelos privados y acelera la democratización del desarrollo de IA avanzada.
SAM 3D: reconstrucción 3D avanzada para objetos, escenas y cuerpos humanos
Meta presenta SAM 3D, un conjunto de modelos que redefine la reconstrucción 3D a partir de imágenes del mundo real. Incluye herramientas para objetos, escenas completas y estimación corporal precisa, con aplicaciones que van desde robótica hasta medios interactivos.
🎯 Este avance acerca la visión-IA a una comprensión tridimensional completa, clave para agentes robóticos, realidad aumentada y herramientas creativas profundas, consolidando un estándar abierto para el 3D en la nueva generación de modelos multimodales.
