Boletín Semanal Best-IA #34

Aprende IA, día a día.

Os deseamos un buen comienzo de semana. Hemos leído vuestros correos. Gracias por las sugerencias. 😄 

Desde esta semana, seguiremos enviando la newsletter los lunes a las 8.00, hora española, pero si la actualidad o la cantidad de novedades lo requieren, recibiréis actualizaciones.
Además, así podremos detenernos algo más en cada uno de los temas.

Estamos actualizando nuestros dos manuales de prompt engineering. Pronto los tendréis en primicia y de forma gratuita como subscriptores. 😉 

Tutoriales

GPT-Mentions: Flujo de trabajo multi-GPT para automatizar negocios

  • Este flujo de trabajo avanzado de GPT demuestra el uso de múltiples GPTs especializados para automatizar tareas empresariales. Muestra cómo un GPT central coordina con GPTs especializados, proporcionando un proceso eficiente para manejar diferentes aspectos de las operaciones empresariales, como la edición de videos, el diseño de miniaturas y el SEO para YouTube.

    • Coordinación Centralizada: Un GPT principal actúa como un centro, dirigiendo consultas a GPTs especializados.

    • Asistencia Especializada: Cada GPT se enfoca en áreas específicas como edición de video, diseño de miniaturas y SEO.

    • Proceso Simplificado: El flujo de trabajo garantiza un manejo eficiente de diversas tareas dentro de la empresa.

    • Automatización Empresarial: Reduce significativamente el tiempo y esfuerzo necesarios para la capacitación y gestión de tareas.

    • Flexibilidad: Aplicable a varios aspectos del negocio y la vida personal, como la planificación de eventos, la construcción de sitios web, etc.

    La característica de menciones de GPT es clave, permitiendo una interacción fluida entre GPTs dentro de un mismo hilo de chat. Este enfoque no solo mejora la eficiencia sino que también proporciona un modelo para utilizar la IA en la gestión empresarial y personal.

Crea personajes consistente en Midjourney

El truco para obtener mejores resultados de Claude

Apps

Traducción simultánea en dispositivos móviles con Google Gemini. Una aplicación que puede revolucionar el mundo de los negocios

  • La IA generativa está revolucionando la comunicación global con sistemas como Google Gemini y su modelo LLM Nano. Este avanzado sistema opera en dispositivos móviles, ofreciendo traducciones a voz instantáneas y precisas sin depender de servidores externos.

Noticias

Google Deepmind's SIMA

  • SIMA es un agente multimundo escalable e instructivo que puede entender una amplia gama de mundos de juego y seguir instrucciones en lenguaje natural para realizar tareas en ellos, como haría un ser humano.

  • Aprender a seguir instrucciones en diversos entornos de juego podría desbloquear agentes de IA más útiles para cualquier entorno, ahora que podemos traducir las capacidades de los modelos avanzados de IA en acciones útiles en el mundo real a través de una interfaz lingüística.

  • LINK: https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/

Grok será Open Source a partir de esta semana

Cognition presenta Devin: El Primer Ingeniero de Software AGI

  • Devin es un agente autónomo que resuelve tareas de ingeniería de software mediante el uso de su propio shell, editor de código y navegador web.

  • Devin define un nuevo estado del arte en la prueba de referencia de codificación SWE-Bench, superando con éxito entrevistas prácticas de ingeniería de empresas líderes en IA e incluso ha realizado trabajos reales en Upwork.

  • Cuando se evaluó en la prueba SWE-Bench, en la que se pide a una IA que resuelva problemas de GitHub encontrados en proyectos de código abierto del mundo real, Devin resolvió correctamente el 13,86% de los problemas sin asistencia, superando con creces el rendimiento del modelo de vanguardia anterior del 1,96% sin asistencia y del 4,80% con asistencia.

  • Algunas cosas que Devin puede hacer:

    • Aprender a utilizar tecnologías desconocidas.

    • Contribuir a repositorios de producción maduros.

    • Entrenar y ajustar sus propios modelos de inteligencia artificial.

    • Realizar trabajos reales en Upwork.

  • LINK: https://devinai.dev/

  • LINK: https://www.cognition-labs.com/blog

El intérprete de datos de MetaGPT: Código abierto y “mejor que Devin"

Maisa KPU: El próximo salto en las capacidades de razonamiento de la IA

  • KPU (Unidad de Procesamiento del Conocimiento) es un sistema de razonamiento para LLM que aprovecha toda su capacidad de razonamiento y supera sus limitaciones intrínsecas.

  • Ha superado a modelos lingüísticos más avanzados, como GPT-4 o Claude 3 Opus, en varias tareas de razonamiento.

  • La disociación entre el razonamiento y la ejecución de órdenes permite al LLM centrarse exclusivamente en el razonamiento, liberándola de cualquier operación vulnerable de alucinación, procesamiento de datos o recuperación de información actual.

  • Abre la puerta a futuros análisis de la calidad y el rendimiento en tareas con grandes volúmenes de datos y contenido multimodal, resolución abierta de problemas, interacción con sistemas digitales (como apis y bases de datos) y factualidad.

  • LINK: https://maisa.ai/blog/kpu

Jensen Huang, CEO de envidia, opina que pronto no será necesario aprender a programar 

Mira Murati, CTO de OpenAI, confirma el lanzamiento de Sora al público, aunque no la fecha

Robots

Figure 01

  • Figure 01, “El primer robot humanoide autónomo del mundo viable comercialmente“, ha vuelto a informar de sus increíbles progresos. Su robot ya puede mantener conversaciones enteras utilizando ChatGPT.

  • LINK: https://www.figure.ai/

Reflexiones Finales

La IA cambiará el mundo antes de lo que crees

Yann Lecun: Meta IA, código abierto, límites de los LLM, AGI y el futuro de la IA