Boletín Semanal Best-IA #57

Aprende IA, día a día.

Tutoriales

Curso "Large Multimodal Model Prompting with Gemini"

  • En este curso gratuito de 2 horas, dirigido por Erwin Huizenga en colaboración con Google Cloud, se exploran las vanguardistas técnicas de generación de prompts multimodales en modelos de IA.

  • Una clave destacada del curso es la importancia de la estructura de los prompts al interactuar con modelos multimodales: el orden en que se presentan los textos e imágenes puede mejorar significativamente la capacidad del modelo para contextualizar y analizar datos visuales. Por ejemplo, presentar la historia médica de un paciente antes de sus radiografías potencia la interpretación efectiva de estas últimas.

  • Además, el curso aborda el uso del modelo Gemini para desarrollar aplicaciones de IA, enseñando a manejar diversos formatos de video y a integrar datos en tiempo real en las respuestas del modelo. Los participantes aprenderán a construir aplicaciones prácticas como analizadores de documentos que trabajan con textos y gráficos, extractores de contenido de videos y sistemas automatizados de informes de gastos, entre otros ejemplos reales.

  • LINK: https://www.deeplearning.ai/short-courses/large-multimodal-model-prompting-with-gemini/

Aplicaciones Profesionales Gratis | Tutorial VERCEL V0

Crea “Gems” en Google Gemini

Noticias

xAI Lanza "Colossus", el Clúster de IA Más Poderoso del Mundo con 100,000 GPUs

  • xAI, la empresa de inteligencia artificial fundada por Elon Musk, ha lanzado "Colossus", el clúster de IA más potente a nivel global, compuesto por 100,000 GPUs Nvidia H100. Este hito fue logrado en solo 122 días y representa un avance significativo en la capacidad de procesamiento de IA.

  • Puntos Clave:

    1. Colossus: El Clúster Más Potente del Mundo - Con 100,000 GPUs Nvidia H100 refrigeradas por líquido, Colossus se erige como el sistema de inteligencia artificial más poderoso construido hasta la fecha, según Musk.

    2. Rápida Implementación - El clúster fue diseñado y puesto en línea en un tiempo récord de 122 días, un logro notable que demuestra la capacidad de xAI para escalar rápidamente.

    3. Planes de Expansión - xAI no se detiene aquí; planea duplicar la capacidad de Colossus a 200,000 GPUs en los próximos meses, lo que aumentará significativamente su poder de cómputo.

  • Con Grok 2, entrenado con solo 15,000 GPUs, alcanzando ya a GPT-4 de OpenAI, la creación de Colossus posiciona a xAI como un competidor a tener muy en cuenta en el espacio de la IA, presionando a gigantes como OpenAI y Google a acelerar sus propios desarrollos.

Magic Presenta su Modelo LTM-2-mini, con una Ventana de Contexto de 100 Millones de Tokens

  • Magic ha lanzado LTM-2-mini, su primer modelo de IA capaz de procesar contextos de hasta 100 millones de tokens, equivalente a 10 millones de líneas de código o 750 novelas. Este avance marca un hito en la capacidad de los modelos de IA para manejar enormes volúmenes de información en tiempo real. Además, Magic ha anunciado una colaboración clave con Google Cloud para potenciar sus futuros desarrollos.

  • Puntos clave:

    1. Ventana de Contexto de 100M Tokens: LTM-2-mini es el primer modelo de Magic capaz de manejar hasta 100 millones de tokens en contexto, lo que permite a la IA acceder y procesar grandes cantidades de datos, como la totalidad de un código base, documentación y bibliotecas, durante la inferencia.

    2. Evaluación Avanzada: Para evaluar la capacidad de estos modelos, Magic ha desarrollado HashHop, un método de evaluación que elimina pistas semánticas y mide la verdadera capacidad del modelo para almacenar y recuperar información en contextos ultra-largos, superando las limitaciones de evaluaciones anteriores.

    3. Colaboración con Google Cloud: Magic ha establecido una asociación con Google Cloud para construir sus próximas supercomputadoras, Magic-G4 y Magic-G5, utilizando tecnología avanzada de NVIDIA. Esta infraestructura permitirá a Magic escalar y optimizar el entrenamiento y la inferencia de sus modelos de manera más eficiente.

  • Estos desarrollos posicionan a Magic a la vanguardia de la IA, particularmente en la aplicación de modelos con contextos ultra-largos que podrían revolucionar la programación y otras áreas. La colaboración con Google Cloud asegura que dispondrán de la infraestructura necesaria para llevar estos avances al mercado rápidamente.

  • LINK: https://magic.dev/blog/100m-token-context-windows

ChatGPT ahora tiene memoria

  • ChatGPT recordará automáticamente los datos y preferencias que compartas en tus conversaciones, y los trasladará entre chats.

  • Las memorias se utilizan para dar respuestas más precisas. (OpenAI podrá utilizarlas para entrenar a sus modelos si tienes activada la función de entrenamiento de modelos. Más información).

  • Revisa y elimina recuerdos específicos, comienza de nuevo desde cero o desactiva la función en los ajustes.

  • FAQ: https://help.openai.com/en/articles/8590148-memory-faq

Altera Revoluciona la IA con 1,000 Agentes Autónomos “viviendo” en un Mundo Virtual

  • Altera ha logrado una hazaña sin precedentes en la inteligencia artificial: la creación de “Project Sid”, una simulación con más de 1,000 agentes autónomos que colaboran en un mundo de Minecraft, desarrollando su propia economía, cultura, religión y gobierno.

  • Puntos clave:

    1. Autonomía Completa: Los agentes de Altera operan de forma totalmente autónoma durante horas o días, sin intervención humana, y son capaces de colaborar para alcanzar metas complejas como la creación de centros comerciales, democracias y religiones.

    2. Interacción Humana y Emocional: Los agentes están programados con motivaciones para apoyar a los humanos y pueden expresar pensamientos y emociones, incluso buscando a agentes perdidos en algunas simulaciones.

    3. Plataforma Independiente: Aunque Minecraft es el entorno inicial, los agentes de Altera son independientes del juego y pueden utilizarse en otras aplicaciones y plataformas.

  • Este avance de Altera podría transformar la manera en que abordamos problemas sociales complejos, permitiéndonos simular y probar soluciones en entornos virtuales antes de implementarlas en el mundo real. Es un hito que subraya la creciente importancia de los agentes autónomos en la inteligencia artificial.

Alibaba presenta sus nuevos modelos multimodales Qwen2-VL

  • Alibaba ha anunciado una actualización importante en su serie de modelos de IA enfocados en el entendimiento visual y de lenguaje. Este nuevo conjunto de modelos, denominado Qwen2-VL, es una versión mejorada de la línea Qwen2 y ofrece capacidades avanzadas en diversas áreas clave:

    1. Rendimiento de Vanguardia en Entendimiento Visual: Qwen2-VL se destaca en benchmarks de comprensión visual, lo que implica que es capaz de interpretar imágenes y responder preguntas sobre ellas con una precisión superior en comparación con otros modelos existentes. Esto es especialmente relevante en aplicaciones como el reconocimiento de documentos, resolución de problemas matemáticos visuales y más.

    2. Comprensión de Videos Extensos: Una de las innovaciones notables de Qwen2-VL es su capacidad para procesar y entender videos largos, de más de 20 minutos, lo que permite un uso más avanzado en tareas como la creación de contenido basado en video, interacción mediante preguntas y respuestas basadas en video, y diálogos.

    3. Operación Autónoma de Dispositivos: Qwen2-VL está diseñado para integrarse con dispositivos como teléfonos móviles y robots, permitiendo que estos dispositivos operen de manera autónoma basándose en instrucciones visuales y textuales. Esto abre la puerta a aplicaciones en robótica, automatización de tareas y más.

    4. Soporte Multilingüe Extendido: Con la globalización en mente, Qwen2-VL ha ampliado su capacidad para entender textos en imágenes en una variedad de idiomas, más allá del inglés y chino, incluyendo lenguas europeas, asiáticas y árabe, lo que lo hace útil para usuarios de todo el mundo.

    5. Modelos para Diferentes Necesidades:

      • Qwen2-VL-7B es el modelo insignia, optimizado para un rendimiento máximo en tareas de visión y lenguaje.

      • Qwen2-VL-2B es una versión más ligera y eficiente, pensada para su uso en dispositivos con limitaciones de recursos, como teléfonos móviles, sin sacrificar demasiada capacidad.

  • Qwen2-VL establece un nuevo estándar en la intersección entre visión y lenguaje, ofreciendo soluciones avanzadas para automatización, comprensión multimedia y soporte multilingüe. Este lanzamiento incluye opciones desde modelos optimizados para dispositivos móviles hasta potentes modelos para aplicaciones más exigentes, disponibles en GitHub, Hugging Face, y ModelScope. Para más detalles, se puede consultar el blog oficial.

OpenCRISPR-1: El Primer Editor Genético Diseñado por IA que Revoluciona la Biotecnología

  • La biotecnología ha alcanzado un nuevo hito con OpenCRISPR-1, el primer editor genético creado íntegramente por inteligencia artificial. Este avance, desarrollado por Profluent Bio, podría transformar las capacidades y aplicaciones de la tecnología CRISPR.

  • Puntos Clave:

    1. Editor Genético IA-Optimizado: OpenCRISPR-1 fue diseñado desde cero utilizando modelos de lenguaje grandes (LLMs) entrenados en un extenso dataset, lo que permitió generar secuencias de proteínas CRISPR-Cas con una funcionalidad y diversidad superiores a las naturales.

    2. Precisión Mejorada: Este editor genético muestra una especificidad un 95% mayor, reduciendo significativamente las ediciones no deseadas en el ADN y estableciendo un nuevo estándar en seguridad para terapias genéticas.

    3. Diversidad Expansiva: Gracias a los LLMs, OpenCRISPR-1 incrementa la diversidad de secuencias CRISPR-Cas en unas 4.8 veces, ampliando su potencial de aplicación en distintos campos.

  • Importancia: OpenCRISPR-1 no solo avanza la edición genética en precisión y seguridad, sino que también abre nuevas posibilidades en medicina y agricultura. Sin embargo, su adopción plantea retos éticos, especialmente en cuanto a la democratización y acceso equitativo a esta poderosa tecnología.

  • LINK: https://crisprmedicinenews.com/news/opencrispr-1-generative-ai-meets-crispr

  • PREPRINT: Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences

AlphaProteo: La Nueva Frontera en el Diseño de Proteínas

  • Google DeepMind ha lanzado AlphaProteo, un avanzado sistema de inteligencia artificial diseñado para crear proteínas innovadoras, con aplicaciones potenciales en biomedicina, como el desarrollo de nuevos medicamentos y diagnósticos.

  • Puntos Clave:

    1. Innovación en el Diseño de Proteínas:
      AlphaProteo es pionero en la creación de proteínas enlazantes nuevas, que superan en eficacia a los métodos tradicionales, mostrando afinidades de unión hasta 300 veces mejores en pruebas experimentales.

    2. Resultados Experimentales Prometedores:
      Las proteínas diseñadas por AlphaProteo han sido validadas por instituciones externas, demostrando una alta tasa de éxito en su funcionalidad, como en la prevención de infecciones por el virus SARS-CoV-2.

    3. Desafíos y Mejoras Futuras:
      Aunque AlphaProteo ha logrado avances significativos, aún enfrenta limitaciones, como la dificultad para diseñar enlazadores efectivos para ciertas proteínas. DeepMind continúa trabajando en mejorar la tecnología.

  • Implicaciones:
    AlphaProteo podría transformar áreas clave como la medicina y la biotecnología, pero también plantea desafíos en bioseguridad. DeepMind está comprometido con un desarrollo responsable de esta poderosa herramienta.

OpenAI y Anthropic Firman un Acuerdo con el Gobierno de EE. UU. para la Seguridad en la IA

  • OpenAI y Anthropic han firmado acuerdos pioneros con el Instituto de Seguridad en Inteligencia Artificial de EE. UU. para la investigación, prueba y evaluación de sus modelos de IA, en un momento crítico de creciente escrutinio regulatorio.

  • Puntos Clave:

    1. Colaboración para la Seguridad en la IA:
      Estos acuerdos permiten al Instituto de Seguridad en IA de EE. UU. acceder y evaluar los nuevos modelos de OpenAI y Anthropic antes y después de su lanzamiento público, con el objetivo de garantizar su desarrollo seguro y ético.

    2. Respaldo Gubernamental y Regulación:
      La colaboración se produce mientras California se prepara para votar una ley que regulará el desarrollo y despliegue de la IA, reflejando un creciente interés en la gobernanza de esta tecnología en EE. UU.

    3. Impulso a la Liderazgo Responsable:
      Los acuerdos buscan posicionar a EE. UU. como líder en el desarrollo responsable de la IA, ofreciendo un marco de trabajo que podría ser adoptado a nivel global, con el apoyo de instituciones como el NIST y su contraparte en el Reino Unido.

  • Estos acuerdos marcan un hito en la cooperación público-privada para la seguridad en la IA, subrayando la importancia de un enfoque riguroso y colaborativo para mitigar los riesgos asociados con esta tecnología emergente.

  • LINK: https://www.reuters.com/technology/artificial-intelligence/openai-anthropic-sign-deals-with-us-govt-ai-research-testing-2024-08-29/

Robots

1X_tech presenta su robot “Neo”

  • 1X Technologies acaba de presentar el humanoide con IA más realista hasta la fecha: NEO Beta, un robot avanzado diseñado para la asistencia diaria en el hogar con capacidades similares a las humanas en cuanto a movimiento, interacción y realización de tareas.

  • NEO Beta utiliza inteligencia artificial incorporada para comprender su entorno y aprender de interacciones anteriores.

  • Está diseñado para realizar una amplia gama de tareas, desde tareas domésticas hasta proporcionar compañía y apoyo a personas con problemas de movilidad, y puede ser manejado a distancia por un humano si es necesario.

Reflexiones Finales

Eric Schmidt, ex CEO de Google: “No tienes ni idea de lo que te espera”

 

xxx