Boletín Semanal Best-IA #63

Aprende IA, día a día.

Noticias

Microsoft libera BitNet como código abierto

  • Microsoft ha liberado como código abierto a BitNet, una tecnología que permite ejecutar modelos de lenguaje de hasta 100 mil millones de parámetros en dispositivos locales, sin necesidad de GPUs y con un ahorro energético del 82%. Este avance responde a los desafíos actuales de los modelos de lenguaje grandes (LLMs), como los altos costos de hardware, el consumo energético y la accesibilidad limitada.

  • Puntos clave:

    1. Democratización del acceso: BitNet permite ejecutar modelos gigantes en CPUs estándar, eliminando la barrera de hardware costoso, lo que facilita su uso por startups, desarrolladores independientes y universidades.

    2. Eficiencia energética: Utilizando una arquitectura de cuantización a 1 bit, BitNet reduce drásticamente el consumo de energía, contribuyendo a una IA más sostenible.

    3. Privacidad y control: Los usuarios pueden operar modelos localmente, mejorando la seguridad y privacidad al no depender de servidores en la nube.

  • Este desarrollo impulsa la accesibilidad y sostenibilidad de la IA, brindando nuevas oportunidades a sectores que antes no podían aprovechar modelos de lenguaje masivos.

Tutorial BitNet paso a paso

Swarm: La Nueva Librería de OpenAI para Coordinar Agentes de IA a Gran Escala

  • OpenAI ha lanzado Swarm, una librería de código abierto diseñada para facilitar la coordinación entre múltiples agentes de IA. Esta herramienta permite a los desarrolladores gestionar y escalar sistemas distribuidos de IA, optimizando la colaboración entre agentes para resolver tareas complejas de manera eficiente.

  • Puntos clave:

    1. Coordinación multi-agente: Swarm permite la interacción fluida entre cientos o miles de agentes de IA, colaborando para abordar tareas que requieren inteligencia distribuida.

    2. Escalabilidad y eficiencia: Aunque es un framework ligero, Swarm está diseñado para funcionar en la nube y gestionar grandes volúmenes de trabajo sin comprometer el rendimiento.

    3. Integración flexible: Se puede utilizar con diversos modelos de lenguaje, como LLaMA 3, brindando flexibilidad para proyectos que no dependen de una plataforma específica.

  • Swarm marca un avance significativo en la creación de sistemas multi-agente, proporcionando a los desarrolladores una herramienta poderosa para construir soluciones de IA distribuidas y escalables. Aunque está en fase experimental, su potencial en la automatización y coordinación de tareas complejas promete transformar el futuro del desarrollo de IA.

  • LINK: https://github.com/openai/swarm

Monta un Sistema Multi-Agente Swarm en 5 MINUTOS

Adobe Max 2024: IA Generativa Revoluciona la Creación de Contenido

  • Adobe ha presentado una serie de innovaciones que prometen optimizar los flujos de trabajo creativos mediante inteligencia artificial generativa. Con actualizaciones en aplicaciones como Photoshop, Premiere Pro e Illustrator, Adobe sigue reforzando su liderazgo en herramientas para creadores.

  • 1. Photoshop más inteligente con IA
    La herramienta de Eliminación de Distracciones ahora elimina automáticamente personas y objetos no deseados de las fotos, mejorando la calidad visual. Además, las funciones de Relleno y Expansión Generativa permiten resultados más detallados y controlados, basados en el modelo Adobe Firefly.

    2. IA en la edición de video
    Adobe Premiere Pro introduce Generative Extend, que extiende clips de video automáticamente usando IA para facilitar transiciones suaves y mantener el ritmo de la edición.

    3. Diseño vectorial optimizado en Illustrator
    Las mejoras en Image Trace y la nueva función Objetos en el Camino agilizan el diseño de gráficos, mientras que la opción de crear maquetas facilita la visualización de proyectos en objetos reales.

    4. Creación 3D accesible
    Project Neo permite a los diseñadores 2D crear contenido 3D directamente en el navegador, facilitando la colaboración y la integración en flujos de trabajo existentes.

    5. Adobe Express potenciado por IA
    Nuevas funciones como Reescribir y la animación automatizada simplifican la creación rápida de contenido multimedia, mientras que la importación desde otras apps de Adobe mejora la interoperabilidad.

NVIDIA lanza Nemotron 70B, una versión optimizada de LLaMA 3.1 para tareas generales

  • NVIDIA ha lanzado Nemotron 70B, una versión ajustada de LLaMA 3.1, diseñada para competir con otros modelos destacados como GPT-4o y Claude Sonnet 3.5. El enfoque del modelo está en ofrecer respuestas coherentes y útiles para tareas generales, optimizando su capacidad de ayuda en las interacciones con los usuarios.

  • Puntos clave:

    1. Entrenamiento avanzado: Nemotron 70B ha sido entrenado con Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF), utilizando el método REINFORCE. El proceso incluyó los conjuntos de prompts Llama-3.1-Nemotron-70B-Reward y HelpSteer2-Preference, con Llama-3.1-70B-Instruct como la política inicial, para mejorar la utilidad de las respuestas generadas.

    2. Optimización para tareas generales: Aunque es una versión mejorada de LLaMA 3.1, el modelo está optimizado para tareas de propósito general y se ha personalizado para ofrecer respuestas más útiles y claras en consultas del usuario. Además, está listo para su uso comercial.

    3. Accesibilidad y compatibilidad: El modelo puede utilizarse en la plataforma de HuggingFace Transformers mediante una conversión a Llama-3.1-Nemotron-70B-Instruct-HF. También está disponible para pruebas gratuitas de inferencia en build.nvidia.com, con una API compatible con OpenAI.

  • Nemotron 70B representa un gran avance en términos de rendimiento y utilidad para aplicaciones comerciales. Su entrenamiento específico y las herramientas de integración disponibles lo hacen una opción atractiva para empresas que buscan IA de código abierto y con un enfoque en tareas generales. Sin embargo, todavía no lidera en áreas técnicas especializadas, como matemáticas o programación.

  • LINK: https://build.nvidia.com/nvidia/llama-3_1-nemotron-70b-instruct/modelcard 

Mira Murati busca recaudar $100M para su nueva startup de IA

Perplexity Spaces: búsqueda avanzada con integración de archivos personalizados

  • Perplexity AI ha lanzado "Spaces", una nueva funcionalidad que combina la búsqueda avanzada con IA y la integración de archivos personales. Esta herramienta ofrece mayor personalización y colaboración para investigaciones y proyectos complejos. Esta herramienta puede ahorrar tiempo y optimizar la organización de proyectos, especialmente para usuarios que manejan grandes volúmenes de información y necesitan respuestas precisas y contextuales.

  • Puntos clave:

    1. Integración de archivos personales: Spaces permite cargar hasta 50 archivos simultáneamente (PDFs y documentos de hasta 25 MB) y realizar búsquedas avanzadas dentro de ellos, combinándolos con información de la web.

    2. Modelos de IA personalizables: Los usuarios pueden elegir entre modelos avanzados como GPT-4o o Claude 3.5, dependiendo de su plan (gratuito o pago). Esto permite ajustar la profundidad y precisión de las búsquedas.

    3. Colaboración y generación de contenido: Spaces facilita la colaboración entre hasta 10 personas y ofrece una opción para convertir las investigaciones en publicaciones de blog automáticamente mediante la función Perplexity Pages.

  • Spaces está disponible tanto para usuarios gratuitos como para los de pago. Sin embargo, los usuarios de pago disfrutan de funcionalidades avanzadas, como la capacidad de cargar archivos propios, elegir entre varios modelos de lenguaje y acceder a una búsqueda más profunda. Los usuarios gratuitos, por su parte, pueden acceder a búsquedas web con instrucciones personalizadas, pero sin la opción de integrar archivos o usar los modelos avanzados.

Robots

Jailbreaking en Robots Controlados por IA: Un Riesgo Alarmante para el Mundo Físico

  • La creciente integración de modelos de lenguaje grande (LLMs) como ChatGPT en robots ha permitido avances impresionantes en la interacción humano-robot, desde vehículos autónomos hasta robots capaces de realizar tareas complejas. Sin embargo, esta tecnología presenta un riesgo emergente que no debe ser ignorado: la posibilidad de que estos robots controlados por IA sean manipulados o jailbroken para realizar acciones dañinas en el mundo real. Un reciente estudio, liderado por Alexander Robey y su equipo, ha demostrado que "jailbreaking" robots no solo es posible, sino alarmantemente fácil.

    1. Vulnerabilidad de los LLMs: Los modelos de lenguaje grande son vulnerables a ataques de jailbreaking, en los que se eluden las barreras de seguridad para provocar comportamientos no deseados. Esto se ha demostrado en el ámbito digital, pero ahora se extiende al campo de la robótica.

    2. El Algoritmo RoboPAIR: El estudio introduce RoboPAIR, el primer algoritmo diseñado para manipular robots controlados por IA. Este sistema es capaz de inducir acciones físicas peligrosas en robots, lo que implica un riesgo mucho mayor que las simples respuestas textuales. RoboPAIR fue probado con éxito en diversos escenarios, incluidos un coche autónomo de NVIDIA y el perro robot Unitree Go2, logrando una tasa de éxito del 100% en ataques.

    3. Aplicaciones Reales: Robots controlados por IA, como el mencionado Unitree Go2, ya están siendo desplegados en entornos reales, como en la guerra en Ucrania y en departamentos de policía. El estudio demuestra que incluso estos robots pueden ser jailbroken y manipulados para causar daño en el mundo físico.

  • El hecho de que robots comerciales y autónomos puedan ser manipulados para realizar acciones dañinas subraya la necesidad urgente de diseñar defensas robustas contra este tipo de vulnerabilidades. Mientras la robótica avanza a pasos agigantados con la ayuda de los LLMs, el riesgo de que robots maliciosamente manipulados puedan causar daños en el mundo real es un desafío que debe abordarse con prioridad.

  • Los investigadores ya han divulgado sus hallazgos a las principales compañías de IA y fabricantes de robots para mitigar estos riesgos. Sin embargo, la implementación segura de la inteligencia artificial en la robótica será crucial para evitar que tecnologías que buscan mejorar nuestras vidas se conviertan en una amenaza potencial.

Tesla Optimus ya navega por si mismo

  • Optimus ha progresado notablemente en poco tiempo, desde un prototipo básico hasta una máquina con capacidades autónomas sorprendentes. A pesar de que su apariencia física no ha cambiado mucho, sus capacidades funcionales han mejorado significativamente.

  • El corazón del avance de Optimus radica en su capacidad de aprendizaje autónomo. Utiliza redes neuronales que se inspiran en el cerebro humano para procesar información visual del entorno a través de sus cámaras. Esto le permite adaptarse y ajustar su comportamiento para cumplir con las tareas encomendadas, tal como lo hacen los vehículos autónomos de Tesla.

  • Los robots de Tesla ya están comunicándose entre sí para completar tareas de forma eficiente, compartiendo información sobre el entorno en el que operan. Un ejemplo hipotético es que si Optimus necesita una herramienta, puede pedir a otro robot cercano que la recoja y se la entregue.

  • Al igual que los futuros vehículos de Tesla que se cargarán solos mediante inducción, Optimus también es capaz de navegar hacia una estación de carga y acoplarse de forma autónoma, sin intervención humana.

  • La ventaja principal de Optimus es su capacidad para utilizar herramientas diseñadas para humanos y navegar en entornos humanos, lo que lo hace versátil en comparación con los brazos robóticos tradicionales. Tesla también proyecta que Optimus será una solución para trabajos peligrosos y repetitivos, así como para ayudar en sectores como la atención de personas mayores y la industria.

Nuevas mejoras en Unitree G1

Reflexiones Finales

INTELIGENCIA ARTIFICIAL : La gran oportunidad | José Manuel de la Chica

xxx