Boletín Semanal Best-IA #64

Aprende IA, día a día.

Noticias

Anthropic lanza una nueva versión de Claude 3.5 Sonnet y Haiku con Innovadoras Capacidades

  • Anthropic ha lanzado dos nuevas versiones de su modelo de IA: Claude 3.5 Sonnet, con mejoras significativas en tareas de programación, y Claude 3.5 Haiku, que combina velocidad y rendimiento. Además, se han introducido dos capacidades experimentales: el uso de computadoras, permitiendo a Claude interactuar directamente con interfaces de software, y la herramienta de análisis, que permite a Claude ejecutar código JavaScript para realizar análisis de datos en tiempo real dentro de Claude.ai.

  • Puntos clave:

    1. Mejoras en Claude 3.5 Sonnet: Ofrece avances en codificación y uso de herramientas, superando a sus predecesores en benchmarks y siendo ideal para tareas complejas de desarrollo de software.

    2. Claude 3.5 Haiku: Un modelo más rápido y asequible, supera al modelo anterior más grande, Claude 3 Opus, en muchas evaluaciones, manteniendo bajo costo y latencia.

    3. “Computer Use”: Claude ahora puede usar software estándar moviendo un cursor y tecleando, lo que abre nuevas oportunidades para automatizar procesos repetitivos y tareas abiertas.
    4. Analysis Tool: Ahora, Claude puede escribir y ejecutar código JavaScript directamente en Claude.ai para realizar análisis de datos en tiempo real. Esta herramienta convierte a Claude en un analista de datos capaz de procesar archivos CSV, limpiar y analizar información, y ofrecer resultados precisos y comprobables, útiles en áreas como marketing, finanzas e ingeniería.

  • Estas innovaciones mejoran la capacidad de la IA para realizar tareas técnicas avanzadas y ofrecen un enfoque pionero en la interacción con computadoras, impulsando el desarrollo de herramientas automatizadas en diversas industrias.

Microsoft Amplía las Capacidades de IA con Agentes Autónomos en Copilot y Dynamics 365

  • Microsoft ha anunciado importantes avances en sus herramientas de inteligencia artificial, centrados en la introducción de agentes autónomos para Copilot y Dynamics 365. Estos agentes están diseñados para automatizar tareas complejas y mejorar la productividad en sectores clave, con un lanzamiento en vista para noviembre de 2024.

  • Puntos clave

    1. Agentes Autónomos en Copilot Studio y Dynamics 365
      Los nuevos agentes de Copilot Studio podrán actuar de manera autónoma en nombre de individuos, equipos o departamentos. Además, Dynamics 365 contará con diez agentes específicos para áreas como ventas, finanzas y gestión de la cadena de suministro, automatizando procesos críticos como la generación de clientes potenciales y la optimización logística.

    2. Integración de Datos y Eficiencia Mejorada
      Estos agentes pueden extraer contexto de fuentes de datos como Microsoft 365 Graph, Dataverse y Fabric, lo que les permite tomar decisiones informadas. Empresas que ya han adoptado estos agentes reportan mejoras significativas: McKinsey & Company redujo el tiempo de integración de clientes en un 90% y Thomson Reuters disminuyó a la mitad el tiempo de revisión legal.

    3. Seguridad y Cumplimiento de Normas
      Los agentes están diseñados con los estándares de seguridad y privacidad de Microsoft, incluyendo instrucciones y controles definidos por los usuarios. Esto garantiza que las organizaciones puedan implementar estos agentes sin comprometer la confidencialidad o la seguridad de los datos.

  • Los agentes autónomos de Microsoft representan un avance clave en la automatización de negocios, transformando procesos y aumentando la eficiencia en múltiples industrias. Esta tecnología puede reducir significativamente el tiempo y los costos operativos, impulsando la productividad y permitiendo a las empresas centrar sus recursos en tareas estratégicas de mayor valor.

  • LINK: https://blogs.microsoft.com/blog/2024/10/21/new-autonomous-agents-scale-your-team-like-never-before/

Genmo lanza Mochi 1, un nuevo modelo de generación de vídeo de código abierto

  • Genmo ha lanzado Mochi 1, un modelo de generación de video de última generación que promete competir con alternativas cerradas al mejorar la calidad del movimiento y la adherencia a las instrucciones textuales. Esta versión preliminar de código abierto está disponible bajo licencia Apache 2.0, permitiendo su uso personal y comercial sin restricciones.

  • Puntos clave

    1. Adherencia al Prompt y Calidad de Movimiento
      Mochi 1 destaca por su precisión en seguir instrucciones textuales, lo que permite generar videos detallados que reflejan fielmente el contenido deseado. Además, produce movimiento suave y realista, con una tasa de 30 fps y una duración de hasta 5.4 segundos, simulando dinámicas físicas como el movimiento de fluidos y el comportamiento del pelo y la piel.

    2. Innovadora Arquitectura de Difusión Asimétrica (AsymmDiT)
      Con un modelo de 10 mil millones de parámetros, Mochi 1 es la mayor arquitectura de generación de video lanzada abiertamente. Su estructura permite procesar grandes volúmenes de datos visuales y textuales simultáneamente, optimizando la memoria y mejorando la eficiencia en la generación de video.

    3. Compromiso con la Comunidad Open Source
      Mochi 1 se distribuye de forma gratuita y está disponible en plataformas como HuggingFace y GitHub, con el objetivo de fomentar la investigación y democratizar el acceso a tecnologías avanzadas de generación de video. Además, Genmo ha lanzado un “playground” gratuito para que cualquiera pueda experimentar con el modelo.

  • La apertura de Mochi 1 marca un avance significativo en el acceso a modelos de video generativos de alta calidad, hasta ahora dominados por sistemas propietarios. Esto facilita la creación de aplicaciones en sectores como el entretenimiento, la educación y la robótica, además de incentivar el desarrollo y experimentación en IA generativa.

Perplexity se Reinventa: Nuevas Funciones y Mejoras para una Búsqueda más Inteligente

  • Perplexity, la plataforma de IA de búsqueda, ha lanzado una serie de actualizaciones que amplían su funcionalidad y ofrecen una experiencia de usuario mejorada. Estas son las novedades más destacadas:

    1. Claude 3.5 en Perplexity Pro: La integración del modelo avanzado Claude 3.5, desarrollado por Anthropic, ofrece capacidades mejoradas en programación y razonamiento. Esto resulta ideal para usuarios que necesitan precisión y estructura en sus respuestas, especialmente en tareas técnicas.

    2. Pro Search con “Reasoning Mode”: Este nuevo modo permite a Perplexity Pro responder preguntas complejas con mayor profundidad, proporcionando análisis detallados para consultas multilaterales. Los usuarios pueden explorar temas más complejos y obtener respuestas bien fundamentadas.

    3. Internal Knowledge Search (búsqueda interna de conocimiento): Diseñada para entornos corporativos, esta función permite a las organizaciones buscar en archivos internos y en la web de forma simultánea. Esto optimiza la búsqueda de información al eliminar la necesidad de alternar entre sistemas y facilita una visión unificada y completa de los resultados.

  • Además, Anthropic ha lanzado la app de Perplexity para MacOS, permitiendo a los usuarios acceder a la plataforma desde cualquier aplicación en su sistema con solo presionar ⌘ + ⇧ + P.

  • Estas mejoras consolidan a Perplexity como una herramienta avanzada tanto para usuarios individuales como para empresas, facilitando una búsqueda de información más inteligente y adaptativa en un solo lugar.

Stable Diffusion 3.5: Nuevos Modelos para Creadores y Empresas

  • Stability AI ha lanzado Stable Diffusion 3.5, una actualización que incluye los modelos Stable Diffusion 3.5 Large, Large Turbo y próximamente Medium. Estos modelos son altamente personalizables, funcionan en hardware de consumo y están disponibles para uso comercial y no comercial bajo una licencia permisiva.

  • Puntos clave:

    1. Variedad de modelos: Stable Diffusion 3.5 Large (8 mil millones de parámetros) es el más poderoso, mientras que Large Turbo ofrece rapidez sin comprometer la calidad. El modelo Medium se lanzará el 29 de octubre, ideal para hardware estándar.

    2. Optimización y rendimiento: Los modelos están diseñados para personalización, con la capacidad de generar imágenes de alta calidad con estilos diversos, desde arte 3D hasta fotografía. Además, ofrecen tiempos de inferencia rápidos y son fáciles de ajustar.

    • Licencia flexible: Gratis para uso comercial (hasta $1M en ingresos anuales) y no comercial, permitiendo a los creadores mantener la propiedad de sus creaciones sin restricciones.

  • Stable Diffusion 3.5 refuerza la accesibilidad y la personalización en la generación de imágenes por IA, brindando herramientas de alta calidad tanto para investigadores como para startups, permitiendo nuevas formas de creatividad y automatización visual.

Runway Act-One Revoluciona la Animación de Personajes con IA

  • Runway ha lanzado Act-One, una nueva herramienta dentro de su plataforma Gen-3 Alpha, que permite generar animaciones expresivas de personajes usando solo un video de referencia y una imagen del personaje, sin necesidad de captura de movimiento ni rigging.

  • Puntos clave:

    1. Facilidad de uso con tecnología simplificada: Act-One elimina la necesidad de complejos procesos de captura de movimiento, permitiendo crear animaciones detalladas a partir de un simple video grabado con un celular.

    2. Fidelidad en las actuaciones: La herramienta traduce las microexpresiones, el ritmo y la entrega del actor original, logrando animaciones con una profundidad emocional impresionante.

    3. Adaptabilidad a diferentes estilos y diseños: Act-One funciona con cualquier diseño de personaje, ofreciendo resultados cinematográficos realistas desde varios ángulos y estilos visuales.

  • Act-One democratiza la animación facial y de personajes, abriendo nuevas posibilidades creativas para cineastas, animadores y creadores sin necesidad de costosos equipos o procesos técnicos complejos.

Ya está disponible la generación de imágenes con Gemini (Imagen 3)

  • Nos complace anunciar Imagen 3, nuestro modelo de generación de imágenes de mayor calidad hasta la fecha. Saca al artista que llevas dentro con lo siguiente:

    • Calidad de imagen impresionante: detalles nítidos, colores intensos y menos imperfecciones

    • Imágenes realistas: detalles fotorrealistas vibrantes que hacen que tus imágenes destaquen

    • Estilos variados: desde óleos clásicos hasta arte digital moderno

Ideogram lanza Canvas, una plataforma creativa para la generación y edición de imágenes con IA

  • El sistema presenta las herramientas “Magic Fill” para una edición precisa y “Extend” para expandir imágenes más allá de los bordes. Ambas herramientas mantienen un estilo consistente en todas las modificaciones.

nGPT: Las nueva arquitectura de Transformers hasta 20 veces más rápida que un GPT tradicional

  • El modelo nGPT introduce una nueva arquitectura basada en Transformers, llamada Transformer Normalizado, que utiliza el aprendizaje de representaciones en una hiperesfera. Esta innovación de NVIDIA busca mejorar la velocidad y estabilidad del entrenamiento en comparación con los modelos GPT tradicionales, reduciendo significativamente los recursos necesarios sin perder precisión.

  • PAPER: https://arxiv.org/pdf/2410.01131v1

  • En nuestro blog, desarrollamos el paper con más profundidad.

Robots

EngineAI presenta SE01, un robot humanoide que logra caminar de forma natural a través de módulos articulares avanzados y redes neuronales

  • El robot combina aprendizaje por refuerzo e imitación para producir pasos estables y rápidos que rompen con los movimientos robóticos tradicionales.

Clone Robotics muestra Torso, un androide bimanual impulsado por músculos artificiales

  • Este robot humanoide presenta articulaciones anatómicamente precisas en los hombros, el cuello y los brazos, con un sistema de control de válvulas integrado en su estructura de caja torácica.

Reflexiones Finales

ASI/AGI, Open vs Closed AI, Founding with Sam Altman, and Verifying Humanness!

xxx