Best-IA Newsletter
Posts
Boletín Semanal Best-IA #64

Boletín Semanal Best-IA #64

Aprende IA, día a día.

Best-IA
28 de octubre de 2024

Best-IA. ¡Aprende IA, día a día!

Noticias

Anthropic lanza una nueva versión de Claude 3.5 Sonnet y Haiku con Innovadoras Capacidades

Anthropic ha lanzado dos nuevas versiones de su modelo de IA: Claude 3.5 Sonnet, con mejoras significativas en tareas de programación, y Claude 3.5 Haiku, que combina velocidad y rendimiento. Además, se han introducido dos capacidades experimentales: el uso de computadoras, permitiendo a Claude interactuar directamente con interfaces de software, y la herramienta de análisis, que permite a Claude ejecutar código JavaScript para realizar análisis de datos en tiempo real dentro de Claude.ai.
Puntos clave:
1. Mejoras en Claude 3.5 Sonnet: Ofrece avances en codificación y uso de herramientas, superando a sus predecesores en benchmarks y siendo ideal para tareas complejas de desarrollo de software.
2. Claude 3.5 Haiku: Un modelo más rápido y asequible, supera al modelo anterior más grande, Claude 3 Opus, en muchas evaluaciones, manteniendo bajo costo y latencia.
3. “Computer Use”: Claude ahora puede usar software estándar moviendo un cursor y tecleando, lo que abre nuevas oportunidades para automatizar procesos repetitivos y tareas abiertas.
4. Analysis Tool: Ahora, Claude puede escribir y ejecutar código JavaScript directamente en Claude.ai para realizar análisis de datos en tiempo real. Esta herramienta convierte a Claude en un analista de datos capaz de procesar archivos CSV, limpiar y analizar información, y ofrecer resultados precisos y comprobables, útiles en áreas como marketing, finanzas e ingeniería.
Estas innovaciones mejoran la capacidad de la IA para realizar tareas técnicas avanzadas y ofrecen un enfoque pionero en la interacción con computadoras, impulsando el desarrollo de herramientas automatizadas en diversas industrias.

LINKS:

Microsoft Amplía las Capacidades de IA con Agentes Autónomos en Copilot y Dynamics 365

Microsoft ha anunciado importantes avances en sus herramientas de inteligencia artificial, centrados en la introducción de agentes autónomos para Copilot y Dynamics 365. Estos agentes están diseñados para automatizar tareas complejas y mejorar la productividad en sectores clave, con un lanzamiento en vista para noviembre de 2024.
Puntos clave
1. Agentes Autónomos en Copilot Studio y Dynamics 365
  Los nuevos agentes de Copilot Studio podrán actuar de manera autónoma en nombre de individuos, equipos o departamentos. Además, Dynamics 365 contará con diez agentes específicos para áreas como ventas, finanzas y gestión de la cadena de suministro, automatizando procesos críticos como la generación de clientes potenciales y la optimización logística.
2. Integración de Datos y Eficiencia Mejorada
  Estos agentes pueden extraer contexto de fuentes de datos como Microsoft 365 Graph, Dataverse y Fabric, lo que les permite tomar decisiones informadas. Empresas que ya han adoptado estos agentes reportan mejoras significativas: McKinsey & Company redujo el tiempo de integración de clientes en un 90% y Thomson Reuters disminuyó a la mitad el tiempo de revisión legal.
3. Seguridad y Cumplimiento de Normas
  Los agentes están diseñados con los estándares de seguridad y privacidad de Microsoft, incluyendo instrucciones y controles definidos por los usuarios. Esto garantiza que las organizaciones puedan implementar estos agentes sin comprometer la confidencialidad o la seguridad de los datos.
Los agentes autónomos de Microsoft representan un avance clave en la automatización de negocios, transformando procesos y aumentando la eficiencia en múltiples industrias. Esta tecnología puede reducir significativamente el tiempo y los costos operativos, impulsando la productividad y permitiendo a las empresas centrar sus recursos en tareas estratégicas de mayor valor.
LINK: https://blogs.microsoft.com/blog/2024/10/21/new-autonomous-agents-scale-your-team-like-never-before/

Genmo lanza Mochi 1, un nuevo modelo de generación de vídeo de código abierto

Genmo ha lanzado Mochi 1, un modelo de generación de video de última generación que promete competir con alternativas cerradas al mejorar la calidad del movimiento y la adherencia a las instrucciones textuales. Esta versión preliminar de código abierto está disponible bajo licencia Apache 2.0, permitiendo su uso personal y comercial sin restricciones.
Puntos clave
1. Adherencia al Prompt y Calidad de Movimiento
  Mochi 1 destaca por su precisión en seguir instrucciones textuales, lo que permite generar videos detallados que reflejan fielmente el contenido deseado. Además, produce movimiento suave y realista, con una tasa de 30 fps y una duración de hasta 5.4 segundos, simulando dinámicas físicas como el movimiento de fluidos y el comportamiento del pelo y la piel.
2. Innovadora Arquitectura de Difusión Asimétrica (AsymmDiT)
  Con un modelo de 10 mil millones de parámetros, Mochi 1 es la mayor arquitectura de generación de video lanzada abiertamente. Su estructura permite procesar grandes volúmenes de datos visuales y textuales simultáneamente, optimizando la memoria y mejorando la eficiencia en la generación de video.
3. Compromiso con la Comunidad Open Source
  Mochi 1 se distribuye de forma gratuita y está disponible en plataformas como HuggingFace y GitHub, con el objetivo de fomentar la investigación y democratizar el acceso a tecnologías avanzadas de generación de video. Además, Genmo ha lanzado un “playground” gratuito para que cualquiera pueda experimentar con el modelo.
La apertura de Mochi 1 marca un avance significativo en el acceso a modelos de video generativos de alta calidad, hasta ahora dominados por sistemas propietarios. Esto facilita la creación de aplicaciones en sectores como el entretenimiento, la educación y la robótica, además de incentivar el desarrollo y experimentación en IA generativa.

Introducing Mochi 1 preview. A new SOTA in open-source video generation. Apache 2.0.
magnet:?xt=urn:btih:441da1af7a16bcaa4f556964f8028d7113d21cbb&dn=weights&tr=udp://tracker.opentrackr.org:1337/announce
— Genmo (@genmoai)
4:24 PM • Oct 22, 2024

LINK: https://www.genmo.ai/blog

Perplexity se Reinventa: Nuevas Funciones y Mejoras para una Búsqueda más Inteligente

Pro Search is now more powerful. Introducing Reasoning Mode!
Challenge your own curiosity. Ask multi-layered questions. Perplexity will adapt.
Try it yourself (sample queries in thread)👇
— Perplexity (@perplexity_ai)
6:55 PM • Oct 22, 2024

Perplexity, la plataforma de IA de búsqueda, ha lanzado una serie de actualizaciones que amplían su funcionalidad y ofrecen una experiencia de usuario mejorada. Estas son las novedades más destacadas:
1. Claude 3.5 en Perplexity Pro: La integración del modelo avanzado Claude 3.5, desarrollado por Anthropic, ofrece capacidades mejoradas en programación y razonamiento. Esto resulta ideal para usuarios que necesitan precisión y estructura en sus respuestas, especialmente en tareas técnicas.
2. Pro Search con “Reasoning Mode”: Este nuevo modo permite a Perplexity Pro responder preguntas complejas con mayor profundidad, proporcionando análisis detallados para consultas multilaterales. Los usuarios pueden explorar temas más complejos y obtener respuestas bien fundamentadas.
3. Internal Knowledge Search (búsqueda interna de conocimiento): Diseñada para entornos corporativos, esta función permite a las organizaciones buscar en archivos internos y en la web de forma simultánea. Esto optimiza la búsqueda de información al eliminar la necesidad de alternar entre sistemas y facilita una visión unificada y completa de los resultados.
Además, Anthropic ha lanzado la app de Perplexity para MacOS, permitiendo a los usuarios acceder a la plataforma desde cualquier aplicación en su sistema con solo presionar ⌘ + ⇧ + P.
Estas mejoras consolidan a Perplexity como una herramienta avanzada tanto para usuarios individuales como para empresas, facilitando una búsqueda de información más inteligente y adaptativa en un solo lugar.

Stable Diffusion 3.5: Nuevos Modelos para Creadores y Empresas

Stability AI ha lanzado Stable Diffusion 3.5, una actualización que incluye los modelos Stable Diffusion 3.5 Large, Large Turbo y próximamente Medium. Estos modelos son altamente personalizables, funcionan en hardware de consumo y están disponibles para uso comercial y no comercial bajo una licencia permisiva.
Puntos clave:
1. Variedad de modelos: Stable Diffusion 3.5 Large (8 mil millones de parámetros) es el más poderoso, mientras que Large Turbo ofrece rapidez sin comprometer la calidad. El modelo Medium se lanzará el 29 de octubre, ideal para hardware estándar.
2. Optimización y rendimiento: Los modelos están diseñados para personalización, con la capacidad de generar imágenes de alta calidad con estilos diversos, desde arte 3D hasta fotografía. Además, ofrecen tiempos de inferencia rápidos y son fáciles de ajustar.
- Licencia flexible: Gratis para uso comercial (hasta $1M en ingresos anuales) y no comercial, permitiendo a los creadores mantener la propiedad de sus creaciones sin restricciones.
Stable Diffusion 3.5 refuerza la accesibilidad y la personalización en la generación de imágenes por IA, brindando herramientas de alta calidad tanto para investigadores como para startups, permitiendo nuevas formas de creatividad y automatización visual.

Introducing Stable Diffusion 3.5, our most powerful models yet.
This open release includes multiple variants that are highly customizable for their size, run on consumer hardware, and are free for both commercial and non-commercial use under the permissive Stability AI Community… x.com/i/web/status/1…
— Stability AI (@StabilityAI)
2:12 PM • Oct 22, 2024

LINK: https://stability.ai/news/introducing-stable-diffusion-3-5

Runway Act-One Revoluciona la Animación de Personajes con IA

Runway ha lanzado Act-One, una nueva herramienta dentro de su plataforma Gen-3 Alpha, que permite generar animaciones expresivas de personajes usando solo un video de referencia y una imagen del personaje, sin necesidad de captura de movimiento ni rigging.
Puntos clave:
1. Facilidad de uso con tecnología simplificada: Act-One elimina la necesidad de complejos procesos de captura de movimiento, permitiendo crear animaciones detalladas a partir de un simple video grabado con un celular.
2. Fidelidad en las actuaciones: La herramienta traduce las microexpresiones, el ritmo y la entrega del actor original, logrando animaciones con una profundidad emocional impresionante.
3. Adaptabilidad a diferentes estilos y diseños: Act-One funciona con cualquier diseño de personaje, ofreciendo resultados cinematográficos realistas desde varios ángulos y estilos visuales.
Act-One democratiza la animación facial y de personajes, abriendo nuevas posibilidades creativas para cineastas, animadores y creadores sin necesidad de costosos equipos o procesos técnicos complejos.

Act-One allows you to faithfully capture the essence of an actor's performance and transpose it to your generation. Where traditional pipelines for facial animation involve complex, multi-step workflows, Act-One works with a single driving video that can be shot on something as… x.com/i/web/status/1…
— Runway (@runwayml)
5:58 PM • Oct 22, 2024

LINK: https://runwayml.com/research/introducing-act-one

Ya está disponible la generación de imágenes con Gemini (Imagen 3)

Nos complace anunciar Imagen 3, nuestro modelo de generación de imágenes de mayor calidad hasta la fecha. Saca al artista que llevas dentro con lo siguiente:
- Calidad de imagen impresionante: detalles nítidos, colores intensos y menos imperfecciones
- Imágenes realistas: detalles fotorrealistas vibrantes que hacen que tus imágenes destaquen
- Estilos variados: desde óleos clásicos hasta arte digital moderno

Ha llegado el momento que todos esperábamos... 🥁🥁🥁
¡Ya está disponible la generación de imágenes con Gemini! Te dejamos este vídeo contando cómo funciona. ¡Las posibilidades son infinitas! gemini.google.com/app
— Google España (@GoogleES)
10:22 AM • Oct 21, 2024

LINK: https://gemini.google.com/

Ideogram lanza Canvas, una plataforma creativa para la generación y edición de imágenes con IA

El sistema presenta las herramientas “Magic Fill” para una edición precisa y “Extend” para expandir imágenes más allá de los bordes. Ambas herramientas mantienen un estilo consistente en todas las modificaciones.

Today, we’re introducing Ideogram Canvas, an infinite creative board for organizing, generating, editing, and combining images.
Bring your face or brand visuals to Ideogram Canvas and use industry-leading Magic Fill and Extend to blend them with creative, AI-generated content.
— Ideogram (@ideogram_ai)
4:05 PM • Oct 22, 2024

nGPT: Las nueva arquitectura de Transformers hasta 20 veces más rápida que un GPT tradicional

El modelo nGPT introduce una nueva arquitectura basada en Transformers, llamada Transformer Normalizado, que utiliza el aprendizaje de representaciones en una hiperesfera. Esta innovación de NVIDIA busca mejorar la velocidad y estabilidad del entrenamiento en comparación con los modelos GPT tradicionales, reduciendo significativamente los recursos necesarios sin perder precisión.
PAPER: https://arxiv.org/pdf/2410.01131v1
En nuestro blog, desarrollamos el paper con más profundidad.

Robots

EngineAI presenta SE01, un robot humanoide que logra caminar de forma natural a través de módulos articulares avanzados y redes neuronales

Finally, a humanoid robot with a natural, human-like walking gait.
Chinese company EngineAI just unveiled their life-size general-purpose humanoid SE01.
— The Humanoid Hub (@TheHumanoidHub)
7:29 AM • Oct 24, 2024

El robot combina aprendizaje por refuerzo e imitación para producir pasos estables y rápidos que rompen con los movimientos robóticos tradicionales.

Clone Robotics muestra Torso, un androide bimanual impulsado por músculos artificiales

Introducing Torso, a bimanual android actuated with artificial muscles.
— Clone (@clonerobotics)
8:10 PM • Oct 23, 2024

Este robot humanoide presenta articulaciones anatómicamente precisas en los hombros, el cuello y los brazos, con un sistema de control de válvulas integrado en su estructura de caja torácica.

Boletín Semanal Best-IA #64

Aprende IA, día a día.

Noticias

Anthropic lanza una nueva versión de Claude 3.5 Sonnet y Haiku con Innovadoras Capacidades

Microsoft Amplía las Capacidades de IA con Agentes Autónomos en Copilot y Dynamics 365

Genmo lanza Mochi 1, un nuevo modelo de generación de vídeo de código abierto

Perplexity se Reinventa: Nuevas Funciones y Mejoras para una Búsqueda más Inteligente

Stable Diffusion 3.5: Nuevos Modelos para Creadores y Empresas

Runway Act-One Revoluciona la Animación de Personajes con IA

Ya está disponible la generación de imágenes con Gemini (Imagen 3)

Ideogram lanza Canvas, una plataforma creativa para la generación y edición de imágenes con IA

nGPT: Las nueva arquitectura de Transformers hasta 20 veces más rápida que un GPT tradicional

Robots

EngineAI presenta SE01, un robot humanoide que logra caminar de forma natural a través de módulos articulares avanzados y redes neuronales

Clone Robotics muestra Torso, un androide bimanual impulsado por músculos artificiales

Reflexiones Finales

ASI/AGI, Open vs Closed AI, Founding with Sam Altman, and Verifying Humanness!

xxx