Boletín Semanal Best-IA #53

Aprende IA, día a día.

Tutoriales

Tutorial Kling AI en Español. ¡Crea videos gratis!

Tutorial de RouteLLM - Calidad GPT4o, pero un 80% más barato

Tutorial MoA + Groq - Lo último en arquitectura LLM

ChatGPT 4o Mini en Google Sheets gratis

Noticias

Meta lanza LLaMa 3.1, el modelo de IA de código abierto más potente hasta la fecha

  • Meta ha lanzado la versión 3.1 de su modelo Llama, con opciones de 405B, 70B y 8B parámetros.

    Puntos clave:

    1. Rendimiento de primer nivel: La versión de 405B ofrece un rendimiento comparable con los mejores modelos cerrados del mercado.

    2. Acceso abierto: Llama 3.1 está disponible con pesos y código abiertos, permitiendo ajustes personalizados, destilación en otros modelos y despliegue en cualquier plataforma.

    3. Características avanzadas: Ofrece un contexto de 128k tokens, capacidades multilingües, generación de código eficiente y razonamiento complejo. Además, incluye la API Llama Stack para una fácil integración.

  • La diferencia de precisión entre el código abierto y el propietario es ahora insignificante, y el código abierto es más barato, rápido, personalizable y sostenible para las empresas.

SearchGPT: OpenAI anuncia su nuevo prototipo de búsqueda en la web

  • OpenAI ha lanzado SearchGPT, un prototipo temporal de búsqueda que combina la IA con información actualizada de la web para ofrecer respuestas rápidas y con fuentes relevantes.

  • Puntos clave:

    1. Respuestas rápidas y precisas: SearchGPT se centra en proporcionar información actualizada y precisa directamente de la web, acompañado de enlaces claros a las fuentes originales.

    2. Interacción conversacional: Permite a los usuarios realizar preguntas de seguimiento, simulando una conversación continua, lo que facilita la búsqueda de información específica.

    3. Colaboración con editores: OpenAI trabaja con editores y creadores para asegurar que el contenido de alta calidad sea destacado y accesible, respetando la integridad de las fuentes y promoviendo un ecosistema de búsqueda más robusto.

  • El acceso a SearchGPT es actualmente limitado a un grupo selecto de usuarios y editores para recopilar feedback y mejorar el sistema. Los interesados en probar este nuevo prototipo pueden inscribirse en una lista de espera, lo que les permitirá ser de los primeros en experimentar las nuevas funcionalidades de búsqueda asistida por IA.

  • LINK: https://openai.com/index/searchgpt-prototype/

Mistral lanza Mistral Large 2

  • Mistral AI presenta Mistral Large 2, una versión significativamente mejorada de su modelo insignia. Este modelo se destaca en generación de código, matemáticas y razonamiento, y proporciona un soporte multilingüe avanzado junto con nuevas capacidades de llamadas a funciones.

  • Puntos Clave:

    1. Capacidades Técnicas Mejoradas: Con una ventana de contexto de 128k y 123 mil millones de parámetros, Mistral Large 2 soporta más de 80 lenguajes de programación y múltiples idiomas, incluyendo francés, alemán, español, chino, árabe y ruso. Estas mejoras lo posicionan competitivamente frente a modelos líderes como GPT-4o y Llama 3 405B, destacando en benchmarks de precisión y eficiencia de costos.

    2. Razonamiento y Seguimiento de Instrucciones: El modelo ha sido entrenado específicamente para reducir la generación de información incorrecta y mejorar el reconocimiento de sus limitaciones. Esto se traduce en un rendimiento superior en benchmarks matemáticos y de generación de código, mostrando habilidades de razonamiento mejoradas.

  • Disponibilidad y Licenciamiento: Disponible bajo la Licencia de Investigación de Mistral para usos no comerciales, Mistral Large 2 también puede ser adquirido para uso comercial. Está accesible en plataformas de nube como Google Cloud y Amazon Bedrock, facilitando su integración en aplicaciones empresariales.

  • Importancia y Aplicaciones

    • Mistral Large 2 no solo amplía las capacidades de los modelos de IA actuales, sino que también proporciona una herramienta vital para negocios que operan en múltiples idiomas y necesitan manejar grandes volúmenes de datos. Su precisión y eficiencia lo hacen especialmente útil en sectores como el desarrollo de software, la traducción automática y la asistencia técnica avanzada.

Precisión de rendimiento en pruebas de generación de código.

Un nuevo sistema de Google Deepmind logra la medalla de plata resolviendo problemas de la Olimpiada Matemática Internacional

  • Los sistemas de IA de Google AlphaProof y AlphaGeometry 2, trabajando juntos, alcanzaron un hito significativo en el Concurso Internacional de Matemáticas (IMO) al resolver problemas matemáticos complejos con una puntuación equivalente a una medalla de plata. Este avance demuestra el potencial de la colaboración entre diferentes modelos de IA para abordar desafíos matemáticos complejos.

  • Puntos Clave:

    1. Rendimiento Conjunto Excepcional: Los modelos AlphaProof y AlphaGeometry 2 colaboraron para resolver cuatro de los seis problemas del IMO 2024, acumulando 28 puntos, un resultado comparable al nivel de medalla de plata, un logro sin precedentes para una IA en esta competencia.

    2. Tecnologías Complementarias: AlphaProof aplicó aprendizaje por refuerzo y lenguaje formal para problemas de álgebra y teoría de números, mientras que AlphaGeometry 2 usó un enfoque neuro-simbólico para resolver problemas de geometría de manera rápida y precisa.

    3. Evaluación Rigurosa: Las soluciones propuestas por los sistemas fueron evaluadas y validadas por matemáticos expertos, asegurando que la calidad y precisión del trabajo fueran comparables a las de los mejores participantes humanos.

  • Importancia e Implicaciones:
    La colaboración entre estos sistemas de IA subraya su creciente capacidad para resolver problemas matemáticos complejos, potencialmente acelerando avances en diversas disciplinas científicas. A corto plazo, estas herramientas podrían asistir a matemáticos en la exploración de nuevos enfoques y la resolución eficiente de problemas, mejorando tanto la velocidad como la precisión de sus investigaciones.

Stability AI publica el documento de investigación para Stable Audio Open

  • Stability AI ha lanzado Stable Audio Open, su modelo de texto a audio de código abierto que permite generar audio estéreo de alta calidad a 44.1kHz a partir de indicaciones textuales. Esta innovación está diseñada para ser accesible y eficiente, funcionando en GPUs de uso común.

  • Puntos clave

    1. Arquitectura avanzada: El modelo emplea un autoencoder para comprimir formas de onda, un T5 para el acondicionamiento de texto y un modelo de difusión basado en transformadores. Esto permite la generación de audio realista y variado.

    2. Datos de entrenamiento: Fue entrenado con aproximadamente 500,000 grabaciones bajo licencias Creative Commons, garantizando transparencia y evitando contenido con derechos de autor.

    3. Casos de uso: Stable Audio Open se puede utilizar para diseño de sonido, efectos ambientales, creación de muestras musicales, branding de audio y proyectos educativos.

  • Importancia e implicaciones
    El lanzamiento de Stable Audio Open democratiza el acceso a la tecnología avanzada de síntesis de audio, permitiendo a investigadores, artistas y desarrolladores explorar nuevas fronteras en el campo del audio generado por IA. Este modelo no solo amplía las posibilidades creativas, sino que también subraya el compromiso de la comunidad con la transparencia y el acceso abierto a herramientas de última generación.

  • LINK: https://stability.ai/news/stable-audio-open-research-paper

Lanzamiento mundial de la versión internacional 1.0 de Kling AI

  • Kling funciona como una plataforma avanzada de IA diseñada para generar contenido de video a partir de texto.

  • Utiliza mecanismos de atención conjunta espaciotemporal 3D, lo que le permite modelar movimientos complejos y producir videos de alta calidad, hasta 2 minutos de duración y con una resolución de 1080p, lo que equivale a calidad cinematográfica.

  • El inicio de sesión diario concede 66 créditos gratuitos para la creación de vídeos.

  • Múltiples funciones de creación de vídeos disponibles.

  • LINK: https://klingai.com/

Reflexiones Finales

Mark Zuckerberg habla de Llama 3.1, código abierto, agentes de IA, seguridad y mucho más

  • Entrevista con Mark Zuckerberg, CEO de Meta, sobre el lanzamiento de Llama 3.1, un modelo de IA de código abierto con 405 mil millones de parámetros. A lo largo de la conversación, se abordan diversos temas, incluyendo la competencia con modelos cerrados, la visión de Zuckerberg sobre el futuro de la IA y AGI, la importancia de la apertura en el desarrollo tecnológico, y las implicaciones sociales y económicas de estas tecnologías.