Best-IA Newsletter
Posts
Boletín Semanal Best-IA #60

Boletín Semanal Best-IA #60

Aprende IA, día a día.

Best-IA
30 de septiembre de 2024

Best-IA. ¡Aprende IA, día a día!

Tutoriales

Tutorial Cursor para principiantes, aprende a programar mas rápido con AI

Cómo utilizar el Nuevo Modelo de Voz de ChatGPT en la UE

3 Casos de uso Útiles de la Voz Avanzada de ChatGPT 🤯 ¡Haz que Cante!

Noticias

Meta Connect 2024

Meta ha anunciado una serie de innovaciones impulsadas por inteligencia artificial, ampliando sus capacidades tanto en sus plataformas como en dispositivos de hardware. Estos avances incluyen desde nuevas funcionalidades en redes sociales hasta la introducción de modelos de IA más potentes.
1. Llama 3.2 Multimodal: Llama 3.2 incluye una colección de modelos de lenguaje de gran tamaño (LLMs) con versiones preentrenadas y afinadas en tamaños de 1B y 3B para texto únicamente, y de 11B y 90B que procesan tanto texto como imágenes, generando texto como salida.
  Los modelos de 1B y 3B parámetros están diseñados para aplicaciones que requieren solo procesamiento de texto, mientras que los modelos de 11B y 90B parámetros son multimodales, capaces de interpretar imágenes además de texto, lo que los hace adecuados para tareas como análisis de imágenes y generación de descripciones visuales.
  1. Para saber más sobre Llama 3.2: https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
  2. Meta ha especificado que los modelos multimodales de Llama 3.2, aquellos que pueden procesar tanto texto como imágenes, tienen limitaciones de uso en regiones con regulaciones estrictas, como la UE y el Reino Unido. Estas restricciones se deben a desafíos regulatorios en estas áreas.
2. Mejoras en las Gafas Ray-Ban Meta: Estas gafas ahora integran recordatorios visuales, escaneo de códigos QR, traducción en tiempo real y más, combinando inteligencia artificial con funcionalidad multimodal.
3. Orion: Las gafas de realidad aumentada más avanzadas
  Meta reveló Orion, unas gafas AR ligeras, con menos de 100 gramos, que permiten a los usuarios ver objetos virtuales en su entorno. Estas gafas ofrecen acceso a aplicaciones como WhatsApp y Messenger, así como la capacidad de hacer videollamadas y recibir información en tiempo real.
4. Casco de realidad mixta a precio asequible
  El nuevo Quest 3S de Meta es un casco de realidad mixta que se lanzará el 15 de octubre. Su precio comenzará en $299.99, ofreciendo una opción económica para experiencias inmersivas. Además, Meta ha reducido el precio de su Meta Quest 3 de 512GB a $499.99.
5. Funcionalidades IA para Reels: Meta implementa herramientas experimentales como doblaje automático y sincronización labial, permitiendo a los creadores generar contenido en múltiples idiomas de manera sencilla.
6. Contenidos Generados por IA en Facebook e Instagram: Con la función “Imagined for you”, los usuarios podrán interactuar con publicaciones generadas por IA, personalizadas en tiempo real y adaptadas a sus preferencias.
7. Nuevas Funciones de Voz para el Meta AI ChatBot
  Meta AI ahora será compatible con la voz, con una opción para seleccionar voces de celebridades como las de Judi Dench y John Cena. Se puede acceder a esta función a través de Meta AI en Facebook, Messenger, WhatsApp e Instagram mensaje directo.
Estos desarrollos colocan a Meta a la vanguardia de la integración de IA en plataformas sociales y dispositivos de realidad aumentada, destacando la privacidad, accesibilidad y personalización como pilares clave.

Lanzamiento del Modelo de Voz Avanzado de ChatGPT

Tras una larga espera desde su presentación, se ha producido el lanzamiento del modo de voz avanzado en ChatGPT, que marca un gran avance en la forma en que interactuamos con inteligencias artificiales.
Puntos Clave:
- Disponibilidad: El nuevo modo de voz está disponible para usuarios de ChatGPT Plus y Teams, pero no en la Unión Europea, aunque se puede acceder con VPN en estas regiones. Si eres usuario Plus o Team, verás una notificación en la aplicación cuando tengas acceso.
- Interacciones más naturales: La IA responde con inflexiones de voz, señales no verbales y hasta risas, logrando una conversación más fluida y humana, con mínima latencia entre respuestas.
- Mejoras en personalización: Incluye opciones para personalizar las respuestas, cinco nuevas voces, y memoria de interacciones previas. Además, admite más de 50 idiomas, lo que amplía su alcance global.
Este desarrollo acerca a la IA a una comunicación más parecida a la humana, mejorando tanto la experiencia del usuario como las aplicaciones potenciales en áreas como el servicio al cliente o la educación.

Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages.
— OpenAI (@OpenAI)
6:11 PM • Sep 24, 2024

Google mejora los Modelos Gemini 1.5: Reducción de Precios y Mayor Rendimiento

Google ha lanzado nuevas versiones de los modelos de IA Gemini: Gemini-1.5-Pro-002 y Gemini-1.5-Flash-002. Estas actualizaciones incluyen mejoras clave para desarrolladores que usan la API de Gemini y Google AI Studio.
Puntos Clave:
- Reducción de Costos y Mejor Rendimiento: Los precios de Gemini 1.5 Pro bajan un 50% para prompts menores de 128K tokens, con una latencia 3 veces menor y salida 2 veces más rápida. Además, los límites de velocidad se duplican en Flash y se triplican en Pro.
- Mejoras en Matemáticas, Visión y Código: El rendimiento ha aumentado hasta un 20% en tareas de matemáticas y visión, y entre un 2-7% en generación de código, permitiendo un uso más eficiente en proyectos complejos.
- Respuestas Más Útiles y Concisas: Las respuestas son ahora un 5-20% más cortas, lo que reduce costos, y se han ajustado los filtros de seguridad para dar más control a los desarrolladores
Estas mejoras impulsan el uso de Gemini en aplicaciones avanzadas, desde la síntesis de información compleja hasta el análisis de grandes volúmenes de datos multimedia, a un costo significativamente menor.
LINK: https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

AlphaChip: La IA de Google DeepMind que Revoluciona el Diseño de Chips

Google DeepMind ha desarrollado AlphaChip, una IA que utiliza aprendizaje por refuerzo para optimizar el diseño de chips electrónicos. Este avance promete revolucionar un proceso tradicionalmente largo y complejo, reduciendo tiempos y mejorando la eficiencia.
Puntos Clave:
- Automatización del floorplanning: AlphaChip aborda uno de los mayores retos del diseño de chips, la disposición física de sus componentes. Organiza de manera más rápida y eficiente miles de millones de transistores, optimizando variables como energía y rendimiento.
- Tecnología basada en redes neuronales gráficas: Utiliza redes neuronales gráficas para entender las relaciones entre los componentes del chip, mejorando el diseño con cada iteración. Esto ha permitido generar chips más eficientes en horas en lugar de meses.
- Impacto industrial: Empresas como MediaTek ya utilizan AlphaChip para acelerar el desarrollo de procesadores avanzados, impulsando innovaciones en dispositivos 5G y otros sectores.
AlphaChip podría transformar la industria de semiconductores, reduciendo costos y tiempos de desarrollo, mientras impulsa la creación de dispositivos más potentes y energéticamente eficientes.
LINK: https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/
PAPER: https://www.nature.com/articles/s41586-024-08032-5
Para saber más acerca de AlphaChip, visita nuestro blog: https://best-ia.es/alphachip-la-revolucion-de-la-ia-en-el-diseno-de-chips/

James Cameron se une a Stability AI: la convergencia entre IA y cine

El director James Cameron, famoso por películas como Alien, Terminator y Avatar, ha ingresado a la junta directiva de Stability AI.
Puntos Clave:
- 1. Visión tecnológica compartida
  Cameron ve en la IA generativa una herramienta revolucionaria para la creación de imágenes CGI, destacando el potencial de esta tecnología para redefinir la producción visual y narrativa en el cine.
  2. Experiencia con tecnologías emergentes
  El director explicó que su interés en Stability AI proviene de su trayectoria en la incorporación de tecnologías innovadoras en el cine. La IA generativa, en su opinión, representa el próximo gran avance en el arte de contar historias.
  3. Desafíos y controversias
  Stability AI enfrenta problemas legales y críticas en torno al uso de la IA. La industria cinematográfica, además, debate los posibles efectos negativos de la IA sobre los trabajos creativos y técnicos.
LINK: https://stability.ai/news/james-cameron-joins-stability-ai-board-of-directors

Hugging Chat lanza app para Mac: acceso rápido a modelos avanzados de IA

Hugging Chat ha presentado una nueva aplicación para Mac que permite a los usuarios acceder a modelos de lenguaje de última generación como Qwen 2.5 (72B), Command R+, Phi 3.5 y Mistral 12B con un solo clic.
1. Funcionalidades clave
La app incluye búsqueda web integrada y resalta código, ofreciendo una experiencia optimizada para trabajar con modelos de IA de forma gratuita.
2. Acceso a LLMs de vanguardia
Los usuarios pueden experimentar con varios modelos avanzados de lenguaje sin costo, lo que facilita la exploración y el uso de IA de última generación.
3. Sorpresas adicionales
Además, la aplicación incluye divertidos "easter eggs" como temas visuales inspirados en el Macintosh y Pixel pals, añadiendo un toque lúdico a la experiencia.
Esta app simplifica el acceso a potentes modelos de IA, potenciando la productividad y creatividad de los usuarios de Mac, al mismo tiempo que incorpora funciones y detalles que mejoran la experiencia de uso.
GITHUB REPO: https://github.com/huggingface/chat-macOS

Robots

Xiao Wu: el robot híbrido de Tencent

Tencent Robotics X Lab ha lanzado su nuevo robot, Xiao Wu, como parte de su apuesta por la robótica avanzada. Este robot de quinta generación combina movilidad bípeda y ruedas, lo que le permite alternar entre caminar y desplazarse a mayor velocidad dependiendo del terreno y la necesidad. Xiao Wu está diseñado para entornos donde viven personas, como hogares y centros de atención para ancianos, lo que refuerza su enfoque en la integración en la vida cotidiana.

Boletín Semanal Best-IA #60

Aprende IA, día a día.

Tutoriales

Tutorial Cursor para principiantes, aprende a programar mas rápido con AI

Cómo utilizar el Nuevo Modelo de Voz de ChatGPT en la UE

3 Casos de uso Útiles de la Voz Avanzada de ChatGPT 🤯 ¡Haz que Cante!

Noticias

Meta Connect 2024

Lanzamiento del Modelo de Voz Avanzado de ChatGPT

Google mejora los Modelos Gemini 1.5: Reducción de Precios y Mayor Rendimiento

AlphaChip: La IA de Google DeepMind que Revoluciona el Diseño de Chips

James Cameron se une a Stability AI: la convergencia entre IA y cine

Hugging Chat lanza app para Mac: acceso rápido a modelos avanzados de IA

Robots

Xiao Wu: el robot híbrido de Tencent

Reflexiones Finales

DIGITAL BRAINS: Análisis del estado del arte de la Inteligencia Artificial

OpenAI o1: Camino a las IAs con RAZONAMIENTO SOBREHUMANO | Análisis completo