- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #43
Boletín Semanal Best-IA #43
Aprende IA, día a día.
Tutoriales
GPT-4o API: Curso acelerado para principiantes
Introducción a la API de GPT-4o, comprensión de imágenes, llamadas a funciones y MÁS
Noticias
OpenAI presenta GPT-4o y más herramientas para los usuarios gratuitos de ChatGPT
GPT-4o es el nuevo modelo de OpenAI, que mejora las capacidades de GPT-4 con mayor velocidad e inteligencia en el manejo de texto, voz e imagen. Supera a los modelos anteriores, ofreciendo funcionalidades innovadoras como la discusión de imágenes, interacciones de voz en tiempo real y capacidades conversacionales con video.
Velocidad e Inteligencia Mejoradas: Tiempos de respuesta más rápidos y interacciones más inteligentes que las versiones anteriores.
Capacidades Multimodales: Capacidad para entender e interactuar simultáneamente con texto, voz e imágenes.
Interacción en Tiempo Real: Las futuras actualizaciones permitirán conversaciones en vivo por voz y video.
Soporte Mejorado de Idiomas: Soporta más de 50 idiomas, mejorando la accesibilidad global.
Acceso a Herramientas Avanzadas: Introducción de nuevas funciones como memoria y la capacidad de interactuar con diferentes formatos de medios.
Herramientas Avanzadas para Usuarios Gratuitos. OpenAI ahora permite el acceso a sus herramientas de IA más recientes al incorporar características avanzadas en la versión gratuita de ChatGPT.
Inteligencia Nivel GPT-4: Acceso a las capacidades del modelo de IA más reciente.
Conjunto de Funciones Expandidas: Capacidad para crear gráficos, discutir fotos y cargar archivos para varios análisis.
Integración de la Tienda GPT: Explora y utiliza GPTs especializados adaptados para diferentes tareas.
Interacción Mejorada: Interactúa con la IA mediante texto, voz y pronto, video.
Límites de Uso: Acceso gratuito con ciertas limitaciones, cambiando a GPT-3.5 al alcanzar el límite.
Nueva Aplicación de Escritorio ChatGPT. El lanzamiento de la nueva aplicación de escritorio ChatGPT para macOS facilita una integración perfecta en los flujos de trabajo diarios de los usuarios, mejorando la productividad e interactividad directamente desde el escritorio. Esta aplicación soporta interacciones tanto textuales como de voz, con planes futuros para capacidades de video.
Integración Sin Esfuerzos: Acceso rápido mediante atajos de teclado e interacciones directas con la aplicación.
Conversaciones de Voz y Texto: Participa en múltiples modos de interacción directamente desde el escritorio.
Capacidades de Video Futuras: Actualizaciones planificadas para incluir interacciones de video en tiempo real.
Acceso Anticipado para Usuarios Plus: Implementación inicial para suscriptores Plus, con disponibilidad más amplia próximamente.
Interfaz de Usuario Simplificada: Diseño actualizado para una navegación e interacción más fáciles.
Ilya Sutskever abandona OpenAI
Además de Ilya y Jan Leike, otros miembros clave del equipo Superalignment, que debía garantizar que la IA no se volviera rebelde, abandonan OpenAI.
Afirma Leike: “Llevo bastante tiempo discrepando con la dirección de OpenAI sobre las prioridades fundamentales de la empresa, hasta que por fin hemos llegado a un punto de ruptura.
Creo que deberíamos dedicar mucho más ancho de banda a prepararnos para las próximas generaciones de modelos, en seguridad, supervisión, preparación, protección, solidez frente a adversarios, (super)alineación, confidencialidad, impacto social y temas relacionados.
Estos problemas son bastante difíciles de solucionar, y me preocupa que no estemos en la trayectoria adecuada para conseguirlo.
Construir máquinas más inteligentes que los humanos es una empresa intrínsecamente peligrosa.OpenAI asume una enorme responsabilidad en nombre de toda la humanidad, pero en los últimos años, la cultura y los procesos de seguridad han pasado a un segundo plano.
Llevamos mucho retraso en tomarnos increíblemente en serio las implicaciones de la AGI.Debemos dar prioridad a prepararnos para ellas lo mejor que podamos.
Sólo entonces podremos garantizar que la AGI beneficie a toda la humanidad.“
En general, la seguridad en OpenAI siempre ha sido un tema controvertido. Eso es lo que llevó a Dario y Daniela Amodei en 2021 a fundar su propia empresa de IA, Anthropic, junto con otros nueve antiguos empleados de OpenAI. Las preocupaciones por la seguridad también fueron lo que supuestamente llevó a los miembros de la junta sin ánimo de lucro de OpenAI a expulsar a Altman y Brockman.
After almost a decade, I have made the decision to leave OpenAI. The company’s trajectory has been nothing short of miraculous, and I’m confident that OpenAI will build AGI that is both safe and beneficial under the leadership of @sama, @gdb, @miramurati and now, under the… x.com/i/web/status/1…
— Ilya Sutskever (@ilyasut)
11:00 PM • May 14, 2024
Yesterday was my last day as head of alignment, superalignment lead, and executive @OpenAI.
— Jan Leike (@janleike)
3:57 PM • May 17, 2024
Ilya and OpenAI are going to part ways. This is very sad to me; Ilya is easily one of the greatest minds of our generation, a guiding light of our field, and a dear friend. His brilliance and vision are well known; his warmth and compassion are less well known but no less… x.com/i/web/status/1…
— Sam Altman (@sama)
11:02 PM • May 14, 2024
ChatGPT obtiene acceso a Reddit en tiempo real
OpenAI acaba de firmar un acuerdo para acceder al contenido en tiempo real de la API de datos de Reddit, que ahora permitirá a OpenAI enlazar debates del sitio dentro de ChatGPT.
OpenAI accederá a la API de datos de Reddit, que proporciona contenidos en tiempo real, estructurados y exclusivos de Reddit. Esto permitirá a las herramientas de IA de OpenAI comprender y mostrar mejor el contenido de Reddit, especialmente sobre temas recientes.
Esta asociación también permitirá a Reddit ofrecer nuevas funciones basadas en IA a los redditors y mods. Reddit se basará en la plataforma de modelos de IA de OpenAI para hacer realidad su potente visión.
Además, OpenAI se convertirá en socio publicitario de Reddit.
Con esta nueva asociación, ChatGPT podrá competir con la forma en que Grok de xAI tiene actualizaciones automáticas de noticias a través de X utilizando las noticias de Reddit. Además, el próximo chatbot AI Search de OpenAI probablemente se beneficiará en gran medida de la información en tiempo real de Reddit.
LINK: https://openai.com/index/openai-and-reddit-partnership/
Google revela sus últimos avances en IA en la Google I/O 2024
Nuevos modelos de Gemini:
Gemini 1.5 Flash, un nuevo modelo ligero con una ventana contextual de 1M.
Gemini 1.5 Pro - Esta actualización lleva a Pro de una ventana contextual de 1M a 2M.
Gemini Live - Habla con la IA mediante voz/vídeo.
Las funciones de Gemini están llegando al resto de las aplicaciones de consumo de Google, como Búsqueda, Gmail, Android, YouTube, etc.
Veo, el competidor de Sora para creación de video de alta calidad.
Project Astra, el futuro de los asistentes de inteligencia artificial.
Imagen 3, el modelo de generación de texto a imagen de mayor calidad hasta la fecha.
Trillium, una TPU (competidora de la GPU) que multiplica por 4,7 el rendimiento de cálculo.
Nuevas CPU y GPU para los clientes de Google Cloud.
Axion (las primeras CPU de Google basadas en Arm): Hasta un 50% más de rendimiento y un 60% más de eficiencia energética que la generación actual.
Nvidia Blackwell: las últimas GPU de Nvidia: 5 veces menos coste y consumo energético que su predecesora
Agentes de IA que realizan tareas en todo el ecosistema de productos de Google.
Respuestas de audio en NotebookLM.
Gemma 2 llegará el mes que viene, y PaliGemma (Vision) ya está disponible.
Y mucho más.
We’re sharing Project Astra: our new project focused on building a future AI assistant that can be truly helpful in everyday life. 🤝
Watch it in action, with two parts - each was captured in a single take, in real time. ↓ #GoogleIO
— Google DeepMind (@GoogleDeepMind)
5:26 PM • May 14, 2024
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO
— Google DeepMind (@GoogleDeepMind)
5:31 PM • May 14, 2024
Apple anuncia que iOS 18 introducirá el 'Eye Tracking' impulsado por IA
Apple acaba de anunciar un montón de nuevas funciones de accesibilidad que llegarán a iOS 18, como el seguimiento ocular potenciado por IA, la háptica musical o los atajos vocales, entre otras.
De esta forma, los usuarios con discapacidades físicas podrán controlar el iPad o el iPhone con los ojos.
Las nuevas funciones se pondrán en marcha a finales de este año con actualizaciones de software como iOS 18 y iPadOS 18.
Grok y Claude llegan a Europa
We are excited to bring Grok to Europe!
Today we are beginning to roll out access to Grok’s AI search assistant feature to X Premium subscribers.
Once the European Elections have concluded, we will continue the rollout of contextualised trends for all users.
— Global Government Affairs (@GlobalAffairs)
11:27 PM • May 15, 2024
LINK CLAUDE: https://www.anthropic.com/news/claude-europe
Robots
Unitree G1
New Humanoid Robot : Unitree G1, price starts at $16k.
⦿ 4 feet 2 inches tall; much shorter than H1, at 5 feet 10 inches.
⦿ Up to 43 joint motors. It can run at 2 m/s (4.5 mph).
⦿ Weighs 35 kg (77 lb).
⦿ Unlike H1, this one is equipped with manipulators. x.com/i/web/status/1…— The Humanoid Hub (@TheHumanoidHub)
8:45 AM • May 13, 2024