Boletín Semanal Best-IA #43

Aprende IA, día a día.

Tutoriales

GPT-4o API: Curso acelerado para principiantes

Introducción a la API de GPT-4o, comprensión de imágenes, llamadas a funciones y MÁS

Noticias

OpenAI presenta GPT-4o y más herramientas para los usuarios gratuitos de ChatGPT

  • GPT-4o es el nuevo modelo de OpenAI, que mejora las capacidades de GPT-4 con mayor velocidad e inteligencia en el manejo de texto, voz e imagen. Supera a los modelos anteriores, ofreciendo funcionalidades innovadoras como la discusión de imágenes, interacciones de voz en tiempo real y capacidades conversacionales con video.

    • Velocidad e Inteligencia Mejoradas: Tiempos de respuesta más rápidos y interacciones más inteligentes que las versiones anteriores.

    • Capacidades Multimodales: Capacidad para entender e interactuar simultáneamente con texto, voz e imágenes.

    • Interacción en Tiempo Real: Las futuras actualizaciones permitirán conversaciones en vivo por voz y video.

    • Soporte Mejorado de Idiomas: Soporta más de 50 idiomas, mejorando la accesibilidad global.

    • Acceso a Herramientas Avanzadas: Introducción de nuevas funciones como memoria y la capacidad de interactuar con diferentes formatos de medios.

  • Herramientas Avanzadas para Usuarios Gratuitos. OpenAI ahora permite el acceso a sus herramientas de IA más recientes al incorporar características avanzadas en la versión gratuita de ChatGPT.

    • Inteligencia Nivel GPT-4: Acceso a las capacidades del modelo de IA más reciente.

    • Conjunto de Funciones Expandidas: Capacidad para crear gráficos, discutir fotos y cargar archivos para varios análisis.

    • Integración de la Tienda GPT: Explora y utiliza GPTs especializados adaptados para diferentes tareas.

    • Interacción Mejorada: Interactúa con la IA mediante texto, voz y pronto, video.

    • Límites de Uso: Acceso gratuito con ciertas limitaciones, cambiando a GPT-3.5 al alcanzar el límite.

  • Nueva Aplicación de Escritorio ChatGPT. El lanzamiento de la nueva aplicación de escritorio ChatGPT para macOS facilita una integración perfecta en los flujos de trabajo diarios de los usuarios, mejorando la productividad e interactividad directamente desde el escritorio. Esta aplicación soporta interacciones tanto textuales como de voz, con planes futuros para capacidades de video.

    • Integración Sin Esfuerzos: Acceso rápido mediante atajos de teclado e interacciones directas con la aplicación.

    • Conversaciones de Voz y Texto: Participa en múltiples modos de interacción directamente desde el escritorio.

    • Capacidades de Video Futuras: Actualizaciones planificadas para incluir interacciones de video en tiempo real.

    • Acceso Anticipado para Usuarios Plus: Implementación inicial para suscriptores Plus, con disponibilidad más amplia próximamente.

    • Interfaz de Usuario Simplificada: Diseño actualizado para una navegación e interacción más fáciles.

Ilya Sutskever abandona OpenAI

  • Además de Ilya y Jan Leike, otros miembros clave del equipo Superalignment, que debía garantizar que la IA no se volviera rebelde, abandonan OpenAI.

  • Afirma Leike: “Llevo bastante tiempo discrepando con la dirección de OpenAI sobre las prioridades fundamentales de la empresa, hasta que por fin hemos llegado a un punto de ruptura.
    Creo que deberíamos dedicar mucho más ancho de banda a prepararnos para las próximas generaciones de modelos, en seguridad, supervisión, preparación, protección, solidez frente a adversarios, (super)alineación, confidencialidad, impacto social y temas relacionados.
    Estos problemas son bastante difíciles de solucionar, y me preocupa que no estemos en la trayectoria adecuada para conseguirlo.
    Construir máquinas más inteligentes que los humanos es una empresa intrínsecamente peligrosa.

    OpenAI asume una enorme responsabilidad en nombre de toda la humanidad, pero en los últimos años, la cultura y los procesos de seguridad han pasado a un segundo plano.
    Llevamos mucho retraso en tomarnos increíblemente en serio las implicaciones de la AGI.

    Debemos dar prioridad a prepararnos para ellas lo mejor que podamos.

    Sólo entonces podremos garantizar que la AGI beneficie a toda la humanidad.

  • En general, la seguridad en OpenAI siempre ha sido un tema controvertido. Eso es lo que llevó a Dario y Daniela Amodei en 2021 a fundar su propia empresa de IA, Anthropic, junto con otros nueve antiguos empleados de OpenAI. Las preocupaciones por la seguridad también fueron lo que supuestamente llevó a los miembros de la junta sin ánimo de lucro de OpenAI a expulsar a Altman y Brockman.

ChatGPT obtiene acceso a Reddit en tiempo real

  • OpenAI acaba de firmar un acuerdo para acceder al contenido en tiempo real de la API de datos de Reddit, que ahora permitirá a OpenAI enlazar debates del sitio dentro de ChatGPT.

  • OpenAI accederá a la API de datos de Reddit, que proporciona contenidos en tiempo real, estructurados y exclusivos de Reddit. Esto permitirá a las herramientas de IA de OpenAI comprender y mostrar mejor el contenido de Reddit, especialmente sobre temas recientes.

  • Esta asociación también permitirá a Reddit ofrecer nuevas funciones basadas en IA a los redditors y mods. Reddit se basará en la plataforma de modelos de IA de OpenAI para hacer realidad su potente visión.

    Además, OpenAI se convertirá en socio publicitario de Reddit.

  • Con esta nueva asociación, ChatGPT podrá competir con la forma en que Grok de xAI tiene actualizaciones automáticas de noticias a través de X utilizando las noticias de Reddit. Además, el próximo chatbot AI Search de OpenAI probablemente se beneficiará en gran medida de la información en tiempo real de Reddit.

  • LINK: https://openai.com/index/openai-and-reddit-partnership/

Google revela sus últimos avances en IA en la Google I/O 2024

  • Nuevos modelos de Gemini:

    • Gemini 1.5 Flash, un nuevo modelo ligero con una ventana contextual de 1M.

    • Gemini 1.5 Pro - Esta actualización lleva a Pro de una ventana contextual de 1M a 2M.

    • Gemini Live - Habla con la IA mediante voz/vídeo.

  • Las funciones de Gemini están llegando al resto de las aplicaciones de consumo de Google, como Búsqueda, Gmail, Android, YouTube, etc.

  • Veo, el competidor de Sora para creación de video de alta calidad.

  • Project Astra, el futuro de los asistentes de inteligencia artificial.

  • Imagen 3, el modelo de generación de texto a imagen de mayor calidad hasta la fecha.

  • Trillium, una TPU (competidora de la GPU) que multiplica por 4,7 el rendimiento de cálculo.

  • Nuevas CPU y GPU para los clientes de Google Cloud.

    • Axion (las primeras CPU de Google basadas en Arm): Hasta un 50% más de rendimiento y un 60% más de eficiencia energética que la generación actual.

    • Nvidia Blackwell: las últimas GPU de Nvidia: 5 veces menos coste y consumo energético que su predecesora

  • Agentes de IA que realizan tareas en todo el ecosistema de productos de Google.

  • Respuestas de audio en NotebookLM.

  • Gemma 2 llegará el mes que viene, y PaliGemma (Vision) ya está disponible.

  • Y mucho más.

Apple anuncia que iOS 18 introducirá el 'Eye Tracking' impulsado por IA

  • Apple acaba de anunciar un montón de nuevas funciones de accesibilidad que llegarán a iOS 18, como el seguimiento ocular potenciado por IA, la háptica musical o los atajos vocales, entre otras.

  • De esta forma, los usuarios con discapacidades físicas podrán controlar el iPad o el iPhone con los ojos.

  • Las nuevas funciones se pondrán en marcha a finales de este año con actualizaciones de software como iOS 18 y iPadOS 18.

  • LINK: https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/

Grok y Claude llegan a Europa

Robots

Unitree G1

Reflexiones Finales

¿Cuál será el IMPACTO de la IA? 🤯

¡GPT-5 es el ASESINO DEL TRABAJO! Millones de personas pueden estar a punto de perderlo todo