- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #65
Boletín Semanal Best-IA #65
Aprende Ia, día a día.
Tutoriales
CLONA TU VOZ GRATIS con el NUEVO MODELO OPEN SOURCE F5-TTS
Cómo construir a Samantha, de la película “Her”, con la API en tiempo real de OpenAI GRATIS
GITHUB CODE: https://github.com/jesuscopado/samantha-os1
Mejora tus Prompts con Meta Prompting
OpenAI ha lanzado un "cookbook" sobre meta prompting, una técnica innovadora para refinar prompts y mejorar la calidad de las respuestas de los modelos de lenguaje. La idea es usar un modelo de inteligencia superior para optimizar prompts que guiarán a otro modelo en sus respuestas. En este caso, se usa el modelo o1-preview para perfeccionar un prompt básico de resumen de noticias, mostrando cómo los refinamientos mejoran la claridad, estructura y relevancia del contenido generado.
LINKS:
Noticias
ChatGPT
OpenAI lanza ChatGPT Search
OpenAI ha lanzado ChatGPT Search, una función para Plus y Team users que permite obtener respuestas actuales y relevantes con enlaces a fuentes web.
Esta herramienta mejora la experiencia de búsqueda al combinar una interfaz conversacional con acceso a información en tiempo real sobre temas como clima, finanzas, deportes y noticias.
Tres Novedades de ChatGPT que Mejoran su Usabilidad y Funcionalidad
OpenAI está implementando otras tres funciones clave en ChatGPT que facilitan el uso y amplían su versatilidad.
Búsqueda en el Historial de Conversaciones: La nueva función de búsqueda permite localizar y recuperar conversaciones previas en la versión web de ChatGPT. Esto es especialmente útil para:
Encontrar información importante en conversaciones pasadas sin tener que buscar manualmente.
Proporcionar contexto relevante para desarrollar ideas o argumentos basados en trabajos anteriores.
Recuperar ejemplos específicos de procesos, como fragmentos de código, para replicar o adaptar métodos exitosos.
We’re starting to roll out the ability to search through your chat history on ChatGPT web.
Now you can quickly & easily bring up a chat to reference, or pick up a chat where you left off.
— OpenAI (@OpenAI)
7:09 PM • Oct 29, 2024
Interfaz de Acceso Rápido a Funciones Avanzadas: Al escribir “/” en el cuadro de texto, los usuarios pueden activar rápidamente herramientas avanzadas como:
Generación de imágenes con DALL-E 3.
Búsqueda en internet para obtener información actualizada.
o1-preview, un modelo avanzado de razonamiento. Esta interfaz optimiza el flujo de trabajo al facilitar el acceso directo a estas funciones, lo cual es valioso para quienes buscan información precisa o actualizaciones en tiempo real.
Generador de Prompts en el Playground de OpenAI: Esta herramienta ayuda a los usuarios a crear prompts específicos y detallados para obtener mejores resultados. Por ejemplo, un prompt simple como "convertir papers científicos en artículos de divulgación" puede transformarse en un prompt estructurado que ChatGPT seguirá de manera precisa. Esta herramienta permite:
Mejorar las instrucciones para obtener resultados consistentes en tareas complejas.
Crear asistentes personalizados que conviertan documentos técnicos en contenido accesible, facilitando la divulgación científica y la creación de contenidos atractivos para el público.
El modo de voz avanzado llega al escritorio
Claude
Claude 3.5 Ahora Soporta PDFs: Análisis Completo de Documentos
La nueva versión de Claude, el modelo Claude 3.5 Sonnet, ahora está en fase beta pública para soportar documentos PDF, permitiendo analizar tanto contenido textual como visual dentro de estos archivos. Esta capacidad está diseñada para entender textos, imágenes, gráficos y tablas, ampliando su utilidad en múltiples escenarios.
Puntos clave:
Capacidades del análisis de PDFs: Claude puede analizar cualquier PDF estándar, lo que incluye textos, imágenes y elementos visuales como gráficos o diagramas. Esto resulta útil para casos de uso como la interpretación de reportes financieros, la extracción de información clave en documentos legales, la traducción de contenido o la estructuración de datos complejos.
Funcionamiento y limitaciones: Claude convierte cada página del PDF en una imagen, extrayendo el texto para analizarlo junto con el contenido visual. Los archivos tienen un límite de tamaño de 32MB y hasta 100 páginas, y no deben estar protegidos con contraseñas o cifrados.
Compatibilidad y plataformas: Por ahora, la función de soporte para PDFs está disponible solo a través de la API de Claude 3.5 en plataformas seleccionadas. Se espera que esta funcionalidad esté disponible pronto en Amazon Bedrock y Google Vertex AI.
Ya puedes hablar con Claude desde la aplicación para iPhone, iPad y Android
Claude 3.5 Sonnet ya está disponible en GitHub Copilot
NVIDIA y xAI Crean el Supercomputador de IA Más Grande del Mundo
NVIDIA ha anunciado que xAI, la empresa de inteligencia artificial de Elon Musk, ha construido el supercomputador Colossus en Tennessee, el cual incluye 100,000 GPUs NVIDIA Hopper. Este logro es posible gracias a la plataforma de red Ethernet NVIDIA Spectrum-X™, optimizada para manejar cargas masivas de IA y garantizar un rendimiento sin precedentes.
Puntos clave:
Infraestructura masiva y acelerada: Colossus, diseñado para entrenar modelos de lenguaje grande como Grok, fue construido en sólo 122 días, una velocidad récord para un sistema de esta envergadura. La red Spectrum-X permite mantener el rendimiento de la infraestructura sin pérdida de paquetes ni latencia significativa.
Rendimiento sin colisiones: A diferencia de Ethernet estándar, que reduce el ancho de banda por colisiones de flujo, Spectrum-X permite una transferencia de datos del 95%, crucial para el manejo eficiente de flujos masivos de información en tiempo real, necesarios para entrenamiento de IA.
Tecnología avanzada para IA a gran escala: El corazón de la plataforma, el switch Ethernet Spectrum SN5600 y las SuperNICs BlueField-3®, proporcionan velocidad y visibilidad de la red, esenciales para optimizar el uso compartido y la escalabilidad en entornos de IA generativa.
La creación de Colossus marca un hito en la capacidad de procesamiento para IA a nivel global, permitiendo que empresas como xAI desarrollen modelos avanzados a gran escala. Con esta infraestructura, NVIDIA y xAI aceleran el camino hacia aplicaciones de IA cada vez más sofisticadas, allanando el camino para nuevas innovaciones en la tecnología de inteligencia artificial.
IBM Lanza Granite 3.0: Modelos Abiertos y Empresariales de Alto Rendimiento
IBM ha presentado Granite 3.0, la tercera generación de sus modelos de lenguaje para empresas, diseñados para tareas específicas y con un enfoque en seguridad. Estos modelos de IA, ahora disponibles como open-source, se destacan en aplicaciones empresariales que van desde ciberseguridad hasta sistemas de Recuperación de Información Asistida (RAG).
Puntos clave:
1. Variedad de modelos para múltiples aplicaciones: Granite 3.0 incluye modelos de lenguaje generales y modelos especializados para tareas de generación de código, análisis de series temporales y datos geoespaciales. Los modelos de lenguaje están diseñados para flujos de trabajo avanzados como RAG, generación de contenido y análisis de texto, mientras que Granite for Code se enfoca en tareas de programación, compatible con 116 lenguajes de código.
2. Enfoque en seguridad con Granite Guardian: IBM ha incorporado Granite Guardian, una capa de seguridad para proteger los datos empresariales y mitigar riesgos. Granite 3.0 cumple con más de 15 indicadores de seguridad, posicionándose como una opción confiable para las empresas que priorizan la integridad y protección de sus datos en aplicaciones de IA.
3. Integración en entornos empresariales y accesibilidad: Los modelos Granite 3.0 están disponibles en plataformas como Hugging Face y watsonx.ai, facilitando su implementación en aplicaciones empresariales a través de Red Hat Enterprise Linux AI. IBM también colabora con SAP, permitiendo que usuarios de SAP AI Core accedan a Granite en la plataforma de tecnología empresarial de SAP.
Robots
Atlas entra en acción
Atlas mueve cubiertas de motor de manera autónoma entre los contenedores de proveedores y un carro de secuenciación móvil. El robot recibe como entrada una lista de ubicaciones de los contenedores para trasladar las piezas.
El robot utiliza un modelo de visión por aprendizaje automático para detectar y localizar las estructuras del entorno y los contenedores individuales. Además, emplea una política de agarre especializada y estima continuamente el estado de los objetos que manipula para completar la tarea.
No hay movimientos preprogramados o teleoperados; todos los movimientos se generan de forma autónoma en tiempo real. El robot es capaz de detectar y reaccionar a cambios en el entorno (por ejemplo, estructuras que se mueven) y a fallos de acción (como fallos al insertar la cubierta, tropezones, colisiones con el entorno [1:24]) mediante una combinación de sensores de visión, fuerza y propioceptivos.
Meta FAIR: Percepción Táctil y Colaboración Humano-Robot
Meta FAIR ha lanzado una serie de innovaciones en el ámbito de la robótica para avanzar hacia la inteligencia de máquina avanzada (AMI), centrándose en la percepción táctil, la destreza robótica y la interacción humano-robot. Además, Meta ha anunciado alianzas estratégicas con GelSight Inc y Wonik Robotics para facilitar el acceso de la comunidad investigadora a estas tecnologías.
Puntos clave:
1. Avances en percepción táctil y destreza robótica: Meta ha desarrollado Meta Sparsh, un sistema de percepción táctil general basado en visión, y Digit 360, un sensor táctil con precisión similar a la humana que detecta fuerzas mínimas y responde en tiempo real. Estos dispositivos permiten a los robots entender y manipular objetos con una destreza sin precedentes, con aplicaciones potenciales en medicina, manufactura y realidad virtual.
2. Plataforma estandarizada Meta Digit Plexus: Meta Digit Plexus integra sensores táctiles en una mano robótica, facilitando la investigación en destreza robótica y percepción. Esta plataforma de hardware y software permite recopilar y analizar datos táctiles de manera uniforme, reduciendo barreras para investigadores interesados en la percepción táctil.
3. Benchmark PARTNR para colaboración humano-robot: Meta presentó PARTNR, un benchmark para evaluar la planificación y la interacción colaborativa entre humanos y robots en entornos simulados de hogar. Este sistema permite entrenar y probar modelos de IA en tareas de colaboración, impulsando la investigación en interacción social y coordinación en robótica.
Reflexiones Finales
Sarah Friar, CFO de OpenAI, afirma que la AGI está más cerca de lo que la mayoría piensa
OpenAI CFO Sarah Friar says AGI is "closer than most think" and the ability of internal research models to perform at PhD level in a range of fields "would blow your mind to see what's coming"
— Tsarathustra (@tsarnick)
8:34 PM • Oct 28, 2024
Geoffrey Hinton: la IA hará que la inteligencia humana sea irrelevante
📁 Geoffrey Hinton: la Revolución Industrial hizo que la fuerza humana fuera irrelevante; la IA hará que la inteligencia humana sea irrelevante, y la riqueza creada por el aumento de la productividad no irá a parar a los trabajadores irá para las empresas
— Inteligencia Artificial (@inteligencia_x)
3:30 PM • Oct 28, 2024