- Best-IA Newsletter
- Posts
- Boletín Semanal Best-IA #73
Boletín Semanal Best-IA #73
Aprende IA, día a día.
Tutoriales
7 pasos para aprender más fácil, rápido y mejor con la IA
Cómo generar miles de imágenes GRATIS usando tu modelo de IA favorito (Flux, Stable Diffusion, etc.)
Resuelve problemas complejos con DeepSeek
La nueva función 'DeepThink' de DeepSeek descompone problemas complejos en pasos más pequeños y manejables para facilitar su comprensión y encontrar soluciones.
Paso a paso:
Visita el sitio web de DeepSeek y haz clic en "Start Now" (Comienza ahora).
Selecciona el botón DeepThink en la interfaz de chat para activar el modo de razonamiento avanzado.
Presenta un escenario complejo con múltiples variables y puntos de decisión.
Utiliza el análisis paso a paso para entender y aplicar las soluciones.
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/474c849a-22a0-42d5-96a8-8c02f6011c1d/image.png?t=1736188936)
TIP: Intenta comparar soluciones entre diferentes escenarios para entender los patrones de razonamiento subyacentes. Esto ayuda a desarrollar mejores habilidades para resolver problemas en desafíos futuros.
Noticias
DeepSeek V3: El Nuevo Modelo Open-Source que Compite con los Mejores Modelos Cerrados
DeepSeek V3, el modelo de lenguaje open-source desarrollado por la startup china DeepSeek, marca un gran salto en el desarrollo de IA. Con 671 mil millones de parámetros, no sólo es uno de los modelos más grandes disponibles, sino que también rivaliza en desempeño con modelos cerrados como GPT-4o y Claude 3.5 Sonnet.
Puntos Clave:
Arquitectura Innovadora y Rendimiento Mejorado:
Basado en una arquitectura Mixture-of-Experts (MoE), DeepSeek V3 activa solo los parámetros necesarios para cada tarea, logrando una eficiencia excepcional. Procesa 60 tokens por segundo (3 veces más rápido que su predecesor) y supera a otros modelos en pruebas de programación y razonamiento.Entrenamiento Económico y Accesible:
Con 14.8 billones de tokens de entrenamiento y solo 2.8 millones de horas GPU necesarias, el costo operativo es de apenas €0.13 por millón de tokens generados. Además, su licencia MIT permite su uso comercial y modificaciones sin restricciones.Competitividad y Democratización:
En evaluaciones internas, DeepSeek V3 ha superado a modelos como LLaMA 3.1 y Qwen 2.5 en tareas clave. Su carácter open-source refleja una apuesta por cerrar la brecha entre modelos abiertos y cerrados, alineándose con una visión inclusiva de la IA
DeepSeek V3 es una clara señal de que los modelos open-source están alcanzando niveles de rendimiento antes reservados a sistemas cerrados. Esto no sólo impulsa la innovación global, sino que también hace más accesibles tecnologías avanzadas para empresas y desarrolladores.
Microsoft Invertirá $80 Mil Millones en Centros de Datos para IA en 2025
Microsoft ha anunciado una inversión récord de $80 mil millones en su año fiscal 2025 para construir centros de datos diseñados específicamente para cargas de trabajo de inteligencia artificial. Este esfuerzo refuerza su compromiso con el crecimiento de la IA a nivel global, con más de la mitad de la inversión destinada a infraestructura en Estados Unidos.
Puntos Clave:
Centros de Datos Enfocados en IA:
Microsoft planea expandir su infraestructura global para entrenar modelos de IA y desplegar aplicaciones en la nube. Los centros de datos estarán optimizados para soportar las demandas intensivas de los modelos de IA, reflejando la creciente importancia de esta tecnología en sectores productivos.Estrategia de Liderazgo Global:
Según Brad Smith, presidente de Microsoft, la inversión posiciona a Estados Unidos como líder en la revolución tecnológica de la IA, siempre y cuando se aprovechen las fortalezas internas y se fomente la colaboración internacional.Desafíos y Competencia:
A pesar de las oportunidades, la IA plantea retos, como un aumento en la demanda de electricidad que podría generar escasez energética para centros de datos. Además, la relación de Microsoft con OpenAI se complica, ya que la startup fue calificada recientemente como "competencia" en un documento de la SEC, tras haber explorado juntos un proyecto para un supercomputador llamado Stargate.
Esta inversión masiva subraya la apuesta de Microsoft por liderar la innovación en IA, estableciendo la infraestructura necesaria para su desarrollo global. Sin embargo, plantea preguntas sobre el impacto ambiental de estos centros y cómo las relaciones entre gigantes tecnológicos como Microsoft y OpenAI podrían definir el futuro de la industria.
FUENTE: https://techcrunch.com/2025/01/03/microsoft-to-spend-80-billion-in-fy25-on-data-centers-for-ai/
ByteDance Revoluciona la Generación de Imágenes con 1.58-bit FLUX: Modelos Más Ligeros y Eficientes
Investigadores de ByteDance han desarrollado 1.58-bit FLUX, una técnica innovadora de compresión que reduce el tamaño de los modelos de generación de imágenes en un 7.7x sin comprometer la calidad de salida. Este avance permite la implementación eficiente en dispositivos con recursos limitados, marcando un paso crucial para la democratización de modelos generativos.
Puntos Clave:
Compresión a Solo Tres Valores:
FLUX transforma el 99.5% de los parámetros de su transformador visual (11.9 mil millones) a tres simples valores: +1, 0 y -1, mediante auto-supervisión sin acceso a datos de imágenes. Esto incluye un kernel personalizado para cálculos optimizados en baja precisión.Eficiencia y Rendimiento Mejorados:
La compresión reduce el almacenamiento del modelo en 7.7x y el uso de memoria durante la inferencia en 5.1x en diferentes GPUs. En hardware apto para despliegue, como las GPUs L20 y A10, se logra un aumento de velocidad del 13.2%.Calidad Comparable a Modelos de Precisión Completa:
En pruebas de referencia como GenEval y T2I CompBench, los modelos comprimidos muestran una calidad de generación similar a los modelos originales. Sin embargo, persisten desafíos como una leve pérdida de detalles en resoluciones muy altas y mejoras de velocidad limitadas sin cuantificación de activaciones.
1.58-bit FLUX representa un gran avance en la generación de imágenes por IA, al hacer que modelos potentes sean más accesibles y eficientes para dispositivos con restricciones de recursos. Esta tecnología abre nuevas oportunidades para aplicaciones de IA generativa en sectores como dispositivos móviles, IoT y edge computing, mientras reduce los costos asociados con almacenamiento y procesamiento.
Investigadores chinos proponen una hoja de ruta para replicar los modelos de razonamiento de OpenAI
El modelo o1 de OpenAI es un hito en inteligencia artificial por sus capacidades de razonamiento avanzado, autocorrección y resolución de problemas complejos. Sin embargo, replicar un modelo de esta magnitud plantea grandes desafíos. Un reciente paper chino ofrece una guía detallada basada en aprendizaje por refuerzo para reproducir estas capacidades, marcando un nuevo enfoque en la búsqueda de inteligencia artificial general (AGI).
Puntos Clave:
Avance de OpenAI hacia AGI:
En 2023, OpenAI sorprendió con modelos avanzados como o1 y o3, que lograron un razonamiento experto, superando benchmarks en tareas complejas. Estos modelos utilizan "test-time compute", un enfoque que les permite dedicar más recursos computacionales para pensar y resolver problemas.La Respuesta de China:
Investigadores chinos de Fudan University han publicado el paper "Scaling of Search and Learning: A Roadmap to Reproduce o1". Proponen cuatro pilares clave: inicialización de políticas, diseño de recompensas, búsqueda iterativa y aprendizaje basado en datos generados por el propio modelo, similar al enfoque usado en sistemas como AlphaGo.Reproducción y Conocimiento Abierto:
China ya ha creado un modelo llamado DeepSeek R1 inspirado en o1, seguido del más avanzado DeepSeek V3. Este último combina datos sintéticos generados por R1 mediante destilación de conocimiento, logrando avances en tareas matemáticas complejas con un costo computacional significativamente menor.
El posible éxito de China en replicar o1 plantea preguntas cruciales sobre la seguridad y la ética en la IA. Mientras OpenAI restringe el acceso a sus modelos de razonamiento, China adopta una estrategia de apertura que podría acelerar la innovación global, pero también aumentar riesgos relacionados con el mal uso de tecnologías avanzadas.
Más info en nuestro blog.
o1 Supera a Médicos en Tareas Complejas de Razonamiento Clínico
Un reciente estudio evaluó el modelo o1-preview de OpenAI en tareas de razonamiento clínico, un proceso clave en el diagnóstico y manejo médico. Este modelo, diseñado para mejorar su rendimiento mediante cadenas de razonamiento, mostró resultados impresionantes al superar a médicos humanos en varias pruebas específicas.
Puntos clave:
Desempeño superior en diagnósticos complejos: El modelo destacó en la generación de diagnósticos diferenciales y en la calidad del razonamiento diagnóstico y de manejo, superando a benchmarks históricos y médicos en pruebas similares.
Limitaciones en tareas específicas: Aunque el o1-preview sobresalió en razonamiento crítico, su desempeño en razonamiento probabilístico y en el diagnóstico diferencial de triage fue comparable a modelos anteriores.
Necesidad de nuevos estándares de evaluación: Los autores subrayan la importancia de desarrollar benchmarks más robustos y ensayos clínicos escalables para evaluar con precisión la capacidad de estos modelos en contextos reales.
El avance en la capacidad de los modelos de lenguaje (ya disponemos de modelos superiores como o1 y o3) para realizar tareas complejas de razonamiento clínico plantea implicaciones importantes para el futuro de la medicina. Sin embargo, persisten desafíos en su implementación práctica y en la evaluación de su rendimiento frente a médicos en entornos reales. Este estudio refuerza el potencial de la IA para transformar la atención sanitaria, pero también subraya la necesidad de una integración cuidadosa y regulada.
METAGENE-1: IA para la detección temprana de pandemias
Un equipo de investigadores ha desarrollado METAGENE-1, un modelo de lenguaje avanzado diseñado para analizar secuencias genómicas y metagenómicas con aplicaciones clave en salud pública. Este modelo, entrenado con 1.5 billones de pares de bases de ADN y ARN provenientes de muestras de aguas residuales, busca revolucionar el monitoreo de pandemias y la detección temprana de patógenos.
Puntos clave:
Modelo fundacional metagenómico: A diferencia de los modelos genómicos tradicionales, METAGENE-1 captura información genética compleja de ecosistemas enteros, como los presentes en las aguas residuales.
Tecnología avanzada: Utiliza técnicas de tokenización personalizadas y una arquitectura de 7 mil millones de parámetros para abordar tareas complejas, logrando resultados de última generación en benchmarks genómicos.
Aplicaciones prácticas: Su capacidad para detectar patógenos emergentes y monitorear datos genómicos a gran escala lo posiciona como una herramienta innovadora para la biosupervisión y prevención de pandemias.
METAGENE-1 no solo mejora la detección de amenazas sanitarias, sino que ofrece una base sólida para el desarrollo de tecnologías preventivas en salud pública. Este modelo demuestra el potencial de la IA para transformar el monitoreo global de enfermedades y mitigar crisis futuras.
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/db0e81ec-3555-4447-af29-9500802c6a05/image.png?t=1736187634)
LINK: https://metagene.ai/
NeuroXess Avanza en Interfaces Cerebro-Computadora: Comunicación y Control Mediante el Pensamiento
La startup china NeuroXess ha logrado avances significativos en la tecnología de interfaces cerebro-computadora (BCI), permitiendo a pacientes controlar dispositivos y comunicarse únicamente con pensamientos. Además, lograron la primera decodificación en tiempo real del idioma chino a partir de señales cerebrales.
Puntos Clave:
Decodificación de Lenguaje en Tiempo Real:
Un paciente con epilepsia logró convertir pensamientos en texto chino con un 71% de precisión, utilizando 142 sílabas comunes. El sistema respondió en menos de 100 milisegundos, marcando un hito en la comunicación cerebral.Control de Dispositivos Mediante Pensamientos:
Gracias a una interfaz flexible, el paciente pudo manejar smartphones, dispositivos del hogar inteligente y brazos robóticos pocos días después de la implantación, demostrando la versatilidad del sistema.Interacción Directa con Modelos de IA:
Los pacientes también operaron avatares digitales e interactuaron con modelos de IA, logrando lo que NeuroXess describe como el primer "modelo grande de mente a IA", ampliando el potencial de las BCIs más allá de la comunicación básica.
El 2024 marcó un año clave para las BCIs, con avances no sólo de NeuroXess, sino también de empresas como Neuralink. Estas tecnologías prometen transformar la vida de personas con condiciones neurológicas, y también abren posibilidades para la integración de IA y el control de máquinas mediante el pensamiento, redefiniendo la forma en que los humanos interactúan con la tecnología.
Robots
Unitree B2-W
LimX Dynamics
Advancing Stable & Flexible Motions:
LimX Dynamics' full-size humanoid robot features a hollow actuator design and high torque-density actuators, achieving complex full-body movements in a ultra stable and dynamic manner.
#LimXDynamics#Humanoid#robotics— LimX Dynamics (@LimX_Dynamics)
5:05 PM • Jan 3, 2025