Published on

La Revolución de NVIDIA Más Allá de las Especificaciones: La Visión Disruptiva de Jensen Huang

Autores
  • avatar
    Nombre
    Ajax
    Twitter

El Legado de Huang y la Comparación con Jobs: Pioneros de Dos Eras

En el CES de 2025, la aparición de Jensen Huang con su icónica chaqueta de piel de cocodrilo no era lo único que llamaba la atención. Si bien muchos esperaban los anuncios de NVIDIA, su presentación fue mucho más impactante que su vestimenta. Las innovaciones presentadas superaron incluso las expectativas generadas en los propios eventos de NVIDIA. Entonces, ¿qué está revolucionando exactamente NVIDIA? Vamos a explorar este tema en profundidad.

La Serie RTX Blackwell: La Nueva Generación de Herramientas para el 'Entrenamiento' de IA

NVIDIA ha desvelado su serie de GPU RTX Blackwell, con la RTX 5090 como la estrella principal. Aunque no vamos a profundizar en las especificaciones técnicas, es importante destacar que la RTX 5070, la menos potente de la serie, ofrece un rendimiento similar a la RTX 4090 de la generación anterior, pero a un precio un tercio menor.

Es bien sabido que las tarjetas gráficas de consumo son ideales para la implementación local de modelos de código abierto. Por lo tanto, la RTX 5090 se ha ganado el título de la nueva generación de "herramienta para entrenar modelos de IA".

El estudio Bosque Negro, en colaboración con NVIDIA, ha optimizado el modelo FLUX, logrando un aumento significativo en la velocidad de inferencia en las tarjetas de la serie 50. El modelo DEV, por su parte, ofrece una velocidad de inferencia dos veces superior en la 5090 en comparación con la 4090. Además, en febrero se lanzará una versión del modelo FLUX con formato de cuantificación FP4.

La preventa de la 5090 ya ha generado un gran revuelo en el mercado, lo que anticipa un crecimiento exponencial en los estudios de diseño con IA, arte con IA, cómics con IA y cortometrajes con IA durante este año.

Project DIGITS: La Revolución de los Grandes Modelos en Plataformas de Escritorio

Si el software de diseño gráfico puede ejecutarse localmente, ¿por qué no los grandes modelos con más de 13 mil millones de parámetros? Huang tiene la respuesta. NVIDIA ha presentado "Project DIGITS", una plataforma de computación en la nube de escritorio que permite ejecutar modelos de 200 mil millones de parámetros desde el escritorio y con una toma de corriente estándar.

Una vez que se completa el desarrollo o la inferencia de un gran modelo en un sistema de escritorio, este puede implementarse sin problemas en la nube acelerada o en un centro de datos. Esto abre la puerta a una explosión de modelos especializados basados en conjuntos de datos de entrenamiento personales. En el futuro, los desarrolladores podrían implementar modelos de 8-13 mil millones de parámetros localmente, reviviendo el auge de Stable Diffusion entre los creadores individuales. Para ellos, un coste de 3.000 dólares no es prohibitivo.

NVIDIA GB200 NVL72: El Superchip para Centros de Datos

NVIDIA ha presentado el NVIDIA GB200 NVL72, un superchip para centros de datos que cuenta con 72 GPUs Blackwell, una capacidad de cálculo de 1.4 exaFLOPS y 130 billones de transistores. Huang incluso lo ha comparado con el escudo del Capitán América.

La potencia de este chip es tal que, según Huang, seis de ellos son suficientes para igualar la capacidad de cálculo de todo el centro de datos de muchas empresas chinas de IA y coches autónomos. A modo de comparación, la capacidad de cálculo total de la conducción autónoma de Li Auto es de 8.1 EFLOPS. A medida que se construyan más centros de datos con este superchip, las limitaciones de capacidad de cálculo dejarán de ser un problema para la próxima generación de grandes modelos de lenguaje, la conducción autónoma de extremo a extremo y los modelos mundiales de robots.

El Modelo Cosmos: Permitiendo que la IA Comprenda el Mundo Físico

NVIDIA ha presentado el modelo Cosmos, una plataforma de desarrollo de modelos mundiales diseñada para "enseñar a la IA a entender el mundo físico". Está compuesto por un modelo base mundial, tokenizadores y flujos de trabajo de procesamiento de vídeo, lo que supone un avance muy significativo para los laboratorios de robótica y AV.

Cosmos puede aceptar indicaciones de texto, imagen o vídeo para generar estados del mundo virtual. Esto significa que las máquinas finalmente pueden construir y entender el mundo en su "mente". Como modelo de mundo de vídeo de código abierto y pesos abiertos, se ha entrenado con 20 millones de horas de vídeo y tiene pesos que oscilan entre los 4 y los 14 mil millones.

Aunque existen muchas definiciones de modelos mundiales, la capacidad de simulación 4D de Cosmos es lo que lo hace único. El impacto revolucionario de esta tecnología a corto plazo radica en que los datos sintéticos resolverán el problema de la escasez de grandes datos a los que se enfrenta la IA física. NVIDIA ya está utilizando Cosmos para generar datos sintéticos a gran escala para la robótica y la conducción autónoma, y lo ha puesto a disposición de los desarrolladores para que puedan ajustar los datos y entrenar a robots e IA.

Apuesta por la IA Física: Conducción Autónoma y Robótica

NVIDIA ha invertido en capacidad de cálculo, modelos y datos, y ha apostado por la conducción autónoma y la robótica como los dos sectores que experimentarán un crecimiento más rápido. Huang incluso predice que el Robotaxi será la primera industria de robots con un valor de un billón de dólares.

Para la conducción autónoma, NVIDIA ha presentado el procesador de próxima generación para automóviles llamado "Thor Blackwell", cuya capacidad de procesamiento es 20 veces superior a la del chip de la generación anterior y que también puede utilizarse en robots humanoides. Para la robótica, NVIDIA IsaacGroot ofrece cuatro pilares de apoyo a los desarrolladores: modelos básicos de robots, canales de datos, marcos de simulación y el ordenador para robots Thor.

NVIDIA ha sentado las bases para el "momento GPT de la robótica". Se espera que en 2025, los sectores de la inteligencia encarnada y la conducción autónoma experimenten un auge en la financiación.

AI Agents: Una Industria de Billones de Dólares

Huang también predice que la industria de los AI Agents alcanzará un valor de varios billones de dólares. El producto relevante es la IA Agentic con la funcionalidad de "escalado de tiempo de prueba", que admite herramientas como calculadoras, búsqueda web, búsqueda semántica y búsqueda SQL. Si NVIDIA colabora con el marco Swarms en computación acelerada por GPU e integración de IA, Swarms podría convertirse en el líder indiscutible, con todos los AI Agents ejecutándose dentro de su marco. Swarms podría convertirse en un gigante con un valor de mercado de un billón de dólares, mientras que su valor de mercado actual es de solo 540 millones de dólares. ¿Significa esto que aún tiene un enorme potencial de crecimiento?

Las Cuatro Etapas del Desarrollo de la IA de NVIDIA

En comparación con las cinco etapas de desarrollo de la AGI de Sam Altman de OpenAI, las cuatro etapas de la IA de NVIDIA ofrecen una visión más amplia y ambiciosa:

  • IA Perceptiva: Reconocimiento de voz, reconocimiento en profundidad.
  • IA Generativa: Generación de texto, imágenes o vídeos.
  • IA Agente: Asistentes de programación, etc., que ayudan a los humanos a realizar tareas.
  • IA Física: Coches de conducción autónoma, robots de propósito general.

Esta clasificación muestra claramente la trayectoria de desarrollo de la IA y las leyes de desarrollo de la industria. Huang, desde que subió al escenario hace 10 años para apoyar a Xiaomi, hasta convertirse en el gigante de 3.6 billones de dólares de valor de mercado, parece tener un futuro ilimitado por delante.