NVIDIA's revolutie voorbij specificaties: Jensen Huang's ontwrichtende visie

De visie van Jensen Huang: Een nieuw tijdperk

Op de CES van 2025 verscheen Jensen Huang in zijn kenmerkende alligatorleren jas. Hoewel de jas veel aandacht trok, was de inhoud van zijn presentatie nog veel impactvoller. De getoonde innovaties overtroffen zelfs die van NVIDIA's eigen conferenties. Wat is het dat NVIDIA precies op zijn kop zet? Laten we dat eens nader bekijken.

RTX Blackwell Serie GPU's: De Nieuwe 'Alchemie' Tool

NVIDIA heeft de RTX Blackwell serie GPU's gelanceerd, met de RTX 5090 als meest opvallende model. Hoewel we de specificaties hier niet in detail zullen bespreken, is het vermeldenswaard dat zelfs de minst krachtige 5070 GPU in deze serie de prestaties van de vorige generatie 4090 evenaart, terwijl de prijs een derde lager is.

Het is algemeen bekend dat consumenten-GPU's bijzonder geschikt zijn voor lokaal gebruik van open-source modellen. De RTX 5090 wordt daarom gezien als de nieuwe 'alchemie' tool voor AI-ontwikkeling.

De samenwerking tussen het Zwarte Woud Studio en NVIDIA heeft geleid tot optimalisaties van het FLUX-model, waardoor de inferentiesnelheid op de 50-serie GPU's aanzienlijk is verbeterd. Het DEV-model op de 5090 voert inferenties zelfs twee keer zo snel uit als op de 4090. Bovendien wordt in februari een FP4-gekwantificeerde versie van het FLUX-model verwacht.

De pre-orders voor de 5090 zijn al begonnen, wat wijst op een explosieve groei in AI-ontwerp, AI-studio's, AI-strips en AI-korte films dit jaar.

Project DIGITS: Een Revolutie voor Grote Modellen op het Bureau

Als tekenprogramma's lokaal kunnen worden gedraaid, waarom zouden grote modellen met meer dan 13 miljard parameters dat dan niet kunnen? Jensen Huang heeft deze vraag bevestigend beantwoord. NVIDIA heeft "Project DIGITS" geïntroduceerd, een desktop cloud platform waarmee modellen met 200 miljard parameters op een bureau kunnen draaien, met alleen een standaard stopcontact nodig.

Na de ontwikkeling of inferentie van grote modellen op een desktop, kunnen deze naadloos worden ingezet in de cloud of datacenters. Dit opent de deur voor de ontwikkeling van gespecialiseerde modellen op basis van persoonlijke trainingssets. In de toekomst zullen ontwikkelaars waarschijnlijk lokaal modellen van 8-13 miljard parameters gebruiken, vergelijkbaar met de populariteit van Stable Diffusion onder individuele makers. De kosten van $3000 zijn ook niet onoverkomelijk voor hen.

NVIDIA GB200 NVL72: Een Superchip voor Datacenters

NVIDIA heeft de NVIDIA GB200 NVL72 onthuld, een datacenter superchip met 72 Blackwell GPU's, een rekenkracht van 1,4 exaFLOPS en 130 biljoen transistors. Huang vergeleek het zelfs met het schild van Captain America.

Het krachtige van deze chip is dat Huang met zes van deze chips in zijn hand een rekenkracht bezit die vergelijkbaar is met die van de hele serverruimte van veel Chinese AI-bedrijven en autobedrijven met zelfrijdende technologie. Ter vergelijking: de totale rekenkracht van de intelligente rijsystemen van Li Auto is 8,1 EFLOPS. Met de komst van datacenters met deze superchips, zullen de volgende generatie taalmodellen, end-to-end autonoom rijden en wereldmodellen voor robots geen last meer hebben van een tekort aan rekenkracht.

Cosmos Model: AI de Fysieke Wereld Leren Begrijpen

NVIDIA heeft het Cosmos-model gelanceerd, een platform voor de ontwikkeling van wereldmodellen dat "AI de fysieke wereld leert begrijpen". Het bestaat uit een wereldmodel, tokenizers en videoverwerkingsworkflows, wat een uitkomst is voor robotica- en AV-laboratoria.

Cosmos accepteert tekst, afbeeldingen of video's als input om virtuele wereldstaten te genereren. Dit betekent dat machines eindelijk in staat zijn om de wereld in hun 'hoofd' te construeren en te begrijpen. Dit open-source videowereldmodel is getraind op 20 miljoen uur aan video's, met gewichten variërend van 4 tot 14 miljard.

Hoewel er veel definities van wereldmodellen zijn, is de 4D-simulatiemogelijkheid van Cosmos uniek. De recente revolutionaire impact van deze technologie is dat synthetische data het tekort aan grote data voor fysieke AI zal oplossen. NVIDIA past Cosmos al toe op de grootschalige generatie van synthetische data voor robots en autonoom rijden, en stelt dit beschikbaar voor ontwikkelaars om data te finetunen en robots en AI te trainen.

Inzetten op Fysieke AI: Autonoom Rijden en Robots

NVIDIA heeft geïnvesteerd in rekenkracht, modellen en data en zet in op autonoom rijden en robots, twee sectoren die naar verwachting als eerste een doorbraak zullen beleven. Huang voorspelt zelfs dat Robotaxi de eerste robotica-industrie van biljoenen dollars zal worden.

Voor autonoom rijden heeft NVIDIA de "Thor Blackwell" geïntroduceerd, een volgende generatie autoprocessor met 20 keer de verwerkingscapaciteit van de vorige generatie chip, die ook kan worden gebruikt voor humanoïde robots. Voor robots biedt NVIDIA IsaacGroot vier belangrijke ondersteuningen voor ontwikkelaars: basis robotmodellen, datapijplijnen, simulatie frameworks en de Thor robotcomputer.

NVIDIA heeft een solide infrastructuur gecreëerd voor het "GPT-moment van de robotica". Er wordt verwacht dat de binnenlandse sector van belichaamde intelligentie en autonoom rijden in 2025 een golf van financiering zal zien.

[Afbeelding: Jensen Huang en Steve Jobs - Twee iconen van het mobiele en AI-tijdperk]

AI Agent: Een Industrie van Biljoenen Dollars

Huang voorspelt ook dat de AI Agent-industrie een omvang van biljoenen dollars zal bereiken. Het gerelateerde product is de Agentic AI met de "Test-Time Scaling"-functie, die tools ondersteunt zoals rekenmachines, webzoekopdrachten, semantische zoekopdrachten en SQL-zoekopdrachten. Als NVIDIA samenwerkt met het Swarms-framework op het gebied van GPU-versnelde berekeningen en AI-integratie, dan zou Swarms de uiteindelijke winnaar kunnen worden, waarbij alle AI Agents binnen dit framework draaien. Swarms zou in de toekomst een gigant met een waarde van biljoenen dollars kunnen worden, terwijl de huidige marktwaarde slechts 540 miljoen dollar is. Betekent dit dat er nog een enorme groeimogelijkheid is?

De Vier Fasen van NVIDIA's AI-Ontwikkeling

In vergelijking met de vijf ontwikkelingsfasen van AGI van OpenAI Sam, zijn de vier fasen van NVIDIA's AI-ontwikkeling macroscopischer en ambitieuzer:

Perceptuele AI: Spraakherkenning, diepteherkenning.
Generatieve AI: Tekst-, beeld- of videogeneratie.
Agent AI: Programmeerassistenten, enz., om mensen te helpen bij het voltooien van taken.
Fysieke AI: Autonome auto's, universele robots.

Deze indeling geeft een duidelijk beeld van de ontwikkeling van AI en de trends in de industrie. Van zijn bescheiden begin tien jaar geleden tot de huidige reus met een waarde van 3,6 biljoen dollar, lijkt de toekomstige ontwikkeling van Huang grenzeloos.