Published on

NVIDIAs Revolution: Jensen Huangs Vision jenseits der Spezifikationen

Autoren
  • avatar
    Name
    Ajax
    Twitter

Die Ära Huang: Ein Vergleich mit Steve Jobs

Auf der CES 2025 zog Jensen Huang, gekleidet in seine ikonische Krokodillederjacke, die Aufmerksamkeit auf sich. Doch die eigentliche Sensation waren die bahnbrechenden Technologien, die er präsentierte, welche sogar die Erwartungen an NVIDIA-Veranstaltungen übertrafen. Was genau revolutioniert NVIDIA? Lassen Sie uns dies genauer untersuchen.

RTX Blackwell Serie: Die neue Generation der 'KI-Zauberer'-GPUs

NVIDIA hat die RTX Blackwell Serie von GPUs vorgestellt, wobei die RTX 5090 das größte Aufsehen erregte. Obwohl wir hier nicht auf die detaillierten Spezifikationen eingehen, ist es bemerkenswert, dass selbst die leistungsschwächste Karte der Serie, die 5070, die Leistung der vorherigen 4090 erreicht, jedoch zu einem um ein Drittel reduzierten Preis.

Es ist allgemein bekannt, dass Consumer-Grafikkarten besonders für die lokale Bereitstellung von Open-Source-Modellen geeignet sind. Die RTX 5090 wird daher als die neue Generation der "KI-Zauberer" gefeiert.

Die Black Forest Studios haben in Zusammenarbeit mit NVIDIA das FLUX-Modell optimiert, wodurch die Inferenzgeschwindigkeit auf den Karten der 50er-Serie deutlich gesteigert wurde. Das DEV-Modell ist auf der 5090 doppelt so schnell wie auf der 4090. Darüber hinaus wird im Februar eine FP4-quantisierte Version des FLUX-Modells erscheinen.

Der Markt hat bereits Vorbestellungen für die 5090 erlebt, was auf ein exponentielles Wachstum von Studios in den Bereichen KI-Design, KI-Kunst, KI-Comics und KI-Kurzfilme in diesem Jahr hindeutet.

Project DIGITS: Die Revolution der Cloud-Desktop-Plattformen für große Modelle

Wenn Zeichenprogramme lokal eingesetzt werden können, warum nicht auch große Modelle mit mehr als 13 Milliarden Parametern? Huang hat diese Frage mit der Einführung der "Project DIGITS" Desktop-Cloud-Plattform beantwortet. Diese ermöglicht es, große Modelle mit 200 Milliarden Parametern auf einem Desktop-Rechner zu betreiben, und das mit einer Standardsteckdose.

Nach der Entwicklung oder Inferenz großer Modelle auf dem Desktop können diese nahtlos in beschleunigte Cloud- oder Rechenzentren bereitgestellt werden. Dies ermöglicht die Entwicklung spezialisierter Modelle, die auf persönlichen Datensätzen basieren. In Zukunft werden Entwickler möglicherweise lokale Modelle mit 8-13 Milliarden Parametern einsetzen und so den Erfolg von Stable Diffusion für einzelne Kreative wiederholen. Für sie sind die Kosten von 3.000 US-Dollar ebenfalls nicht unerschwinglich.

NVIDIA GB200 NVL72: Der Superchip für Rechenzentren

NVIDIA hat den NVIDIA GB200 NVL72 eingeführt, einen Datenzentrum-Superchip mit 72 Blackwell-GPUs, 1,4 ExaFLOPS Rechenleistung und 130 Billionen Transistoren. Huang verglich ihn sogar mit dem Schild von Captain America.

Die Stärke dieses Chips liegt darin, dass Huang mit nur sechs dieser Chips eine Rechenleistung erreichen kann, die mit der ganzer Serverräume vieler chinesischer KI-Unternehmen und Automobilhersteller konkurrieren kann. Zum Vergleich: Die gesamte Rechenleistung des autonomen Fahrens von Li Auto beträgt 8,1 EFLOPS. Mit der stetigen Errichtung von Rechenzentren, die mit diesem Superchip ausgestattet sind, werden die nächste Generation von Sprachmodellen, End-to-End-Autonomes Fahren und die Weltmodelle von Robotern nicht mehr unter Rechenleistungsmangel leiden.

Cosmos-Modell: KI die physikalische Welt verstehen lassen

NVIDIA hat das Cosmos-Modell vorgestellt, eine Entwicklungsplattform für Weltmodelle, die KI die physikalische Welt verstehen lehrt. Es besteht aus einem Weltgrundmodell, Tokenizern und Workflows zur Videoverarbeitung, was eine großartige Nachricht für Roboter- und AV-Labore ist.

Cosmos kann Text-, Bild- oder Videoeingaben akzeptieren und virtuelle Weltzustände erzeugen. Dies bedeutet, dass Maschinen endlich in der Lage sind, die Welt im Kopf zu konstruieren und zu verstehen. Als Open-Source-Weltmodell mit offenen Gewichten wird es mit 20 Millionen Stunden Videomaterial trainiert, wobei die Gewichte von 4 Milliarden bis 140 Milliarden reichen.

Obwohl es viele Definitionen von Weltmodellen gibt, ist die 4D-Simulationsfähigkeit von Cosmos einzigartig. Die jüngste revolutionäre Auswirkung dieser Technologie ist, dass synthetische Daten das Problem des Mangels an Big Data in der physikalischen KI lösen werden. NVIDIA hat Cosmos bereits für die groß angelegte Generierung synthetischer Daten für Roboter und autonomes Fahren eingesetzt und es Entwicklern zur Verfügung gestellt, um Daten zu verfeinern und Roboter und KI zu trainieren.

Fokus auf physikalische KI: Autonomes Fahren und Robotik

NVIDIA hat in Bezug auf Rechenleistung, Modelle und Daten umfassende Vorkehrungen getroffen und setzt darauf, dass die beiden großen Bereiche des autonomen Fahrens und der Robotik zuerst durchstarten werden. Huang prognostiziert sogar, dass Robotaxi die erste Billionen-Dollar-Robotikindustrie sein wird.

Für das autonome Fahren hat NVIDIA den "Thor Blackwell" Prozessor der nächsten Generation vorgestellt, dessen Verarbeitungsleistung 20-mal höher ist als die des vorherigen Chips und der auch für humanoide Roboter verwendet werden kann. Für die Robotik bietet NVIDIA IsaacGroot Entwicklern vier wichtige Unterstützungspunkte: grundlegende Robotermodelle, Datenpipelines, Simulationsframeworks und den Thor-Robotercomputer.

NVIDIA hat die notwendige Infrastruktur für den "GPT-Moment der Robotik" geschaffen. Es wird erwartet, dass der Bereich der verkörperten Intelligenz und des autonomen Fahrens im Jahr 2025 eine Finanzierungswelle erleben werden.

[Bild: Jensen Huang und Steve Jobs - Zwei Ikonen des mobilen und KI-Zeitalters]

KI-Agenten: Eine Industrie im Wert von Billionen von Dollar

Huang prognostiziert auch, dass die KI-Agenten-Industrie ein Volumen von mehreren Billionen Dollar erreichen wird. Die zugehörigen Produkte sind Agentic AI mit der Funktion "Test-Time Scaling", die Taschenrechner, Web-Suchfunktionen, semantische Suche, SQL-Suche und andere Tools unterstützt. Wenn NVIDIA im Bereich der GPU-beschleunigten Berechnung und KI-Integration mit dem Swarms-Framework zusammenarbeitet, könnte Swarms letztendlich der Gewinner sein, wobei alle KI-Agenten innerhalb dieses Frameworks laufen. Es wird erwartet, dass Swarms in Zukunft zu einem Giganten mit einem Marktwert von Billionen von Dollar aufsteigen wird, während der aktuelle Marktwert nur 540 Millionen Dollar beträgt, was auf ein enormes Wachstumspotenzial hindeutet.

NVIDIAs vier Phasen der KI-Entwicklung

Im Vergleich zu den fünf Entwicklungsphasen der AGI von OpenAI Sam sind die vier Phasen der KI-Entwicklung von NVIDIA umfassender und energiegeladener:

  • Wahrnehmungs-KI: Spracherkennung, Tiefenerkennung
  • Generative KI: Generierung von Text, Bildern oder Videos
  • Agenten-KI: Programmierassistenten usw., die Menschen bei der Erledigung von Aufgaben helfen
  • Physikalische KI: Autonomes Fahren, Universalroboter

Diese Einteilung zeigt klar die Entwicklung der KI und die Gesetze der industriellen Entwicklung auf. Huangs Weg von seinen bescheidenen Anfängen vor 10 Jahren, als er auf der Bühne für Xiaomi warb, bis hin zum heutigen Giganten mit einem Marktwert von 3,6 Billionen US-Dollar scheint noch lange nicht zu Ende.