- Published on
Rewolucja NVIDII Wykraczająca Poza Specyfikacje: Wizja Przełomowa Jensena Huanga
Jensen Huang i Steve Jobs: Pionierzy Dwóch Epok
Na targach CES 2025, kiedy Jensen Huang pojawił się w swojej charakterystycznej skórzanej kurtce, uwaga publiczności skupiła się bardziej na jego stroju niż na oczekiwanych nowościach od NVIDII. Jednak treść jego wystąpienia okazała się znacznie bardziej rewolucyjna niż jego ubiór. Innowacyjne technologie zaprezentowane przez NVIDIĘ przewyższyły nawet te, które były pokazywane na ich własnych konferencjach. Co tak naprawdę rewolucjonizuje NVIDIA? Przyjrzyjmy się temu bliżej.
Seria RTX Blackwell: Nowa Generacja "Maszyn do Trenowania AI"
NVIDIA wprowadziła na rynek serię RTX Blackwell, a najbardziej wyczekiwaną kartą graficzną jest RTX 5090. Nie będziemy tutaj szczegółowo omawiać jej imponujących parametrów, ale warto wspomnieć, że nawet najsłabsza karta w tej serii, RTX 5070, oferuje wydajność porównywalną z poprzednią generacją 4090, a jej cena jest niższa o jedną trzecią.
Jak wiadomo, karty graficzne klasy konsumenckiej doskonale nadają się do lokalnego wdrażania modeli open-source. RTX 5090 jest więc uważana za nową generację "maszyn do trenowania AI".
Studio Black Forest, współpracując z NVIDIĄ, zoptymalizowało model FLUX, co znacząco przyspieszyło jego wnioskowanie na kartach z serii 50. Model DEV na RTX 5090 wnioskuje dwukrotnie szybciej niż na 4090. Ponadto, w lutym zostanie wprowadzony model FLUX w formacie kwantyzacji FP4.
Na rynku pojawiły się już przedpremierowe oferty sprzedaży RTX 5090, co zapowiada gwałtowny wzrost liczby studiów zajmujących się projektowaniem AI, grafiką AI, komiksami AI i krótkimi filmami AI w tym roku.
Project DIGITS: Rewolucja Dużych Modeli na Platformie Chmurowej
Skoro oprogramowanie do grafiki można uruchomić lokalnie, to czy można również duże modele o parametrach powyżej 13 miliardów? Jensen Huang daje pozytywną odpowiedź. NVIDIA wprowadziła na rynek komputer "Project DIGITS" – platformę chmurową działającą na biurku, która umożliwia uruchamianie modeli o 200 miliardach parametrów, wymagając jedynie standardowego gniazdka elektrycznego.
Po zakończeniu procesu rozwoju lub wnioskowania dużych modeli na systemie stacjonarnym, można je bezproblemowo wdrożyć w chmurze lub centrum danych. Otwiera to drogę do gwałtownego rozwoju dedykowanych modeli opartych na indywidualnych zestawach treningowych. W przyszłości programiści mogą wdrażać lokalnie modele o 8-13 miliardach parametrów, odtwarzając popularność Stable Diffusion wśród indywidualnych twórców. Koszt 3000 dolarów nie jest dla nich nieosiągalny.
NVIDIA GB200 NVL72: Superczip dla Centrów Danych
NVIDIA zaprezentowała NVIDIA GB200 NVL72 – superczip dla centrów danych, wyposażony w 72 procesory graficzne Blackwell, moc obliczeniową 1.4 eksaFLOPS i 130 bilionów tranzystorów. Jensen Huang porównał go nawet do tarczy Kapitana Ameryki.
Potęga tego czipu polega na tym, że sześć takich układów w rękach Huanga dorównuje mocą obliczeniową wielu chińskim firmom AI i ośrodkom badawczym zajmującym się autonomiczną jazdą. Dla porównania, moc obliczeniowa systemów autonomicznej jazdy Ideal Auto wynosi 8.1 EFLOPS. Wraz z uruchamianiem centrów danych wyposażonych w ten superczip, nowa generacja dużych modeli językowych, autonomiczna jazda end-to-end oraz modele świata dla robotów nie będą już cierpieć z powodu niedoboru mocy obliczeniowej.
Model Cosmos: AI Zrozumie Świat Fizyczny
NVIDIA ogłosiła wprowadzenie modelu Cosmos, platformy do tworzenia modeli świata, która "uczy AI rozumienia świata fizycznego". Składa się z podstawowego modelu świata, tokenizerów i przepływu pracy przetwarzania wideo, co jest dobrą wiadomością dla laboratoriów robotyki i AV.
Cosmos przyjmuje dane wejściowe w postaci tekstu, obrazów lub filmów i generuje wirtualne stany świata, co oznacza, że maszyny w końcu mogą budować i rozumieć świat w swojej "świadomości". Jako model świata wideo o otwartym kodzie źródłowym, Cosmos został wytrenowany na 20 milionach godzin filmów, a wagi wahają się od 4 do 14 miliardów.
Choć definicji modeli świata jest wiele, unikalną cechą Cosmos jest jego zdolność do symulacji 4D. Rewolucyjny wpływ tej technologii w najbliższym czasie polega na tym, że dane syntetyczne rozwiążą problem niedoboru dużych zbiorów danych w fizycznej AI. NVIDIA wykorzystuje już Cosmos do generowania syntetycznych danych na dużą skalę dla robotyki i autonomicznej jazdy, udostępniając go programistom do dostrajania danych i trenowania robotów i AI.
Inwestycja w Fizyczną AI: Autonomiczna Jazda i Robotyka
NVIDIA zainwestowała w moc obliczeniową, modele i dane, obstawiając, że autonomiczna jazda i robotyka będą dwoma sektorami, które najszybciej odnotują dynamiczny rozwój. Jensen Huang przewiduje nawet, że Robotaxi stanie się pierwszą branżą robotyczną o wartości biliona dolarów.
W dziedzinie autonomicznej jazdy NVIDIA wprowadziła na rynek procesor samochodowy nowej generacji o nazwie "Thor Blackwell", którego moc obliczeniowa jest 20 razy większa niż w przypadku poprzedniej generacji i może być również wykorzystywana w robotach humanoidalnych. Dla robotyki NVIDIA IsaacGroot oferuje programistom cztery główne elementy wsparcia: podstawowe modele robotów, potoki danych, ramy symulacyjne i komputer robotyczny Thor.
NVIDIA zbudowała solidną infrastrukturę pod "moment GPT dla robotów". Przewiduje się, że w 2025 roku sektor inteligentnych robotów i autonomicznej jazdy w Chinach doświadczy boomu finansowego.
[Obrazek: Jensen Huang i Steve Jobs - dwie ikony ery mobilnej i AI]
AI Agent: Branża Warta Biliony Dolarów
Jensen Huang przewiduje również, że branża AI Agent osiągnie wartość bilionów dolarów. Powiązanym produktem jest Agentic AI z funkcją "Test-Time Scaling", obsługujący narzędzia takie jak kalkulator, wyszukiwanie w sieci, wyszukiwanie semantyczne i wyszukiwanie SQL. Jeśli NVIDIA nawiąże współpracę z Swarms w zakresie przyspieszonych obliczeń GPU i integracji AI, Swarms może ostatecznie stać się dominującym graczem, a wszystkie AI Agent będą działać w jego ramach. Swarms ma potencjał, by stać się firmą o wartości biliona dolarów, a jej obecna wartość rynkowa wynosi zaledwie 540 milionów dolarów, co rodzi pytanie o ogromny potencjał wzrostu.
Cztery Etapy Rozwoju AI według NVIDII
W porównaniu z pięcioma etapami rozwoju AGI według Sama z OpenAI, cztery etapy rozwoju AI według NVIDII są bardziej makro i ambitne:
- AI Percepcyjna: Rozpoznawanie mowy, głębokie rozpoznawanie
- Generatywna AI: Generowanie tekstu, obrazów lub wideo
- AI Agent: Pomocnicy programistów itp., pomagający ludziom w wykonywaniu zadań
- Fizyczna AI: Autonomiczne samochody, uniwersalne roboty
Taki podział jasno pokazuje ścieżkę rozwoju AI i prawa rozwoju branży. Jensen Huang, który 10 lat temu prezentował produkty Xiaomi, dziś jest gigantem o wartości rynkowej 3,6 biliona dolarów, a jego przyszły rozwój wydaje się nieograniczony.