- Published on
La Rivoluzione di NVIDIA Oltre le Specifiche: La Visione dirompente di Jensen Huang
Huang e Jobs: Pionieri di Due Ere
Al CES del 2025, quando Jensen Huang è apparso con la sua iconica giacca di pelle di alligatore, l'attenzione del pubblico era divisa tra l'attesa per le nuove mosse di NVIDIA e la curiosità per il suo abbigliamento. Tuttavia, il contenuto del suo discorso si è rivelato molto più incisivo dell'aspetto esteriore, con annunci di tecnologie innovative che hanno persino superato i risultati delle conferenze interne di NVIDIA. Ma cosa sta realmente rivoluzionando NVIDIA? Analizziamo a fondo.
GPU Serie RTX Blackwell: La Nuova Generazione di "Macchine Alchemiche"
NVIDIA ha lanciato la serie di GPU RTX Blackwell, con la RTX 5090 come protagonista. Sebbene non ci soffermeremo sui suoi potenti parametri, è rilevante sottolineare che la 5070, la scheda meno performante della serie, raggiunge prestazioni paragonabili alla 4090 della generazione precedente, ma con un prezzo inferiore di un terzo.
Come noto, le schede grafiche consumer sono particolarmente adatte per l'implementazione locale di modelli open source. La RTX 5090 è quindi considerata la nuova generazione di "macchine alchemiche", fondamentali per l'addestramento di modelli di intelligenza artificiale.
- Ottimizzazione dei Modelli: La collaborazione tra Black Forest Studio e NVIDIA ha permesso di ottimizzare il modello FLUX, con un notevole incremento della velocità di inferenza sulle schede della serie 50.
- Velocità di Inferenza: Il modello DEV, sulla 5090, ha una velocità di inferenza doppia rispetto alla 4090.
- Nuovi Formati: A febbraio, verrà introdotto il modello FLUX nel formato di quantizzazione FP4.
Il mercato ha già visto la comparsa di "scalper" della 5090, indicando una crescita esplosiva nel corso dell'anno per studi di AI design, AI art, AI comics e AI short films.
Project DIGITS: La Rivoluzione dei Grandi Modelli su Piattaforma Desktop Cloud
Se i software di pittura possono essere implementati localmente, perché non dovrebbe essere possibile fare lo stesso con grandi modelli con oltre 13 miliardi di parametri? Jensen Huang ha dato una risposta affermativa. NVIDIA ha lanciato "Project DIGITS", una piattaforma cloud desktop che consente di eseguire modelli con 200 miliardi di parametri direttamente sulla scrivania, con un semplice collegamento a una presa di corrente standard.
Una volta completato lo sviluppo o l'inferenza dei grandi modelli sul sistema desktop, è possibile implementare il tutto senza soluzione di continuità nel cloud accelerato o nel data center. Questo apre la strada all'esplosione di modelli dedicati basati su set di dati di allenamento personali. In futuro, gli sviluppatori potrebbero implementare localmente modelli da 8 a 13 miliardi di parametri, ricreando il successo di Stable Diffusion tra i creatori individuali. Per loro, un costo di 3.000 dollari non è un ostacolo insormontabile.
NVIDIA GB200 NVL72: Super Chip per Data Center
NVIDIA ha presentato il GB200 NVL72, un super chip per data center dotato di 72 GPU Blackwell, una capacità di calcolo di 1,4 exaFLOPS e 130 trilioni di transistor. Jensen Huang lo ha persino paragonato allo scudo di Capitan America, sottolineandone la potenza e la protezione che offre.
La potenza di questo chip è tale che, tenendone sei in mano, Huang ha dimostrato di avere una capacità di calcolo paragonabile a quella dell'intera infrastruttura di molte aziende AI e case automobilistiche cinesi. Per fare un confronto, la capacità di calcolo totale per la guida autonoma di Li Auto è di 8,1 EFLOPS. Con la realizzazione di data center basati su questi super chip, la prossima generazione di grandi modelli linguistici, la guida autonoma end-to-end e i modelli mondiali per la robotica non soffriranno più della carenza di potenza di calcolo.
Modello Cosmos: L'AI Comprende il Mondo Fisico
NVIDIA ha lanciato il modello Cosmos, una piattaforma di sviluppo di modelli mondiali che "insegna all'AI a comprendere il mondo fisico". È composto da modelli base del mondo, Tokenizer e flussi di lavoro per l'elaborazione video, rappresentando una grande novità per la robotica e i laboratori AV.
Cosmos può accettare input di testo, immagini o video e generare stati del mondo virtuale, il che significa che le macchine possono finalmente costruire e comprendere il mondo nella loro "mente". Essendo un modello mondiale video open source con pesi aperti, è stato addestrato su 20 milioni di ore di video, con pesi che vanno da 4 a 14 miliardi.
Sebbene esistano molte definizioni di modelli mondiali, la capacità di simulazione 4D di Cosmos è unica. L'impatto rivoluzionario di questa tecnologia nel breve termine è che i dati sintetici risolveranno il problema della carenza di big data nell'AI fisica. NVIDIA ha già applicato Cosmos alla generazione di dati sintetici su larga scala per la robotica e la guida autonoma, aprendo l'accesso agli sviluppatori per la messa a punto dei dati e l'addestramento di robot e AI.
Scommessa sull'AI Fisica: Guida Autonoma e Robotica
NVIDIA ha investito in potenza di calcolo, modelli e dati, scommettendo che i settori della guida autonoma e della robotica saranno i primi a esplodere. Huang prevede persino che Robotaxi diventerà la prima industria robotica a raggiungere un trilione di dollari.
Per la guida autonoma, NVIDIA ha introdotto il processore per auto di prossima generazione "Thor Blackwell", con una capacità di elaborazione 20 volte superiore al chip precedente, utilizzabile anche per robot umanoidi. Per la robotica, NVIDIA IsaacGroot offre agli sviluppatori quattro supporti principali: modelli base di robot, pipeline di dati, framework di simulazione e computer robot Thor.
NVIDIA ha gettato solide basi per il "momento GPT della robotica". Si prevede che nel 2025 i settori dell'intelligenza incorporata e della guida autonoma vedranno un'ondata di investimenti.
[Immagine: Huang e Jobs - Due icone dell'era mobile e dell'AI]
Agente AI: Un'Industria da Molti Trilioni di Dollari
Huang ha anche previsto che l'industria degli Agenti AI raggiungerà un valore di molti trilioni di dollari. I prodotti correlati sono gli AI agentici con la funzione "Test-Time Scaling", che supportano strumenti come calcolatrici, ricerca web, ricerca semantica e ricerca SQL. Se NVIDIA collaborasse con il framework Swarms per l'accelerazione del calcolo tramite GPU e l'integrazione dell'AI, Swarms potrebbe diventare il vincitore finale, con tutti gli Agenti AI operativi all'interno del suo framework. Swarms ha il potenziale per diventare un gigante del valore di un trilione di dollari, mentre il suo valore attuale è di soli 540 milioni di dollari, il che suggerisce un enorme margine di crescita.
Le Quattro Fasi dello Sviluppo dell'AI di NVIDIA
Rispetto alle cinque fasi di sviluppo dell'AGI di Sam di OpenAI, le quattro fasi dell'AI di NVIDIA sono più ampie e ambiziose:
- AI Percettiva: riconoscimento vocale, riconoscimento approfondito
- AI Generativa: generazione di testo, immagini o video
- AI Agente: assistenti alla programmazione, ecc., per aiutare gli esseri umani a completare le attività
- AI Fisica: auto a guida autonoma, robot universali
Questa suddivisione mostra chiaramente l'evoluzione dell'AI e le leggi dello sviluppo industriale. Huang, da quando 10 anni fa è salito sul palco per sostenere Xiaomi, è diventato un colosso da 3,6 trilioni di dollari, e il suo sviluppo futuro sembra ancora illimitato.