Published on

Lee Kai-Fu's Zero One Wanwu Strategie: Geen Achtervolging van Supergrote Modellen Meer

Auteurs
  • avatar
    Naam
    Ajax
    Twitter

Strategische Aanpassing van Zero One Wanwu: Geen Supergrote Modellen Meer

Zero One Wanwu CEO, Lee Kai-Fu, heeft in een interview met LatePost de recente strategische aanpassingen van het bedrijf toegelicht. De kern van deze verandering is dat Zero One Wanwu niet langer supergrote modellen zal trainen. In plaats daarvan ligt de focus op het ontwikkelen van modellen met een gemiddeld aantal parameters die sneller en economischer zijn. Deze modellen vormen dan de basis voor het bouwen van commerciële applicaties. Deze verschuiving markeert de eerste openbare, grote koerswijziging van een Chinees AI-model unicorn, en weerspiegelt een belangrijk keerpunt in de hype rond grote modellen van de afgelopen twee jaar.

Lee Kai-Fu benadrukte dat Zero One Wanwu niet op zoek is naar een overname en dat het bedrijf doorgaat met pre-training. Het bedrijf heeft een "Joint Laboratory for Industry Large Models" opgericht met Alibaba Cloud. Het grootste deel van het trainings- en AI-infrastructuurteam van Zero One Wanwu zal deel uitmaken van dit laboratorium als werknemers van Alibaba. Deze samenwerking is bedoeld om de middelen van een groot bedrijf te gebruiken om grotere modellen te trainen, waardoor de mogelijkheden van de kleinere modellen van Zero One Wanwu worden verbeterd.

Uitdagingen voor Chinese AI-Model Startups

Lee Kai-Fu somde de belangrijkste uitdagingen op waarmee Chinese AI-model startups worden geconfronteerd:

  • Chipbeperkingen: Chinese bedrijven worden geconfronteerd met beperkingen op de verkrijgbaarheid van chips, wat resulteert in lagere financieringsbedragen en waarderingen dan hun Amerikaanse tegenhangers.
  • Vertraging van Scaling Law: Het effect van Scaling Law (de wet van schaalvergroting) neemt af. Het geloof erin is binnen een jaar omgeslagen in scepsis.
  • Concurrentie met Grote Bedrijven: Startups concurreren met grote bedrijven op het gebied van modelomvang, wat uiteindelijk moeilijk te winnen is.
  • Commerciële Uitdagingen: De vraag hoe technologie om te zetten in commerciële waarde en winstgevendheid te bereiken is een fundamentele kwestie voor alle grote modelbedrijven.
  • Marktproblemen: Er zijn moeilijk te doorbreken knelpunten in de To B-, To C-, binnenlandse en buitenlandse markten.

De Aanpak van Zero One Wanwu

Lee Kai-Fu gelooft dat 2025 een jaar zal zijn van zowel een explosie van applicaties als commerciële eliminatie. De kans voor Zero One Wanwu ligt in het ontdekken van de Product-Market Fit (PMF) van To B grote modellen. Hij wees erop dat in sommige nichegebieden grote modellen klanten kunnen helpen hun omzet te verdubbelen, wat de echte PMF is.

Na de strategische aanpassing zal Zero One Wanwu zich richten op:

  • Het trainen van snellere en goedkopere modellen, zoals MoE (Mixture of Experts) modellen.
  • Het gebruikmaken van zijn eigen sterke punten in AI-infrastructuur en inferentie-engines om de trainings- en inferentiekosten te verlagen.
  • Het samenwerken met bedrijven uit de industrie, het oprichten van joint ventures, en het gezamenlijk ontwikkelen van niche-industriemodellen en oplossingen.

De Redenen Achter het Opgeven van AGI

Lee Kai-Fu gaf toe dat Zero One Wanwu al vroeg is gestopt met het nastreven van AGI (Artificial General Intelligence). Hij legde uit dat het nastreven van AGI enorme investeringen vereist, terwijl de hoogste prioriteit van Zero One Wanwu op dit moment is om zijn eigen kracht te consolideren en commerciële winstgevendheid te bereiken.

Hij keek terug op de ervaring van Zero One Wanwu met de lancering van het Yi-Large model in mei vorig jaar en zei dat ze zich toen al bewust waren van de trage snelheid en de hoge kosten van het model. Dit bracht Zero One Wanwu tot een beslissing: niet langer geld verbranden aan het trainen van supergrote modellen, maar zich richten op het ontwikkelen van commerciële modellen die kunnen worden geïmplementeerd en winst opleveren.

De Samenwerking met Alibaba

De oprichting van een gezamenlijk laboratorium met Alibaba Cloud is een belangrijke stap in de strategische aanpassing van Zero One Wanwu. Lee Kai-Fu zei dat dit samenwerkingsmodel de sterke punten van beide partijen volledig kan benutten om de gedeelde constructie op het gebied van technologie, platforms en applicaties te versnellen, en een nieuw paradigma van samenwerking "groot bedrijf + kleine tijger" in China te starten.

Hoewel een deel van het pre-training en AI-infrastructuurteam zich bij Alibaba zal voegen, behoudt Zero One Wanwu nog steeds een kleiner trainings- en infrastructuurteam om door te gaan met modelontwikkeling. Lee Kai-Fu benadrukte dat Zero One Wanwu niet zal stoppen met pre-training, maar niet langer vasthoudt aan supergrote modellen.

De Vertraging van Scaling Law

Lee Kai-Fu wees erop dat Scaling Law (de wet van schaalvergroting) vertraagt. Dit betekent dat de voordelen van het investeren van meer rekenkracht en data afnemen. Hij gaf het voorbeeld dat het toevoegen van één kaart aan tien kaarten de waarde van 9,5 kaarten kan bereiken, maar het toevoegen van 100.000 kaarten aan 1 miljoen kaarten de waarde van slechts 300.000 kaarten kan bereiken.

Hij noemde ook dat internetdatamiddelen, net als fossiele brandstoffen, geleidelijk opraken. Dit maakt de trainingskosten van supergrote modellen steeds hoger en de rendementen steeds lager.

De Rol van Supergrote Modellen

Ondanks de vertraging van Scaling Law, gelooft Lee Kai-Fu dat supergrote modellen nog steeds een belangrijke rol spelen, vooral als docentmodellen. Hij wees erop dat het Opus-model van Anthropic wordt gebruikt om kleinere modellen te trainen.

Supergrote modellen kunnen de capaciteiten van kleine modellen op de volgende manieren verbeteren:

  • Resultaten annoteren om de effecten van na-training te verbeteren.
  • Synthetische data genereren voor het trainen van nieuwe modellen.

De Commerciële Vraag

Lee Kai-Fu gelooft dat alles in het tijdperk van grote modellen versnelt en dat de commerciële vraag sneller komt. Hij benadrukt dat AI-bedrijven de kernvraag moeten beantwoorden: hoe technologie om te zetten in commerciële waarde en winst te realiseren?

Hij stelt dat AI-bedrijven het volgende nodig hebben:

  • Begrip van commerciële activiteiten.
  • Het realiseren van inkomstengroei.
  • Kostenbeheersing.

Lee Kai-Fu benadrukte ook het vermijden van het investeren in commerciële richtingen die geen rendement opleveren, zoals To C-applicaties die voortdurend bloedtransfusies en verliezen nodig hebben om hun positie in de industrie te behouden, en To B-aanbestedingsprojecten die niet veel betalen en geen kernwaarde creëren.

De Commerciële Route van Zero One Wanwu

Zero One Wanwu is actief bezig met het uitbreiden van de To B-markt en experimenteert in sectoren als gaming, energie, auto's en financiën. Ze zullen samenwerken met bedrijven uit de industrie, joint ventures oprichten en gezamenlijk niche-industriemodellen en oplossingen ontwikkelen.

Lee Kai-Fu zei dat de werkelijke inkomsten van Zero One Wanwu in 2024 meer dan 100 miljoen RMB bedroegen en dat de inkomsten in 2025 naar verwachting zullen verviervoudigen.

De Toekomst van AI-First Applicaties

Lee Kai-Fu gelooft dat er zeker baanbrekende AI-first applicaties zullen ontstaan. Hij wees erop dat deze applicaties de volgende kernkenmerken moeten hebben:

  • Interactie door middel van natuurlijke taal.
  • Algemene redeneer- en begripsvermogen.

Hij gaf ook een methode om dit te beoordelen: als een applicatie niet kan bestaan zonder een groot model, dan is het zeker een AI-first applicatie.

De Ondernemende Inzichten van Lee Kai-Fu

Lee Kai-Fu zei dat hij in AI-ondernemerschap is gestapt om de kansen van het AI-tijdperk te grijpen en zijn ervaring en capaciteiten om te zetten in waarde. Hij gelooft dat er tijdens het ondernemen onvermijdelijk uitdagingen zullen zijn, maar dat een goede CEO geen spijt moet hebben.

Hij vatte zijn ondernemende inzichten samen:

  • Investeer niet blindelings in onmogelijke doelen.
  • Grijp kansen en neem resoluut beslissingen.
  • Heb duidelijke voorspellingen over de toekomst en pas je daarop aan.

De Vooruitzichten voor 2025

Lee Kai-Fu is vol vertrouwen over 2025. Hij voorspelt:

  • Een groot aantal To C-applicaties zal exploderen.
  • De PMF van To B grote modellen zal worden ontdekt, en er zullen grote hoeveelheden niche-industriemodellen ontstaan.

Hij zei ook dat Zero One Wanwu de toepassingen van Agent (intelligente entiteiten) onderzoekt en dat het in verticale gebieden zal samenwerken met partners om industriemodellen + Agent te ontwikkelen.