Published on

Strategiczna zmiana w Zero One Wanwu: Rezygnacja z pościgu za supermodelami

Autorzy
  • avatar
    Imię
    Ajax
    Twitter

Strategiczna Zmiana Zero One Wanwu

CEO Zero One Wanwu, Kai-Fu Lee, w wywiadzie dla LatePost szczegółowo opisał niedawne zmiany w strategii firmy. Kluczową zmianą jest to, że Zero One Wanwu nie będzie już dążyć do trenowania supermodeli, zamiast tego skupi się na opracowywaniu modeli o umiarkowanych parametrach, które są szybsze i bardziej ekonomiczne. To posunięcie ma służyć jako podstawa do budowania zastosowań komercyjnych. Zmiana ta oznacza pierwsze publiczne i znaczące dostosowanie kierunku rozwoju przez chińskiego jednorożca w dziedzinie dużych modeli i odzwierciedla ważny punkt zwrotny w gorączce dużych modeli z ostatnich dwóch lat.

Lee podkreślił, że Zero One Wanwu nie szuka przejęcia i będzie kontynuować wstępne szkolenie. Firma nawiązała współpracę z Alibaba Cloud, tworząc "Wspólne Laboratorium Dużych Modeli Przemysłowych". Większość zespołów ds. szkolenia i infrastruktury AI Zero One Wanwu dołączy do tego laboratorium, stając się pracownikami Alibaba. Celem tej współpracy jest wykorzystanie zasobów dużych firm do szkolenia większych modeli, co ma wzmocnić możliwości mniejszych modeli Zero One Wanwu.

Wyzwania Chińskiego Rozwoju Dużych Modeli

Lee podsumował kilka wyzwań, przed którymi stoją chińskie startupy zajmujące się dużymi modelami:

  • Ograniczenia dotyczące chipów: Chińskie firmy mają ograniczenia w dostępie do chipów, co skutkuje znacznie niższym finansowaniem i wycenami w porównaniu z ich amerykańskimi odpowiednikami.
  • Spowolnienie Prawa Skalowania: Efekt Prawa Skalowania słabnie, a przejście od wiary do sceptycyzmu zajęło zaledwie rok.
  • Konkurencja z dużymi firmami: Startupom trudno konkurować z dużymi firmami pod względem skali modeli, co ostatecznie prowadzi do niepowodzenia.
  • Trudności w komercjalizacji: Jak przekształcić technologię w wartość komercyjną i osiągnąć zysk, to pytanie, które zadają sobie wszystkie firmy zajmujące się dużymi modelami.
  • Trudności rynkowe: Na rynkach To B, To C, krajowych i zagranicznych istnieją trudne do pokonania przeszkody.

Strategia Zero One Wanwu

Lee uważa, że rok 2025 będzie rokiem jednoczesnego wybuchu zastosowań i eliminacji komercyjnej. Szansą dla Zero One Wanwu jest odkrycie Product-Market Fit (PMF) dla dużych modeli To B. Wskazał, że w niektórych niszowych obszarach duże modele mogą pomóc klientom podwoić przychody, co stanowi prawdziwy PMF.

Po zmianie strategii Zero One Wanwu skupi się na:

  • Szkoleniu szybszych i tańszych modeli, takich jak MoE (Model Systemu Mieszanych Ekspertów).
  • Wykorzystaniu swojej przewagi w infrastrukturze AI i silnikach wnioskowania w celu obniżenia kosztów szkolenia i wnioskowania.
  • Współpracy z firmami z branży, tworzeniu spółek joint venture w celu wspólnego opracowywania modeli i rozwiązań dla konkretnych branż.

Powody Rezygnacji z Pościgu za AGI

Lee przyznał, że Zero One Wanwu dawno zrezygnowało z pościgu za AGI (Ogólną Sztuczną Inteligencją). Wyjaśnił, że dążenie do AGI wymaga ogromnych nakładów zasobów, a najwyższym priorytetem dla Zero One Wanwu na obecnym etapie jest wzmocnienie swojej pozycji i osiągnięcie rentowności komercyjnej.

Wspominając doświadczenia z maja ubiegłego roku, kiedy Zero One Wanwu wprowadziło model Yi-Large, Lee powiedział, że zdał sobie wtedy sprawę, że model jest powolny i drogi. To skłoniło Zero One Wanwu do podjęcia decyzji: zamiast spalać pieniądze na szkolenie supermodeli, skupi się na rozwijaniu komercyjnych modeli, które można wdrożyć i które przynoszą zyski.

Współpraca z Alibaba

Utworzenie wspólnego laboratorium z Alibaba Cloud jest kluczowym krokiem w strategicznej zmianie Zero One Wanwu. Lee stwierdził, że ten model współpracy pozwoli w pełni wykorzystać zalety obu stron, przyspieszając współdzielenie i współtworzenie w zakresie technologii, platform i zastosowań, otwierając nowy paradygmat współpracy "dużej firmy + małego tygrysa" w Chinach.

Chociaż część zespołu ds. wstępnego szkolenia i infrastruktury AI dołączy do Alibaba, Zero One Wanwu zachowa mniejszy zespół ds. szkolenia i infrastruktury, aby kontynuować rozwój modeli. Lee podkreślił, że Zero One Wanwu nie przestanie wstępnie trenować, ale nie będzie już koncentrować się na supermodelach.

Spowolnienie Prawa Skalowania

Lee zauważył, że Prawo Skalowania słabnie. Oznacza to, że zwroty z inwestycji większej mocy obliczeniowej i danych są coraz mniejsze. Podał przykład, że przejście z jednej karty do dziesięciu kart może osiągnąć wartość 9,5 karty, ale przejście z 100 000 kart do miliona kart może osiągnąć wartość tylko 300 000 kart.

Wspomniał również, że zasoby danych internetowych, podobnie jak paliwa kopalne, stopniowo się wyczerpują. To sprawia, że koszty szkolenia supermodeli stają się coraz wyższe, a zwroty coraz niższe.

Rola Supermodeli

Pomimo spowolnienia Prawa Skalowania, Lee uważa, że supermodele nadal odgrywają ważną rolę, zwłaszcza jako modele nauczycielskie. Zauważył, że model Opus firmy Anthropic służy do szkolenia mniejszych modeli.

Supermodele mogą wzmocnić możliwości mniejszych modeli poprzez:

  • Oznaczanie wyników, co poprawia efekt uczenia po szkoleniu.
  • Generowanie danych syntetycznych do szkolenia nowych modeli.

Komercjalizacja: Kluczowe Pytanie

Lee uważa, że w erze dużych modeli wszystko przyspiesza, a pytanie o komercjalizację pojawia się szybciej. Podkreślił, że firmy zajmujące się sztuczną inteligencją muszą odpowiedzieć na kluczowe pytanie: jak przekształcić technologię w wartość komercyjną i osiągnąć zysk.

Stwierdził, że firmy AI muszą:

  • Rozumieć działalność komercyjną.
  • Osiągać wzrost przychodów.
  • Kontrolować koszty.

Lee podkreślił również, że należy unikać inwestowania w kierunki komercjalizacji, które nie przynoszą zwrotów, takie jak aplikacje To C, które wymagają ciągłego dofinansowania i generują straty, aby utrzymać pozycję w branży, oraz projekty przetargowe To B, które nie są dobrze płatne i nie tworzą wartości.

Ścieżka Komercjalizacji Zero One Wanwu

Zero One Wanwu aktywnie rozwija rynek To B i podejmuje próby w branżach takich jak gry, energetyka, motoryzacja i finanse. Będą współpracować z firmami z branży, tworząc spółki joint venture w celu wspólnego opracowywania modeli i rozwiązań dla konkretnych branż.

Lee poinformował, że rzeczywiste przychody Zero One Wanwu w 2024 roku przekroczyły 100 milionów juanów, a prognozy na 2025 rok przewidują kilkukrotny wzrost przychodów.

Przyszłość Aplikacji AI-First

Lee uważa, że na pewno pojawią się przełomowe aplikacje AI-first. Wskazał, że aplikacje te muszą posiadać następujące kluczowe cechy:

  • Interakcja za pomocą języka naturalnego.
  • Zdolność do ogólnego rozumowania i zrozumienia.

Podał również metodę oceny: jeśli aplikacja nie może istnieć bez dużego modelu, to na pewno jest to aplikacja AI-first.

Refleksje Przedsiębiorcze Lee Kai-fu

Lee powiedział, że zaangażował się w startup AI, aby wykorzystać możliwości ery AI i przekształcić swoje doświadczenie i umiejętności w wartość. Uważa, że w procesie przedsiębiorczości nieuchronnie pojawią się wyzwania, ale dobry CEO nie powinien łatwo żałować.

Podsumował swoje refleksje przedsiębiorcze:

  • Nie angażuj się ślepo w niemożliwe do osiągnięcia cele.
  • Wykorzystuj okazje i podejmuj zdecydowane decyzje.
  • Miej jasną prognozę na przyszłość i dokonuj dostosowań z wyprzedzeniem.

Perspektywy na 2025 Rok

Lee jest pełen nadziei na rok 2025. Przewiduje:

  • Eksplozję licznych aplikacji To C.
  • Odkrycie PMF dla dużych modeli To B oraz pojawienie się dużej liczby modeli dla konkretnych branż.

Stwierdził również, że Zero One Wanwu bada zastosowania agentów (inteligentnych agentów) i będzie współpracować z partnerami w branżach w celu wspólnego opracowywania modeli branżowych + agentów.