Стратегическая корректировка Zero One Wanwu: отказ от преследования сверхбольших моделей

Стратегический сдвиг Zero One Wanwu: отказ от погони за сверхбольшими моделями

Генеральный директор Zero One Wanwu, Ли Кайфу, в интервью для LatePost подробно рассказал о недавних стратегических изменениях в компании. Ключевое изменение заключается в том, что Zero One Wanwu больше не будет стремиться к обучению супербольших моделей. Вместо этого компания сосредоточится на разработке моделей со средними параметрами, которые будут быстрее и экономичнее, и на их основе будет строить коммерческие приложения. Этот переход знаменует собой первый публичный значительный сдвиг в направлении развития китайского единорога в области больших моделей, а также отражает важный переломный момент в буме больших моделей за последние два года.

Ли Кайфу подчеркнул, что Zero One Wanwu не стремится к поглощению и продолжит предварительное обучение. Компания создала "Совместную лабораторию промышленных больших моделей" с Alibaba Cloud, и большая часть команды по обучению и AI-инфраструктуре Zero One Wanwu присоединится к этой лаборатории, став сотрудниками Alibaba. Эта модель сотрудничества направлена на использование ресурсов крупных компаний для обучения более крупных моделей, тем самым повышая возможности собственных небольших моделей Zero One Wanwu.

Проблемы китайского стартапа в области больших моделей

Ли Кайфу обобщил несколько основных проблем, с которыми сталкиваются китайские стартапы в области больших моделей:

Ограничения на чипы: Китайские компании сталкиваются с ограничениями в получении чипов, что приводит к более низким суммам финансирования и оценкам по сравнению с их американскими аналогами.
Замедление закона масштабирования: Эффект закона масштабирования ослабевает, и от веры до скептицизма прошел всего год.
Конкуренция с крупными компаниями: Стартапам сложно конкурировать с крупными компаниями в масштабах моделей, что в конечном итоге приводит к неудачам.
Проблемы коммерциализации: Как преобразовать технологии в коммерческую ценность и добиться прибыльности - это основной вопрос, стоящий перед всеми компаниями, занимающимися большими моделями.
Рыночные трудности: Существуют труднопреодолимые узкие места на рынках To B, To C, как внутри страны, так и за рубежом.

Стратегия реагирования Zero One Wanwu

Ли Кайфу считает, что 2025 год станет годом сосуществования взрыва приложений и коммерческой ликвидации. Возможность для Zero One Wanwu заключается в изучении Product-Market Fit (PMF) больших моделей To B. Он отметил, что в некоторых нишевых областях большие модели могут помочь клиентам удвоить выручку, что является истинным PMF.

После корректировки стратегии Zero One Wanwu сосредоточится на:

Обучении более быстрых и дешевых моделей, таких как MoE (модель смешанных экспертов).
Использовании собственных преимуществ в AI-инфраструктуре и механизмах вывода для снижения затрат на обучение и вывод.
Совместном создании с отраслевыми компаниями, создании совместных предприятий для совместной разработки моделей и решений для конкретных отраслей.

Причины отказа от преследования AGI

Ли Кайфу признался, что Zero One Wanwu давно отказалась от преследования AGI (общего искусственного интеллекта). Он объяснил, что погоня за AGI требует огромных ресурсов, а высшим приоритетом Zero One Wanwu на данном этапе является укрепление собственных позиций и достижение коммерческой прибыльности.

Он вспомнил опыт Zero One Wanwu по выпуску модели Yi-Large в мае прошлого года и сказал, что тогда они осознали, что модель медленная и дорогая. Это побудило Zero One Wanwu принять решение: больше не тратить деньги на обучение сверхбольших моделей, а сосредоточиться на разработке коммерческих моделей, которые можно внедрить и на которых можно зарабатывать.

Сотрудничество с Alibaba

Создание совместной лаборатории с Alibaba Cloud является ключевым шагом в стратегической корректировке Zero One Wanwu. Ли Кайфу заявил, что эта модель сотрудничества позволит в полной мере использовать преимущества обеих сторон, ускорить совместное создание технологий, платформ и приложений, а также откроет новую парадигму сотрудничества "крупных компаний + небольших тигров" в Китае.

Хотя часть команды по предварительному обучению и AI-инфраструктуре присоединится к Alibaba, Zero One Wanwu сохранит небольшую команду по обучению и инфраструктуре для продолжения разработки моделей. Ли Кайфу подчеркнул, что Zero One Wanwu не прекратит предварительное обучение, но больше не будет зацикливаться на сверхбольших моделях.

Замедление закона масштабирования

Ли Кайфу отметил, что закон масштабирования замедляется. Это означает, что отдача от вложения большего количества вычислительных мощностей и данных уменьшается. Он привел пример, что добавление с одной карты до десяти может достичь 9,5 стоимости карты, но добавление со ста тысяч карт до одного миллиона может достичь только 300 000 стоимости карты.

Он также отметил, что ресурсы интернет-данных, подобно ископаемому топливу, постепенно истощаются. Это делает обучение сверхбольших моделей все более дорогим и менее прибыльным.

Роль сверхбольших моделей

Несмотря на замедление закона масштабирования, Ли Кайфу считает, что сверхбольшие модели по-прежнему играют важную роль, особенно в качестве обучающих моделей. Он отметил, что модель Opus от Anthropic используется для обучения более мелких моделей.

Сверхбольшие модели могут повысить возможности малых моделей следующими способами:

Разметка результатов для улучшения эффекта последующего обучения.
Генерация синтетических данных для обучения новых моделей.

Основной вопрос коммерциализации

Ли Кайфу считает, что в эпоху больших моделей все ускоряется, и вопрос коммерциализации встает быстрее. Он подчеркнул, что AI-компании должны ответить на ключевой вопрос: как преобразовать технологии в коммерческую ценность и добиться прибыльности.

Он предложил, что AI-компании должны:

Понимать, как работает бизнес.
Добиваться роста доходов.
Контролировать расходы.

Ли Кайфу также подчеркнул важность избегать вложения значительных средств в направления коммерциализации, которые не приносят отдачи, например, в приложения To C, которые требуют постоянных вливаний и убытков для поддержания позиций в отрасли, а также в тендерные проекты To B с низкой оплатой и не создающие основной ценности.

Путь коммерциализации Zero One Wanwu

Zero One Wanwu активно расширяет рынок To B и проводит эксперименты в таких областях, как игры, энергетика, автомобилестроение и финансы. Они будут совместно работать с отраслевыми компаниями, создавать совместные предприятия для совместной разработки моделей и решений для конкретных отраслей.

Ли Кайфу заявил, что фактический доход Zero One Wanwu в 2024 году превысил 100 миллионов юаней, и, по прогнозам, в 2025 году доход увеличится в несколько раз.

Будущее приложений AI-First

Ли Кайфу считает, что обязательно появятся прорывные приложения AI-first. Он отметил, что эти приложения должны иметь следующие основные характеристики:

Взаимодействие на естественном языке.
Общие возможности рассуждения и понимания.

Он также дал метод определения: если приложение не может существовать без большой модели, то это определенно приложение AI-first.

Предпринимательские идеи Ли Кайфу

Ли Кайфу сказал, что начал свой бизнес в области ИИ, чтобы воспользоваться возможностями эпохи ИИ и преобразовать свой опыт и возможности в ценность. Он считает, что в процессе предпринимательства неизбежно возникают проблемы, но хороший генеральный директор не должен легко сожалеть.

Он подытожил свои предпринимательские идеи:

Не инвестируйте слепо в невозможные цели.
Используйте возможности и принимайте решительные решения.
Имейте четкое представление о будущем и заранее вносите коррективы.

Перспективы на 2025 год

Ли Кайфу полон уверенности в 2025 году. Он прогнозирует:

Появится большое количество приложений To C.
Будет изучен PMF больших моделей To B, и появится большое количество моделей для конкретных отраслей.

Он также сказал, что Zero One Wanwu изучает приложения Agent (интеллектуальный агент) и будет совместно с партнерами разрабатывать отраслевые модели + Agent в вертикальных областях.