Published on

Ajuste Estratégico da Zero One Wanwu: Fim da Busca por Modelos Super Grandes

Autores
  • avatar
    Nome
    Ajax
    Twitter

A Mudança de Rota da Zero One Wanwu

O CEO da Zero One Wanwu, Kai-Fu Lee, detalhou em entrevista à LatePost as recentes mudanças estratégicas da empresa. O ponto central é que a Zero One Wanwu não irá mais se dedicar ao treinamento de modelos super grandes. Em vez disso, a empresa focará no desenvolvimento de modelos com parâmetros moderados, mais rápidos e econômicos, utilizando-os como base para construir aplicações comerciais. Essa mudança marca a primeira grande alteração de direção de uma unicórnio chinesa de modelos de linguagem, refletindo um ponto de inflexão na onda de modelos de linguagem dos últimos dois anos.

Lee enfatizou que a Zero One Wanwu não está buscando ser adquirida e continuará com o pré-treinamento. A empresa formou um "Laboratório Conjunto de Modelos de Linguagem da Indústria" com a Alibaba Cloud, onde a maior parte das equipes de treinamento e infraestrutura de IA da Zero One Wanwu se juntará, tornando-se funcionários da Alibaba. Essa colaboração visa usar os recursos de grandes empresas para treinar modelos maiores, a fim de melhorar a capacidade dos modelos menores da própria Zero One Wanwu.

Desafios das Startups Chinesas de Modelos de Linguagem

Lee resumiu os principais desafios enfrentados pelas startups chinesas de modelos de linguagem:

  • Restrições de Chips: As empresas chinesas enfrentam restrições na aquisição de chips, resultando em financiamento e avaliações muito menores do que seus concorrentes nos Estados Unidos.
  • Desaceleração da Scaling Law: A eficácia da Scaling Law (Lei da Escala) está diminuindo, passando da crença ao ceticismo em apenas um ano.
  • Concorrência com Grandes Empresas: Startups competem com grandes empresas em escala de modelos, tornando difícil o sucesso.
  • Dificuldades de Comercialização: Como transformar tecnologia em valor comercial e alcançar a lucratividade é a questão central para todas as empresas de modelos de linguagem.
  • Dilemas de Mercado: Existem gargalos difíceis de superar nos mercados To B, To C, doméstico e internacional.

Estratégia de Resposta da Zero One Wanwu

Lee acredita que 2025 será um ano de explosão de aplicações e eliminação comercial. A oportunidade da Zero One Wanwu reside na descoberta do Product-Market Fit (PMF) para modelos de linguagem To B. Ele aponta que, em alguns nichos, os modelos de linguagem podem ajudar os clientes a dobrar sua receita, o que representa um verdadeiro PMF.

Após o ajuste estratégico, a Zero One Wanwu se concentrará em:

  • Treinar modelos mais rápidos e baratos, como o MoE (Modelo de Sistema Híbrido de Especialistas).
  • Aproveitar suas vantagens em infraestrutura de IA e mecanismos de inferência para reduzir custos de treinamento e inferência.
  • Cocrear com empresas do setor, estabelecendo joint ventures para desenvolver modelos e soluções específicas para o setor.

Razões para Abandonar a Busca por AGI

Lee admitiu que a Zero One Wanwu abandonou a busca pela AGI (Inteligência Artificial Geral) há muito tempo. Ele explicou que perseguir a AGI requer grandes investimentos de recursos, e a prioridade máxima da Zero One Wanwu neste momento é consolidar sua força e alcançar a lucratividade comercial.

Ele relembrou a experiência do lançamento do modelo Yi-Large pela Zero One Wanwu em maio do ano passado e disse que percebeu naquela época que o modelo era lento e caro. Isso levou a Zero One Wanwu a tomar a decisão de não mais gastar dinheiro no treinamento de modelos super grandes, mas sim focar no desenvolvimento de modelos comerciais que possam ser implementados e gerar lucro.

Colaboração com a Alibaba

A criação do laboratório conjunto com a Alibaba Cloud é um passo crucial no ajuste estratégico da Zero One Wanwu. Lee afirmou que esse modelo de colaboração pode aproveitar totalmente as vantagens de ambas as partes, acelerar o compartilhamento e a construção conjunta em tecnologia, plataforma e aplicações, inaugurando um novo paradigma de colaboração "grande empresa + startup" na China.

Embora parte das equipes de pré-treinamento e infraestrutura de IA se junte à Alibaba, a Zero One Wanwu ainda manterá uma equipe menor de treinamento e infraestrutura para continuar o desenvolvimento de modelos. Lee enfatizou que a Zero One Wanwu não interromperá o pré-treinamento, mas não se apegará mais a modelos super grandes.

Desaceleração da Scaling Law

Lee apontou que a Scaling Law (Lei da Escala) está desacelerando. Isso significa que os retornos de investir mais poder computacional e dados estão diminuindo. Ele exemplificou que adicionar de um para dez cartões pode alcançar o valor de 9,5 cartões, mas adicionar de cem mil para um milhão de cartões pode alcançar apenas o valor de 300 mil cartões.

Ele também mencionou que os recursos de dados da internet estão se esgotando como combustíveis fósseis. Isso está tornando o custo do treinamento de modelos super grandes cada vez mais alto, com retornos cada vez menores.

Papel dos Modelos Super Grandes

Apesar da desaceleração da Scaling Law, Lee acredita que os modelos super grandes ainda desempenham um papel importante, especialmente como modelos de professores. Ele apontou que o modelo Opus da Anthropic é usado para treinar modelos menores.

Modelos super grandes podem melhorar a capacidade de modelos menores das seguintes maneiras:

  • Anotar resultados e melhorar o efeito do pós-treinamento.
  • Gerar dados sintéticos para treinar novos modelos.

O Desafio da Comercialização

Lee acredita que tudo está acelerando na era dos modelos de linguagem, e o desafio da comercialização chega mais rápido. Ele enfatizou que as empresas de IA devem responder à questão central: como transformar tecnologia em valor comercial e gerar lucro.

Ele propôs que as empresas de IA precisam:

  • Entender as operações comerciais.
  • Alcançar crescimento de receita.
  • Controlar custos.

Lee também enfatizou a importância de evitar investir em direções de comercialização com baixo retorno, como aplicações To C que precisam de injeção constante de capital e perdas para manter sua posição no setor, e projetos de licitação To B que não pagam bem e não criam valor central.

Caminho de Comercialização da Zero One Wanwu

A Zero One Wanwu está expandindo ativamente o mercado To B e está tentando entrar nos setores de jogos, energia, automóveis e finanças. Eles co-criarão com empresas do setor, estabelecendo joint ventures para desenvolver modelos e soluções específicas para o setor.

Lee afirmou que a receita real da Zero One Wanwu em 2024 já ultrapassou 100 milhões de yuans e espera que a receita dobre em 2025.

O Futuro das Aplicações AI-First

Lee acredita que aplicações AI-first disruptivas certamente surgirão. Ele apontou que essas aplicações precisam ter as seguintes características principais:

  • Interagir usando linguagem natural.
  • Ter capacidade de raciocínio e compreensão geral.

Ele também deu um método de julgamento: se uma aplicação não puder ser estabelecida sem um modelo de linguagem, então ela é definitivamente uma aplicação AI-first.

Reflexões de Kai-Fu Lee sobre Empreendedorismo

Lee disse que se lançou no empreendedorismo em IA para aproveitar as oportunidades da era da IA e transformar sua experiência e habilidades em valor. Ele acredita que desafios são inevitáveis no processo de empreender, mas um bom CEO não deve se arrepender facilmente.

Ele resumiu suas reflexões sobre empreendedorismo:

  • Não invista cegamente em metas impossíveis.
  • Aproveite as oportunidades e tome decisões com firmeza.
  • Tenha uma previsão clara do futuro e faça ajustes antecipadamente.

Perspectivas para 2025

Lee está cheio de confiança em 2025. Ele prevê:

  • Uma grande quantidade de aplicações To C surgirá.
  • O PMF dos modelos de linguagem To B será descoberto, e muitos modelos específicos para o setor também surgirão.

Ele também afirmou que a Zero One Wanwu está explorando aplicações de Agentes (inteligências artificiais) e desenvolverá modelos de setor + Agentes em áreas verticais com parceiros.