Published on

Как беше изграден Cohere - Задълбочен поглед към AI стартъпа

Автори
  • avatar
    Име
    Ajax
    Twitter

Въведение

Тази статия изследва пътя на Cohere, стартъп в областта на изкуствения интелект, който успя да се открои в конкурентния пейзаж на големите езикови модели. Компанията се фокусира върху корпоративни решения и уникален подход към таланти и партньорства. В ерата на доминиране на OpenAI и неговия ChatGPT, Cohere намира своя ниша, предлагайки персонализирани и сигурни решения за изкуствен интелект за корпоративни клиенти. Това прави компанията значим играч в тази бързо развиваща се индустрия.

Предпоставки

В началото на статията се признава господството на OpenAI и неговия ChatGPT, което подчертава интензивната конкуренция в областта на големите езикови модели. Cohere обаче се отличава, като се фокусира върху корпоративни клиенти, предлагайки персонализирани и сигурни решения за изкуствен интелект. Ключовите играчи в компанията са съоснователите Ейдън Гомес, съавтор на основополагащата статия "Вниманието е всичко, от което се нуждаете", заедно с Иван Жанг и Ник Фрост. Компанията е осигурила значително финансиране, включително кръг от Серия C от 270 милиона долара, и е подкрепена от големи технологични компании и инвеститори.

Развитието на Cohere

Раждането на идеята

Ранната работа на Ейдън Гомес е ключов момент за развитието на компанията. Участието му в статията "Вниманието е всичко, от което се нуждаете" по време на стажа му в Google Brain е от решаващо значение. Той работи с Лукаш Кайзер върху софтуерна платформа за обучение на големи невронни мрежи. Също така, той си сътрудничи с Ноам Шазер в проучването на алтернативи на RNN. Това сътрудничество води до създаването на модела Transformer.

Въздействието на модела Transformer

Моделът Transformer революционизира областта на изкуствения интелект, което води до разработването на модели като BERT и GPT. Ейдън осъзнава потенциала на модела Transformer, когато го вижда да генерира последователна история от един единствен вход на дума. Това прозрение е основен двигател за създаването на Cohere.

От научни изследвания към предприемачество

Иван Жанг, колега на Ейдън от университета в Торонто, е описан като практичен създател, който предпочита да учи чрез практика. Преди да се впуснат в по-формален стартъп, Ейдън и Иван първоначално формират FOR.ai, изследователска група за изкуствен интелект. Първоначалната им бизнес идея е да създадат платформа за компресиране на AI модели, но те се ориентират към други решения поради липса на пазарно търсене.

Преходът към големи езикови модели

След пускането на GPT-2 и нарастващото значение на размера на модела, Cohere се фокусира върху големи езикови модели. Първият продукт на Cohere е инструмент за автоматично довършване на текст, който е ToC (бизнес към потребител) модел. Те осъзнават предизвикателствата на потребителските продукти и се преориентират към ToB (бизнес към бизнес) модел, предлагайки API платформа за корпоративни клиенти. Мисията на Cohere е да направи AI достъпен за всички бизнеси, премахвайки бариерите пред приемането му. Компанията предлага персонализирани модели, опции за внедряване в мулти-облачна и локална среда, както и силна защита на данните.

Таланти и култура

Уникален подход при наемане

Cohere търси хора със страст към изкуствения интелект и желание да окажат влияние, независимо от техния произход. Компанията поставя акцент върху практическите умения и практическото приложение пред чисто академичните постижения. В Cohere се насърчава култура на експериментиране и иновации, като се акцентира както върху научните изследвания, така и върху инженерството.

Бъдещето на AI

Перспективата на Ейдън за конкуренцията

Ейдън вярва, че пазарът на изкуствен интелект няма да бъде монополизиран и че различните компании ще намерят свои собствени ниши. Той изразява безпокойство относно потенциала на AI да се използва за манипулиране на социалните медии и обществения дискурс. Иван подчертава предизвикателствата при оценката на AI моделите и осигуряването на поверителност на данните.

Потенциалът на въплътения AI

Ейдън и Иван виждат голям потенциал във въплътения AI, който комбинира AI с роботика и физически системи. Ейдън спекулира за възможността AI да се учи отвъд човешкото познание и да създава ново знание.

Ключови концепции

  • Модел Transformer: Невронна мрежова архитектура, която използва механизми за внимание за обработка на последователни данни, като текст.
  • RNN (Рекурентна невронна мрежа): Тип невронна мрежа, която обработва последователни данни, като поддържа скрито състояние, което улавя информация от предишни входове.
  • ToC (Бизнес към потребител): Бизнес модел, при който продукти или услуги се продават директно на отделни потребители.
  • ToB (Бизнес към бизнес): Бизнес модел, при който продукти или услуги се продават на други бизнеси.
  • API (Интерфейс за програмиране на приложения): Набор от правила и спецификации, които позволяват на различни софтуерни приложения да комуникират помежду си.
  • Въплътен AI: Интеграцията на AI с физически системи, като роботи, за да им позволи да взаимодействат с реалния свят.
  • Мулти-облак: Използването на множество услуги за облачни изчисления от различни доставчици.
  • Локално внедряване: Разполагането на софтуер и инфраструктура на собствени сървъри на компанията.
  • Фина настройка: Процесът на адаптиране на предварително обучен AI модел към конкретна задача или набор от данни.
  • Вграждане на думи: Техника за представяне на думи като числени вектори, улавяйки тяхното семантично значение.

Това обстойно разглеждане на пътя на Cohere разкрива как компанията се е утвърдила като значим играч в областта на изкуствения интелект, като се фокусира върху корпоративни решения, уникален подход към таланти и силни партньорства. От научните изследвания до предприемачеството, Cohere продължава да се развива и да оказва влияние върху бъдещето на AI.