Published on

De Opbouw van Cohere: Een Diepgaande Duik in de AI Startup

Auteurs
  • avatar
    Naam
    Ajax
    Twitter

De Opkomst van Grote Taalmodellen

Het artikel begint met de erkenning van de dominantie van OpenAI en zijn ChatGPT, waarbij de intense concurrentie op het gebied van grote taalmodellen wordt benadrukt. Cohere heeft een niche veroverd door zich te richten op zakelijke klanten, met aanpasbare en veilige AI-oplossingen. Het bedrijf werd mede opgericht door Aidan Gomez, een co-auteur van het baanbrekende artikel "Attention is All You Need", samen met Ivan Zhang en Nick Frosst. Cohere heeft aanzienlijke financiering veiliggesteld, waaronder een Serie C-ronde van $270 miljoen, en wordt ondersteund door grote technologiebedrijven en investeerders.

De Ontstaan van een Idee

Aidan Gomez's vroege werk, met name zijn betrokkenheid bij het "Attention is All You Need" artikel tijdens zijn stage bij Google Brain, was een cruciaal moment. Hij werkte samen met Lukasz Kaiser aan een softwareplatform voor het trainen van grote neurale netwerken. Hij werkte ook samen met Noam Shazeer aan het onderzoeken van alternatieven voor RNN's. Deze samenwerking leidde tot de creatie van het Transformer model. Het Transformer model heeft het AI-veld gerevolutioneerd, wat leidde tot de ontwikkeling van modellen zoals BERT en GPT. Aidan werd getroffen door het potentieel van het Transformer model toen hij zag dat het een samenhangend verhaal genereerde uit een enkele woordinvoer.

Van Onderzoek naar Ondernemerschap

Ivan Zhang, een mede-alumnus van de Universiteit van Toronto, wordt beschreven als een praktische maker die het liefst leert door te doen. Aidan en Ivan richtten aanvankelijk FOR.ai op, een AI-onderzoeksgroep, voordat ze zich waagden aan een meer formele startup. Hun eerste idee was om een platform te creëren voor het comprimeren van AI-modellen, maar ze draaiden bij vanwege het gebrek aan marktvraag. De release van GPT-2 en het groeiende belang van modelgrootte leidde ertoe dat Cohere zich op grote taalmodellen ging richten. Het eerste product van Cohere was een tool voor het automatisch aanvullen van tekst, wat een ToC (business-to-consumer) model was. Ze realiseerden zich de uitdagingen van consumentenproducten en schakelden over op een ToB (business-to-business) model, met een API-platform voor zakelijke klanten. De missie van Cohere is om AI toegankelijk te maken voor alle bedrijven, waardoor belemmeringen voor adoptie worden weggenomen. Belangrijke kenmerken zijn onder andere aanpasbare modellen, multi-cloud en on-premise implementatieopties, en sterke gegevensprivacy.

Talent en Cultuur

Cohere heeft een unieke aanpak bij het aannemen van personeel, waarbij ze op zoek zijn naar mensen met een passie voor AI en de wens om een impact te maken, ongeacht hun achtergrond. Ze waarderen praktische ervaring en praktische toepassing boven puur academische prestaties. Cohere bevordert een cultuur van experimenteren en innovatie, met de nadruk op zowel onderzoek als engineering.

De Toekomst van AI

Aidan gelooft dat de AI-markt niet zal worden gemonopoliseerd en dat verschillende bedrijven hun eigen niches zullen vinden. Hij maakt zich ook zorgen over het potentieel van AI om te worden gebruikt voor het manipuleren van sociale media en het publieke debat. Ivan wijst op de uitdagingen van het evalueren van AI-modellen en het waarborgen van gegevensprivacy. Zowel Aidan als Ivan zien groot potentieel in embodied AI, die AI combineert met robotica en fysieke systemen. Aidan speculeert over de mogelijkheid dat AI leert buiten menselijke kennis en nieuwe kennis creëert.

Belangrijke Concepten Uitgelegd

  • Transformer Model: Een neurale netwerkarchitectuur die aandachtmechanismen gebruikt om sequentiële gegevens, zoals tekst, te verwerken.
  • RNN (Recurrent Neural Network): Een type neuraal netwerk dat sequentiële gegevens verwerkt door een verborgen toestand te behouden die informatie van eerdere inputs vastlegt.
  • ToC (Business-to-Consumer): Een bedrijfsmodel waarbij producten of diensten rechtstreeks aan individuele consumenten worden verkocht.
  • ToB (Business-to-Business): Een bedrijfsmodel waarbij producten of diensten aan andere bedrijven worden verkocht.
  • API (Application Programming Interface): Een reeks regels en specificaties die verschillende softwaretoepassingen in staat stellen om met elkaar te communiceren.
  • Embodied AI: De integratie van AI met fysieke systemen, zoals robots, om hen in staat te stellen met de echte wereld te interageren.
  • Multi-cloud: Het gebruik van meerdere cloud computing services van verschillende providers.
  • On-premise: De implementatie van software en infrastructuur op de eigen servers van een bedrijf.
  • Fine-tuning: Het proces van het aanpassen van een vooraf getraind AI-model aan een specifieke taak of dataset.
  • Word Embedding: Een techniek voor het representeren van woorden als numerieke vectoren, waarbij hun semantische betekenis wordt vastgelegd.

Cohere's opkomst als een belangrijke speler in de AI-industrie is een getuigenis van hun focus op enterprise-oplossingen, hun unieke benadering van talent en hun innovatieve geest. De onderneming blijft de grenzen van AI verleggen en de toekomst van technologie vormgeven. Cohere onderscheidt zich door het leveren van aanpasbare, veilige en efficiënte AI-modellen die zijn afgestemd op de specifieke behoeften van bedrijven. De verschuiving van een ToC naar een ToB-model weerspiegelt een strategische beslissing om de complexiteit van consumentenproducten te vermijden en zich te richten op de behoeften van zakelijke klanten. De nadruk op gegevensprivacy en de flexibiliteit van multi-cloud en on-premise implementatieopties maken Cohere een aantrekkelijke partner voor organisaties die AI willen integreren in hun bedrijfsactiviteiten. Het vermogen van Cohere om toptalent aan te trekken en een cultuur van innovatie te bevorderen, heeft bijgedragen aan hun succes en zal hen blijven positioneren als een leider in de AI-industrie.