- Published on
Perjalanan Cohere Membangun Startup AI: Analisis Mendalam
Latar Belakang dan Posisi Unik Cohere
Artikel ini membuka dengan mengakui dominasi OpenAI dan ChatGPT dalam ranah model bahasa besar. Persaingan di bidang ini sangat ketat, namun Cohere berhasil menciptakan ceruk tersendiri dengan berfokus pada klien enterprise. Mereka menawarkan solusi AI yang dapat disesuaikan dan aman.
Cohere didirikan oleh Aidan Gomez, salah satu penulis makalah penting "Attention is All You Need", bersama dengan Ivan Zhang dan Nick Frosst. Perusahaan ini telah mengamankan pendanaan signifikan, termasuk putaran Seri C sebesar 270 juta dolar AS, dan didukung oleh perusahaan teknologi besar dan investor.
Awal Mula Ide
Keterlibatan Aidan Gomez dalam makalah "Attention is All You Need" selama magangnya di Google Brain menjadi momen penting. Ia bekerja dengan Lukasz Kaiser pada platform perangkat lunak untuk melatih jaringan saraf besar. Kolaborasinya dengan Noam Shazeer dalam mengeksplorasi alternatif untuk RNN (Recurrent Neural Network) menghasilkan model Transformer.
Model Transformer merevolusi bidang AI, mengarah pada pengembangan model seperti BERT dan GPT. Aidan menyadari potensi model Transformer ketika melihatnya menghasilkan cerita yang koheren dari satu kata input.
Dari Riset Menuju Kewirausahaan
Ivan Zhang, lulusan Universitas Toronto, digambarkan sebagai pencipta yang lebih suka belajar dengan praktik langsung. Aidan dan Ivan awalnya membentuk FOR.ai, kelompok riset AI, sebelum terjun ke startup yang lebih formal. Ide bisnis awal mereka adalah membuat platform untuk mengompresi model AI, tetapi mereka beralih karena kurangnya permintaan pasar.
Rilis GPT-2 dan meningkatnya pentingnya ukuran model mendorong Cohere untuk berfokus pada model bahasa besar. Produk pertama Cohere adalah alat pelengkapan otomatis teks, yang merupakan model ToC (business-to-consumer). Mereka menyadari tantangan produk konsumen dan beralih ke model ToB (business-to-business), menawarkan platform API untuk klien enterprise.
Misi Cohere adalah membuat AI dapat diakses oleh semua bisnis, menghilangkan hambatan adopsi. Fitur utama mereka meliputi model yang dapat disesuaikan, opsi penerapan multi-cloud dan on-premise, serta privasi data yang kuat.
Talenta dan Budaya
Cohere memiliki pendekatan unik dalam perekrutan. Mereka mencari individu dengan semangat terhadap AI dan keinginan untuk memberikan dampak, terlepas dari latar belakang mereka. Mereka lebih menghargai pengalaman praktis dan aplikasi daripada pencapaian akademis semata.
Cohere juga memupuk budaya eksperimen dan inovasi, berfokus pada penelitian dan rekayasa.
Masa Depan AI
Aidan percaya bahwa pasar AI tidak akan dimonopoli dan perusahaan yang berbeda akan menemukan ceruk mereka sendiri. Ia juga mengungkapkan kekhawatiran tentang potensi penyalahgunaan AI untuk memanipulasi media sosial dan wacana publik. Ivan menyoroti tantangan dalam mengevaluasi model AI dan memastikan privasi data.
Mereka berdua melihat potensi besar dalam embodied AI, yang menggabungkan AI dengan robotika dan sistem fisik. Aidan berspekulasi tentang kemungkinan AI belajar di luar pengetahuan manusia dan menciptakan pengetahuan baru.
Konsep Kunci
- Model Transformer: Arsitektur jaringan saraf yang menggunakan mekanisme perhatian untuk memproses data berurutan, seperti teks.
- RNN (Recurrent Neural Network): Jenis jaringan saraf yang memproses data berurutan dengan mempertahankan keadaan tersembunyi yang menangkap informasi dari input sebelumnya.
- ToC (Business-to-Consumer): Model bisnis di mana produk atau layanan dijual langsung ke konsumen individu.
- ToB (Business-to-Business): Model bisnis di mana produk atau layanan dijual ke bisnis lain.
- API (Application Programming Interface): Seperangkat aturan dan spesifikasi yang memungkinkan aplikasi perangkat lunak yang berbeda untuk berkomunikasi satu sama lain.
- Embodied AI: Integrasi AI dengan sistem fisik, seperti robot, untuk memungkinkan mereka berinteraksi dengan dunia nyata.
- Multi-cloud: Penggunaan beberapa layanan komputasi awan dari penyedia yang berbeda.
- On-premise: Penerapan perangkat lunak dan infrastruktur pada server perusahaan sendiri.
- Fine-tuning: Proses mengadaptasi model AI pra-pelatihan ke tugas atau dataset tertentu.
- Word Embedding: Teknik untuk merepresentasikan kata sebagai vektor numerik, menangkap makna semantik mereka.
Cohere terus berinovasi dan mendorong batas-batas AI, dengan fokus pada penerapan praktis dan solusi yang relevan untuk bisnis. Perjalanan mereka adalah contoh bagaimana kombinasi riset mendalam, visi yang kuat, dan budaya yang unik dapat mengarah pada kesuksesan dalam lanskap AI yang kompetitif. Mereka tidak hanya membangun sebuah perusahaan, tetapi juga berkontribusi pada evolusi teknologi AI itu sendiri.