Published on

การก่อตั้ง Cohere เจาะลึกสตาร์ทอัพ AI

ผู้เขียน
  • avatar
    ชื่อ
    Ajax
    Twitter

การเติบโตของโมเดลภาษาขนาดใหญ่

บทความเริ่มต้นด้วยการยอมรับการครอบงำของ OpenAI และ ChatGPT ซึ่งแสดงให้เห็นถึงการแข่งขันที่รุนแรงในด้านโมเดลภาษาขนาดใหญ่ Cohere ได้สร้างความแตกต่างด้วยการมุ่งเน้นไปที่ลูกค้าองค์กร นำเสนอโซลูชัน AI ที่ปรับแต่งได้และมีความปลอดภัยสูง บริษัทก่อตั้งโดย Aidan Gomez ผู้ร่วมเขียนบทความสำคัญ "Attention is All You Need" ร่วมกับ Ivan Zhang และ Nick Frosst Cohere ได้รับเงินทุนจำนวนมาก รวมถึงรอบ Series C มูลค่า 270 ล้านดอลลาร์ โดยได้รับการสนับสนุนจากบริษัทเทคโนโลยีและนักลงทุนรายใหญ่

จุดเริ่มต้นของแนวคิด

การมีส่วนร่วมของ Aidan Gomez ในบทความ "Attention is All You Need" ระหว่างการฝึกงานที่ Google Brain เป็นช่วงเวลาสำคัญ เขาทำงานร่วมกับ Lukasz Kaiser ในแพลตฟอร์มซอฟต์แวร์สำหรับการฝึกอบรมเครือข่ายประสาทขนาดใหญ่ และร่วมมือกับ Noam Shazeer ในการสำรวจทางเลือกอื่นนอกเหนือจาก RNN การทำงานร่วมกันนำไปสู่การสร้างโมเดล Transformer ซึ่งปฏิวัติวงการ AI นำไปสู่การพัฒนาโมเดลเช่น BERT และ GPT Aidan ตระหนักถึงศักยภาพของโมเดล Transformer เมื่อเห็นมันสร้างเรื่องราวที่เชื่อมโยงกันจากการป้อนข้อมูลเพียงคำเดียว

จากงานวิจัยสู่การเป็นผู้ประกอบการ

Ivan Zhang ผู้สำเร็จการศึกษาจากมหาวิทยาลัยโตรอนโตเช่นกัน ถูกอธิบายว่าเป็นผู้สร้างที่ลงมือทำจริงและชอบเรียนรู้ด้วยการลงมือปฏิบัติ Aidan และ Ivan เริ่มก่อตั้ง FOR.ai ซึ่งเป็นกลุ่มวิจัย AI ก่อนที่จะเข้าสู่สตาร์ทอัพอย่างเป็นทางการ แนวคิดเริ่มต้นของพวกเขาคือการสร้างแพลตฟอร์มสำหรับการบีบอัดโมเดล AI แต่พวกเขากลับเปลี่ยนไปเนื่องจากขาดความต้องการของตลาด การเปิดตัว GPT-2 และความสำคัญที่เพิ่มขึ้นของขนาดโมเดล ทำให้ Cohere มุ่งเน้นไปที่โมเดลภาษาขนาดใหญ่ ผลิตภัณฑ์แรกของ Cohere คือเครื่องมือเติมข้อความอัตโนมัติ ซึ่งเป็นโมเดล ToC (ธุรกิจกับผู้บริโภค) พวกเขาตระหนักถึงความท้าทายของผลิตภัณฑ์สำหรับผู้บริโภคและเปลี่ยนไปใช้โมเดล ToB (ธุรกิจกับธุรกิจ) โดยนำเสนอแพลตฟอร์ม API สำหรับลูกค้าองค์กร

ภารกิจของ Cohere คือการทำให้ AI เข้าถึงได้สำหรับทุกธุรกิจ ขจัดอุปสรรคในการนำไปใช้ คุณสมบัติหลักของ Cohere ได้แก่ โมเดลที่ปรับแต่งได้ ตัวเลือกการปรับใช้แบบ Multi-cloud และ On-premise และการรักษาความเป็นส่วนตัวของข้อมูลที่แข็งแกร่ง

บุคลากรและวัฒนธรรมองค์กร

Cohere ค้นหาบุคคลที่มีความหลงใหลใน AI และต้องการสร้างผลกระทบ โดยไม่คำนึงถึงภูมิหลังของพวกเขา พวกเขาให้ความสำคัญกับประสบการณ์ตรงและการประยุกต์ใช้จริงมากกว่าความสำเร็จทางวิชาการเพียงอย่างเดียว Cohere ส่งเสริมวัฒนธรรมการทดลองและนวัตกรรม โดยมุ่งเน้นทั้งด้านการวิจัยและวิศวกรรม

อนาคตของ AI

Aidan เชื่อว่าตลาด AI จะไม่ถูกผูกขาด และบริษัทต่างๆ จะพบช่องทางของตนเอง Aidan แสดงความกังวลเกี่ยวกับศักยภาพของ AI ที่จะถูกใช้เพื่อบิดเบือนโซเชียลมีเดียและการสนทนาสาธารณะ Ivan เน้นถึงความท้าทายในการประเมินโมเดล AI และการรับประกันความเป็นส่วนตัวของข้อมูล ทั้ง Aidan และ Ivan เห็นศักยภาพที่ยอดเยี่ยมใน Embodied AI ซึ่งรวม AI เข้ากับหุ่นยนต์และระบบกายภาพ Aidan คาดการณ์ถึงความเป็นไปได้ที่ AI จะเรียนรู้เกินกว่าความรู้ของมนุษย์และสร้างความรู้ใหม่

แนวคิดหลักที่อธิบาย

  • โมเดล Transformer: สถาปัตยกรรมเครือข่ายประสาทที่ใช้กลไกการใส่ใจเพื่อประมวลผลข้อมูลตามลำดับ เช่น ข้อความ
  • RNN (Recurrent Neural Network): เครือข่ายประสาทประเภทหนึ่งที่ประมวลผลข้อมูลตามลำดับโดยการรักษาสถานะที่ซ่อนอยู่ซึ่งรวบรวมข้อมูลจากการป้อนข้อมูลก่อนหน้า
  • ToC (ธุรกิจกับผู้บริโภค): รูปแบบธุรกิจที่ผลิตภัณฑ์หรือบริการขายโดยตรงให้กับผู้บริโภคแต่ละราย
  • ToB (ธุรกิจกับธุรกิจ): รูปแบบธุรกิจที่ผลิตภัณฑ์หรือบริการขายให้กับธุรกิจอื่นๆ
  • API (Application Programming Interface): ชุดของกฎและข้อกำหนดที่อนุญาตให้แอปพลิเคชันซอฟต์แวร์ต่างๆ สื่อสารกันได้
  • Embodied AI: การรวม AI เข้ากับระบบกายภาพ เช่น หุ่นยนต์ เพื่อให้สามารถโต้ตอบกับโลกแห่งความเป็นจริงได้
  • Multi-cloud: การใช้บริการคลาวด์คอมพิวติ้งหลายบริการจากผู้ให้บริการที่แตกต่างกัน
  • On-premise: การปรับใช้ซอฟต์แวร์และโครงสร้างพื้นฐานบนเซิร์ฟเวอร์ของบริษัทเอง
  • Fine-tuning: กระบวนการปรับโมเดล AI ที่ฝึกอบรมไว้ล่วงหน้าให้เข้ากับงานหรือชุดข้อมูลเฉพาะ
  • Word Embedding: เทคนิคสำหรับการแสดงคำเป็นเวกเตอร์ตัวเลข จับความหมายเชิงความหมาย