Published on

DeepSeek: เรื่องราวของบริษัทเทคโนโลยี AI จีนผู้มีอุดมคติ

ผู้เขียน
  • avatar
    ชื่อ
    Ajax
    Twitter

DeepSeek: เรื่องราวของบริษัทเทคโนโลยี AI จีนผู้มีอุดมคติ

DeepSeek บริษัทสตาร์ทอัพด้าน AI สัญชาติจีน กำลังสร้างความฮือฮาด้วยการมุ่งเน้นไปที่การวิจัยพื้นฐานและนวัตกรรมในด้านสถาปัตยกรรมโมเดล แทนที่จะเป็นการพัฒนาแอปพลิเคชันเพียงอย่างเดียว พวกเขากำลังท้าทายแนวคิดที่ว่าจีนเก่งเพียงแค่การสร้างสรรค์นวัตกรรมในระดับแอปพลิเคชันเท่านั้น โดยมีเป้าหมายที่จะเป็นผู้มีส่วนร่วมในการพัฒนาเทคโนโลยีระดับโลก แนวทางของ DeepSeek ขับเคลื่อนด้วยวิสัยทัศน์ระยะยาวในการบรรลุปัญญาประดิษฐ์ทั่วไป (AGI) โดยให้ความสำคัญกับการวิจัยมากกว่าการแสวงหาผลประโยชน์ทางการค้าในทันที

ที่มาและการเติบโตของ DeepSeek

DeepSeek ถือกำเนิดขึ้นจากบริษัทซื้อขายเชิงปริมาณ High-Flyer และได้รับความสนใจในตอนแรกจากโครงสร้างพื้นฐานชิป AI ขนาดใหญ่ของบริษัท เมื่อเร็วๆ นี้ บริษัทได้สร้างข่าวพาดหัวด้วยการเปิดตัว DeepSeek V2 ซึ่งเป็นโมเดลโอเพนซอร์สที่มีต้นทุนการอนุมานต่ำกว่าอย่างมาก ทำให้เกิดสงครามราคาในหมู่บริษัท AI จีน สถาปัตยกรรม MLA ที่เป็นนวัตกรรมใหม่ของ DeepSeek และโครงสร้าง DeepSeekMoESparse ได้นำไปสู่การลดการใช้หน่วยความจำและต้นทุนการคำนวณลงอย่างมาก

แนวทางที่เป็นเอกลักษณ์ของ DeepSeek

  • มุ่งเน้นการวิจัยพื้นฐาน: แตกต่างจากบริษัท AI จีนหลายแห่งที่ให้ความสำคัญกับการพัฒนาแอปพลิเคชัน DeepSeek มุ่งมั่นที่จะวิจัยและสร้างสรรค์นวัตกรรมในด้านสถาปัตยกรรมโมเดล
  • ปฏิเสธแนวทาง "ลอกเลียนแบบ": DeepSeek กำลังท้าทายความคิดที่ว่าจีนควรเพียงแค่ติดตามและประยุกต์ใช้เทคโนโลยีที่มีอยู่ แต่มีเป้าหมายที่จะมีส่วนร่วมในการสร้างสรรค์นวัตกรรมระดับโลก
  • วิสัยทัศน์ระยะยาว: เป้าหมายสูงสุดของ DeepSeek คือการบรรลุ AGI ซึ่งขับเคลื่อนให้พวกเขาให้ความสำคัญกับการวิจัยพื้นฐานและการพัฒนาในระยะยาว
  • พันธสัญญาโอเพนซอร์ส: DeepSeek ได้เลือกที่จะเปิดตัวโมเดลของตนเป็นโอเพนซอร์ส โดยให้ความสำคัญกับการเติบโตของระบบนิเวศ AI มากกว่าผลประโยชน์ทางการค้าในทันที
  • เน้นทีมและวัฒนธรรม: DeepSeek เชื่อว่าความได้เปรียบในการแข่งขันของตนอยู่ที่การเติบโตของทีม ความรู้ที่สั่งสม และวัฒนธรรมแห่งนวัตกรรม

นวัตกรรมที่สำคัญ

  • สถาปัตยกรรม MLA (Multi-head Latent Attention): สถาปัตยกรรมใหม่นี้ช่วยลดการใช้หน่วยความจำลงอย่างมากเมื่อเทียบกับสถาปัตยกรรม MHA แบบดั้งเดิม
  • โครงสร้าง DeepSeekMoESparse: โครงสร้างนี้ช่วยลดต้นทุนการคำนวณ ซึ่งมีส่วนช่วยในการลดต้นทุนการอนุมานโดยรวม
  • การสร้างข้อมูลและการสร้างแบบจำลองที่เหมือนมนุษย์: DeepSeek ยังมุ่งเน้นไปที่การปรับปรุงการสร้างข้อมูลและการทำให้โมเดลมีความเหมือนมนุษย์มากขึ้น

มุมมองของ DeepSeek เกี่ยวกับภูมิทัศน์ AI

  • ท้าทายสถานะเดิม: DeepSeek เชื่อว่าจีนจำเป็นต้องก้าวข้ามการเป็น "ผู้โดยสารฟรี" และกลายเป็นผู้มีส่วนร่วมในการสร้างสรรค์นวัตกรรมทางเทคโนโลยีระดับโลก
  • แก้ไขช่องว่าง: DeepSeek ตระหนักถึงช่องว่างระหว่างความสามารถด้าน AI ของจีนและตะวันตก โดยเฉพาะอย่างยิ่งในด้านโครงสร้างโมเดลและประสิทธิภาพการฝึกอบรม และกำลังทำงานอย่างแข็งขันเพื่อลดช่องว่างนั้น
  • เหนือกว่าการค้า: DeepSeek เชื่อว่านวัตกรรมไม่ได้ขับเคลื่อนด้วยผลประโยชน์ทางการค้าเพียงอย่างเดียว แต่ยังเกิดจากความอยากรู้อยากเห็นและความคิดสร้างสรรค์
  • ความสำคัญของโอเพนซอร์ส: DeepSeek มองว่าโอเพนซอร์สเป็นการกระทำทางวัฒนธรรมที่ส่งเสริมความร่วมมือและนวัตกรรมมากกว่ากลยุทธ์ทางการค้า
  • คุณค่าของความคิดริเริ่ม: DeepSeek เน้นความสำคัญของนวัตกรรมดั้งเดิมมากกว่าการเลียนแบบ โดยเน้นถึงประโยชน์ระยะยาวของการมีส่วนร่วมในชุมชนเทคโนโลยีระดับโลก

เหลียง เหวินเฟิง ผู้ก่อตั้ง DeepSeek

  • ความเชี่ยวชาญด้านเทคนิค: เหลียง เหวินเฟิง ได้รับการอธิบายว่าเป็นบุคคลที่หายากที่มีความสามารถด้านวิศวกรรมโครงสร้างพื้นฐานและการวิจัยโมเดลที่แข็งแกร่ง
  • แนวทางปฏิบัติจริง: เขามีส่วนร่วมอย่างแข็งขันในการวิจัย การเขียนโค้ด และการอภิปรายของทีม แทนที่จะทำหน้าที่เป็นผู้จัดการเพียงอย่างเดียว
  • วิสัยทัศน์ที่เต็มไปด้วยอุดมคติ: เหลียง เหวินเฟิง เป็นนักเทคโนโลยีที่มีอุดมคติ ซึ่งให้ความสำคัญกับข้อพิจารณาด้านจริยธรรมมากกว่าผลกำไร และเน้นความสำคัญของนวัตกรรมดั้งเดิม
  • มุ่งเน้นผลกระทบระยะยาว: เขามุ่งเน้นที่จะมีส่วนร่วมในการพัฒนา AI และประสิทธิภาพโดยรวมของสังคม

ทีมและวัฒนธรรมของ DeepSeek

  • การสรรหาบุคลากร: DeepSeek มุ่งเน้นการจ้างบุคคลที่มีความหลงใหลในการวิจัยและมีความอยากรู้อยากเห็นอย่างแรงกล้า โดยมักจะเลือกผู้สมัครที่มีภูมิหลังที่ไม่เหมือนใคร
  • ทีมที่จัดการตนเอง: DeepSeek ส่งเสริมโครงสร้างทีมที่จัดการตนเอง ซึ่งบุคคลได้รับการสนับสนุนให้ติดตามความคิดของตนเองและทำงานร่วมกับผู้อื่น
  • การจัดสรรทรัพยากรที่ยืดหยุ่น: สมาชิกในทีมมีอิสระในการจัดสรรทรัพยากร เช่น กำลังการคำนวณและบุคลากร ตามความจำเป็น
  • เน้นความหลงใหล: DeepSeek ให้ความสำคัญกับความหลงใหลในการวิจัยมากกว่าสิ่งจูงใจทางการเงิน โดยดึงดูดบุคคลที่ขับเคลื่อนด้วยความปรารถนาที่จะแก้ปัญหาที่ท้าทาย

แนวโน้มอนาคตของ DeepSeek

  • ไม่มีแผนสำหรับ Closed Source: DeepSeek มุ่งมั่นที่จะคงความเป็นโอเพนซอร์ส โดยเชื่อว่าระบบนิเวศเทคโนโลยีที่แข็งแกร่งมีความสำคัญมากกว่าผลประโยชน์ระยะสั้น
  • ไม่ต้องการเงินทุนทันที: DeepSeek ไม่ได้แสวงหาเงินทุนในปัจจุบัน เนื่องจากความท้าทายหลักของพวกเขาคือการเข้าถึงชิประดับไฮเอนด์
  • มุ่งเน้นการวิจัยพื้นฐาน: DeepSeek จะยังคงให้ความสำคัญกับการวิจัยพื้นฐานและนวัตกรรมมากกว่าการพัฒนาแอปพลิเคชัน
  • วิสัยทัศน์ระยะยาวสำหรับ AGI: DeepSeek มองโลกในแง่ดีเกี่ยวกับอนาคตของ AI และเชื่อว่า AGI จะสำเร็จได้ภายในช่วงชีวิตของพวกเขา
  • เน้นความเชี่ยวชาญเฉพาะด้าน: DeepSeek มองเห็นอนาคตที่บริษัทเฉพาะทางจะให้บริการโมเดลและบริการพื้นฐาน ทำให้ผู้อื่นสามารถสร้างต่อยอดจากโมเดลเหล่านั้นได้