- Published on
DeepSeek: เรื่องราวของบริษัทเทคโนโลยี AI จีนผู้มีอุดมคติ
DeepSeek: เรื่องราวของบริษัทเทคโนโลยี AI จีนผู้มีอุดมคติ
DeepSeek บริษัทสตาร์ทอัพด้าน AI สัญชาติจีน กำลังสร้างความฮือฮาด้วยการมุ่งเน้นไปที่การวิจัยพื้นฐานและนวัตกรรมในด้านสถาปัตยกรรมโมเดล แทนที่จะเป็นการพัฒนาแอปพลิเคชันเพียงอย่างเดียว พวกเขากำลังท้าทายแนวคิดที่ว่าจีนเก่งเพียงแค่การสร้างสรรค์นวัตกรรมในระดับแอปพลิเคชันเท่านั้น โดยมีเป้าหมายที่จะเป็นผู้มีส่วนร่วมในการพัฒนาเทคโนโลยีระดับโลก แนวทางของ DeepSeek ขับเคลื่อนด้วยวิสัยทัศน์ระยะยาวในการบรรลุปัญญาประดิษฐ์ทั่วไป (AGI) โดยให้ความสำคัญกับการวิจัยมากกว่าการแสวงหาผลประโยชน์ทางการค้าในทันที
ที่มาและการเติบโตของ DeepSeek
DeepSeek ถือกำเนิดขึ้นจากบริษัทซื้อขายเชิงปริมาณ High-Flyer และได้รับความสนใจในตอนแรกจากโครงสร้างพื้นฐานชิป AI ขนาดใหญ่ของบริษัท เมื่อเร็วๆ นี้ บริษัทได้สร้างข่าวพาดหัวด้วยการเปิดตัว DeepSeek V2 ซึ่งเป็นโมเดลโอเพนซอร์สที่มีต้นทุนการอนุมานต่ำกว่าอย่างมาก ทำให้เกิดสงครามราคาในหมู่บริษัท AI จีน สถาปัตยกรรม MLA ที่เป็นนวัตกรรมใหม่ของ DeepSeek และโครงสร้าง DeepSeekMoESparse ได้นำไปสู่การลดการใช้หน่วยความจำและต้นทุนการคำนวณลงอย่างมาก
แนวทางที่เป็นเอกลักษณ์ของ DeepSeek
- มุ่งเน้นการวิจัยพื้นฐาน: แตกต่างจากบริษัท AI จีนหลายแห่งที่ให้ความสำคัญกับการพัฒนาแอปพลิเคชัน DeepSeek มุ่งมั่นที่จะวิจัยและสร้างสรรค์นวัตกรรมในด้านสถาปัตยกรรมโมเดล
- ปฏิเสธแนวทาง "ลอกเลียนแบบ": DeepSeek กำลังท้าทายความคิดที่ว่าจีนควรเพียงแค่ติดตามและประยุกต์ใช้เทคโนโลยีที่มีอยู่ แต่มีเป้าหมายที่จะมีส่วนร่วมในการสร้างสรรค์นวัตกรรมระดับโลก
- วิสัยทัศน์ระยะยาว: เป้าหมายสูงสุดของ DeepSeek คือการบรรลุ AGI ซึ่งขับเคลื่อนให้พวกเขาให้ความสำคัญกับการวิจัยพื้นฐานและการพัฒนาในระยะยาว
- พันธสัญญาโอเพนซอร์ส: DeepSeek ได้เลือกที่จะเปิดตัวโมเดลของตนเป็นโอเพนซอร์ส โดยให้ความสำคัญกับการเติบโตของระบบนิเวศ AI มากกว่าผลประโยชน์ทางการค้าในทันที
- เน้นทีมและวัฒนธรรม: DeepSeek เชื่อว่าความได้เปรียบในการแข่งขันของตนอยู่ที่การเติบโตของทีม ความรู้ที่สั่งสม และวัฒนธรรมแห่งนวัตกรรม
นวัตกรรมที่สำคัญ
- สถาปัตยกรรม MLA (Multi-head Latent Attention): สถาปัตยกรรมใหม่นี้ช่วยลดการใช้หน่วยความจำลงอย่างมากเมื่อเทียบกับสถาปัตยกรรม MHA แบบดั้งเดิม
- โครงสร้าง DeepSeekMoESparse: โครงสร้างนี้ช่วยลดต้นทุนการคำนวณ ซึ่งมีส่วนช่วยในการลดต้นทุนการอนุมานโดยรวม
- การสร้างข้อมูลและการสร้างแบบจำลองที่เหมือนมนุษย์: DeepSeek ยังมุ่งเน้นไปที่การปรับปรุงการสร้างข้อมูลและการทำให้โมเดลมีความเหมือนมนุษย์มากขึ้น
มุมมองของ DeepSeek เกี่ยวกับภูมิทัศน์ AI
- ท้าทายสถานะเดิม: DeepSeek เชื่อว่าจีนจำเป็นต้องก้าวข้ามการเป็น "ผู้โดยสารฟรี" และกลายเป็นผู้มีส่วนร่วมในการสร้างสรรค์นวัตกรรมทางเทคโนโลยีระดับโลก
- แก้ไขช่องว่าง: DeepSeek ตระหนักถึงช่องว่างระหว่างความสามารถด้าน AI ของจีนและตะวันตก โดยเฉพาะอย่างยิ่งในด้านโครงสร้างโมเดลและประสิทธิภาพการฝึกอบรม และกำลังทำงานอย่างแข็งขันเพื่อลดช่องว่างนั้น
- เหนือกว่าการค้า: DeepSeek เชื่อว่านวัตกรรมไม่ได้ขับเคลื่อนด้วยผลประโยชน์ทางการค้าเพียงอย่างเดียว แต่ยังเกิดจากความอยากรู้อยากเห็นและความคิดสร้างสรรค์
- ความสำคัญของโอเพนซอร์ส: DeepSeek มองว่าโอเพนซอร์สเป็นการกระทำทางวัฒนธรรมที่ส่งเสริมความร่วมมือและนวัตกรรมมากกว่ากลยุทธ์ทางการค้า
- คุณค่าของความคิดริเริ่ม: DeepSeek เน้นความสำคัญของนวัตกรรมดั้งเดิมมากกว่าการเลียนแบบ โดยเน้นถึงประโยชน์ระยะยาวของการมีส่วนร่วมในชุมชนเทคโนโลยีระดับโลก
เหลียง เหวินเฟิง ผู้ก่อตั้ง DeepSeek
- ความเชี่ยวชาญด้านเทคนิค: เหลียง เหวินเฟิง ได้รับการอธิบายว่าเป็นบุคคลที่หายากที่มีความสามารถด้านวิศวกรรมโครงสร้างพื้นฐานและการวิจัยโมเดลที่แข็งแกร่ง
- แนวทางปฏิบัติจริง: เขามีส่วนร่วมอย่างแข็งขันในการวิจัย การเขียนโค้ด และการอภิปรายของทีม แทนที่จะทำหน้าที่เป็นผู้จัดการเพียงอย่างเดียว
- วิสัยทัศน์ที่เต็มไปด้วยอุดมคติ: เหลียง เหวินเฟิง เป็นนักเทคโนโลยีที่มีอุดมคติ ซึ่งให้ความสำคัญกับข้อพิจารณาด้านจริยธรรมมากกว่าผลกำไร และเน้นความสำคัญของนวัตกรรมดั้งเดิม
- มุ่งเน้นผลกระทบระยะยาว: เขามุ่งเน้นที่จะมีส่วนร่วมในการพัฒนา AI และประสิทธิภาพโดยรวมของสังคม
ทีมและวัฒนธรรมของ DeepSeek
- การสรรหาบุคลากร: DeepSeek มุ่งเน้นการจ้างบุคคลที่มีความหลงใหลในการวิจัยและมีความอยากรู้อยากเห็นอย่างแรงกล้า โดยมักจะเลือกผู้สมัครที่มีภูมิหลังที่ไม่เหมือนใคร
- ทีมที่จัดการตนเอง: DeepSeek ส่งเสริมโครงสร้างทีมที่จัดการตนเอง ซึ่งบุคคลได้รับการสนับสนุนให้ติดตามความคิดของตนเองและทำงานร่วมกับผู้อื่น
- การจัดสรรทรัพยากรที่ยืดหยุ่น: สมาชิกในทีมมีอิสระในการจัดสรรทรัพยากร เช่น กำลังการคำนวณและบุคลากร ตามความจำเป็น
- เน้นความหลงใหล: DeepSeek ให้ความสำคัญกับความหลงใหลในการวิจัยมากกว่าสิ่งจูงใจทางการเงิน โดยดึงดูดบุคคลที่ขับเคลื่อนด้วยความปรารถนาที่จะแก้ปัญหาที่ท้าทาย
แนวโน้มอนาคตของ DeepSeek
- ไม่มีแผนสำหรับ Closed Source: DeepSeek มุ่งมั่นที่จะคงความเป็นโอเพนซอร์ส โดยเชื่อว่าระบบนิเวศเทคโนโลยีที่แข็งแกร่งมีความสำคัญมากกว่าผลประโยชน์ระยะสั้น
- ไม่ต้องการเงินทุนทันที: DeepSeek ไม่ได้แสวงหาเงินทุนในปัจจุบัน เนื่องจากความท้าทายหลักของพวกเขาคือการเข้าถึงชิประดับไฮเอนด์
- มุ่งเน้นการวิจัยพื้นฐาน: DeepSeek จะยังคงให้ความสำคัญกับการวิจัยพื้นฐานและนวัตกรรมมากกว่าการพัฒนาแอปพลิเคชัน
- วิสัยทัศน์ระยะยาวสำหรับ AGI: DeepSeek มองโลกในแง่ดีเกี่ยวกับอนาคตของ AI และเชื่อว่า AGI จะสำเร็จได้ภายในช่วงชีวิตของพวกเขา
- เน้นความเชี่ยวชาญเฉพาะด้าน: DeepSeek มองเห็นอนาคตที่บริษัทเฉพาะทางจะให้บริการโมเดลและบริการพื้นฐาน ทำให้ผู้อื่นสามารถสร้างต่อยอดจากโมเดลเหล่านั้นได้