- Published on
DeepSeek: داستان یک آرمانگرای فناوری چینی
دیپسیک، یک استارتاپ چینی در زمینه هوش مصنوعی، با تمرکز بر تحقیقات بنیادی و نوآوری در معماری مدل، به جای توسعه صرف برنامههای کاربردی، موجی از تحولات را ایجاد کرده است. آنها این تصور را که چین فقط در نوآوریهای کاربردی خوب است به چالش میکشند و قصد دارند به پیشرفتهای فناوری جهانی کمک کنند. رویکرد دیپسیک مبتنی بر دیدگاه بلندمدت دستیابی به هوش مصنوعی عمومی (AGI) است و تحقیقات را بر تجاریسازی فوری اولویت میدهد.
پیشینه
دیپسیک از شرکت معاملات کمی High-Flyer ظهور کرد و در ابتدا به دلیل زیرساخت تراشه هوش مصنوعی در مقیاس بزرگ خود مورد توجه قرار گرفت. این شرکت اخیراً با انتشار DeepSeek V2، یک مدل متنباز با هزینههای استنتاج به مراتب کمتر، خبرساز شد و باعث جنگ قیمت بین شرکتهای هوش مصنوعی چینی شد. معماری نوآورانه MLA و ساختار DeepSeekMoESparse دیپسیک منجر به کاهش قابل توجهی در مصرف حافظه و هزینههای محاسباتی شده است.
رویکرد منحصر به فرد دیپسیک
- تمرکز بر تحقیقات بنیادی: برخلاف بسیاری از شرکتهای هوش مصنوعی چینی که توسعه برنامههای کاربردی را در اولویت قرار میدهند، دیپسیک به تحقیق و نوآوری در معماری مدل اختصاص داده شده است.
- رد رویکرد "تقلید": دیپسیک فعالانه این ایده را به چالش میکشد که چین فقط باید از فناوریهای موجود پیروی و آنها را اعمال کند، و در عوض قصد دارد به نوآوری جهانی کمک کند.
- دیدگاه بلندمدت: هدف نهایی دیپسیک دستیابی به AGI است که تمرکز آنها را بر تحقیقات بنیادی و توسعه بلندمدت سوق میدهد.
- تعهد به متنباز: دیپسیک تصمیم گرفته است مدلهای خود را به صورت متنباز منتشر کند و رشد اکوسیستم هوش مصنوعی را بر منافع تجاری فوری ترجیح میدهد.
- تاکید بر تیم و فرهنگ: دیپسیک معتقد است که مزیت رقابتی آن در رشد تیم، دانش انباشته شده و فرهنگ نوآورانه آن نهفته است.
نوآوریهای کلیدی
- معماری MLA (توجه نهفته چند سر): این معماری جدید در مقایسه با معماریهای سنتی MHA، به طور قابل توجهی مصرف حافظه را کاهش میدهد.
- ساختار DeepSeekMoESparse: این ساختار هزینههای محاسباتی را به حداقل میرساند و به کاهش کلی هزینههای استنتاج کمک میکند.
- ساخت داده و مدلسازی شبیه انسان: دیپسیک همچنین بر بهبود ساخت دادهها و ایجاد مدلهای شبیهتر به انسان تمرکز دارد.
دیدگاه دیپسیک در مورد چشمانداز هوش مصنوعی
- به چالش کشیدن وضعیت موجود: دیپسیک معتقد است که چین باید فراتر از "سوار رایگان" بودن حرکت کند و به یک مشارکتکننده در نوآوریهای فناوری جهانی تبدیل شود.
- پرداختن به شکاف: دیپسیک شکاف بین تواناییهای هوش مصنوعی چین و غرب، به ویژه در ساختار مدل و کارایی آموزش، را تشخیص میدهد و فعالانه برای پر کردن آن تلاش میکند.
- فراتر از تجاریسازی: دیپسیک معتقد است که نوآوری نه تنها ناشی از منافع تجاری، بلکه ناشی از کنجکاوی و خلاقیت است.
- اهمیت متنباز: دیپسیک متنباز را به عنوان یک اقدام فرهنگی میبیند که به جای یک استراتژی تجاری، همکاری و نوآوری را تقویت میکند.
- ارزش اصالت: دیپسیک بر اهمیت نوآوری اصیل بر تقلید تاکید میکند و مزایای بلندمدت مشارکت در جامعه فناوری جهانی را برجسته میکند.
بنیانگذار دیپسیک، لیانگ ونفنگ
- تخصص فنی: لیانگ ونفنگ به عنوان فردی نادر با تواناییهای قوی در مهندسی زیرساخت و تحقیقات مدل توصیف میشود.
- رویکرد عملی: او به جای اینکه فقط به عنوان یک مدیر عمل کند، فعالانه در تحقیقات، کدنویسی و بحثهای تیمی شرکت میکند.
- دیدگاه آرمانگرایانه: لیانگ ونفنگ یک آرمانگرای فناوری است که ملاحظات اخلاقی را بر سود ترجیح میدهد و بر اهمیت نوآوری اصیل تاکید میکند.
- تمرکز بر تاثیر بلندمدت: او بر مشارکت در پیشرفت هوش مصنوعی و کارایی کلی جامعه متمرکز است.
تیم و فرهنگ دیپسیک
- جذب استعداد: دیپسیک بر استخدام افرادی با اشتیاق به تحقیق و حس کنجکاوی قوی تمرکز دارد و اغلب داوطلبانی با پیشینههای منحصر به فرد را انتخاب میکند.
- تیمهای خودسازمانده: دیپسیک ساختار تیمی خودسازمانده را ترویج میکند که در آن افراد تشویق میشوند تا ایدههای خود را دنبال کرده و با دیگران همکاری کنند.
- تخصیص انعطافپذیر منابع: اعضای تیم این آزادی را دارند که منابعی مانند قدرت محاسباتی و پرسنل را در صورت نیاز تخصیص دهند.
- تاکید بر اشتیاق: دیپسیک اشتیاق به تحقیق را بر انگیزههای مالی ترجیح میدهد و افرادی را جذب میکند که انگیزه حل مسائل چالش برانگیز را دارند.
چشم انداز آینده دیپسیک
- عدم برنامه برای متنبسته: دیپسیک متعهد به متنباز ماندن است و معتقد است که یک اکوسیستم فناوری قوی مهمتر از سودهای کوتاهمدت است.
- عدم نیاز فوری به بودجه: دیپسیک در حال حاضر به دنبال بودجه نیست، زیرا چالش اصلی آنها دسترسی به تراشههای پیشرفته است.
- تمرکز بر تحقیقات بنیادی: دیپسیک به اولویت دادن به تحقیقات بنیادی و نوآوری، به جای توسعه برنامههای کاربردی، ادامه خواهد داد.
- دیدگاه بلندمدت برای AGI: دیپسیک نسبت به آینده هوش مصنوعی خوشبین است و معتقد است که AGI در طول عمر آنها به دست خواهد آمد.
- تاکید بر تخصص: دیپسیک آیندهای را پیشبینی میکند که در آن شرکتهای متخصص مدلها و خدمات بنیادی را ارائه میدهند و به دیگران اجازه میدهند بر اساس آنها بسازند.