- Published on
بررسی عمیق چگونگی شکل گیری کوهر یک استارتاپ هوش مصنوعی
ظهور مدل های زبانی بزرگ
مقاله با اذعان به سلطه OpenAI و ChatGPT آن آغاز می شود و رقابت شدید در زمینه مدل های زبانی بزرگ را برجسته می کند. در این میان، کوهر با تمرکز بر مشتریان سازمانی، ارائه راه حل های هوش مصنوعی قابل تنظیم و ایمن، جایگاه ویژه ای برای خود ایجاد کرده است. این شرکت توسط آیدان گومز، یکی از نویسندگان مقاله پیشگام "توجه همه چیز است" به همراه ایوان ژانگ و نیک فراست تاسیس شد. کوهر بودجه قابل توجهی از جمله دور سری C 270 میلیون دلاری را به دست آورده است و توسط شرکت های بزرگ فناوری و سرمایه گذاران پشتیبانی می شود.
پیدایش یک ایده
در اوایل کار آیدان گومز، مشارکت او در مقاله "توجه همه چیز است" در طول دوره کارآموزی اش در گوگل برین، نقطه عطفی بود. او با لوکاس کایزر روی یک پلتفرم نرم افزاری برای آموزش شبکه های عصبی بزرگ کار کرد. او با نوام شازیر در زمینه بررسی جایگزین هایی برای RNN ها همکاری کرد. این همکاری منجر به ایجاد مدل ترانسفورمر شد. مدل ترانسفورمر زمینه هوش مصنوعی را متحول کرد و منجر به توسعه مدل هایی مانند BERT و GPT شد. آیدان زمانی که دید مدل ترانسفورمر یک داستان منسجم را از یک ورودی تک کلمه ای تولید می کند، تحت تأثیر پتانسیل آن قرار گرفت.
از تحقیق تا کارآفرینی
ایوان ژانگ، یکی دیگر از فارغ التحصیلان دانشگاه تورنتو، به عنوان یک سازنده عملی توصیف می شود که ترجیح می دهد با انجام کار یاد بگیرد. آیدان و ایوان در ابتدا FOR.ai، یک گروه تحقیقاتی هوش مصنوعی را تشکیل دادند و سپس وارد یک استارتاپ رسمی تر شدند. ایده اولیه آنها ایجاد یک پلتفرم برای فشرده سازی مدل های هوش مصنوعی بود، اما به دلیل عدم تقاضای بازار، تغییر مسیر دادند. انتشار GPT-2 و اهمیت روزافزون اندازه مدل، کوهر را بر آن داشت تا بر مدل های زبانی بزرگ تمرکز کند. اولین محصول کوهر یک ابزار تکمیل خودکار متن بود که یک مدل ToC (تجارت به مصرف کننده) بود. آنها چالش های محصولات مصرفی را درک کردند و به یک مدل ToB (تجارت به تجارت) تغییر مسیر دادند و یک پلتفرم API برای مشتریان سازمانی ارائه دادند. ماموریت کوهر این است که هوش مصنوعی را برای همه کسب و کارها در دسترس قرار دهد و موانع پذیرش را از بین ببرد. کوهر مدل های قابل تنظیم، گزینه های استقرار چند ابری و در محل و حفظ حریم خصوصی قوی داده ها را ارائه می دهد.
استعداد و فرهنگ
کوهر به دنبال افرادی با اشتیاق به هوش مصنوعی و تمایل به ایجاد تأثیر، صرف نظر از پیشینه آنها است. آنها برای تجربه عملی و کاربرد عملی نسبت به دستاوردهای صرفاً دانشگاهی ارزش قائل هستند. کوهر فرهنگ آزمایش و نوآوری را ترویج می کند و بر تحقیق و مهندسی تمرکز دارد.
آینده هوش مصنوعی
آیدان معتقد است که بازار هوش مصنوعی انحصاری نخواهد بود و شرکت های مختلف جایگاه های خاص خود را پیدا خواهند کرد. آیدان در مورد پتانسیل استفاده از هوش مصنوعی برای دستکاری رسانه های اجتماعی و گفتمان عمومی ابراز نگرانی می کند. ایوان چالش های ارزیابی مدل های هوش مصنوعی و اطمینان از حفظ حریم خصوصی داده ها را برجسته می کند. هر دو آیدان و ایوان پتانسیل زیادی در هوش مصنوعی تجسم یافته می بینند که هوش مصنوعی را با رباتیک و سیستم های فیزیکی ترکیب می کند. آیدان در مورد احتمال یادگیری هوش مصنوعی فراتر از دانش انسانی و ایجاد دانش جدید گمانه زنی می کند.
مفاهیم کلیدی
- مدل ترانسفورمر: معماری شبکه عصبی که از مکانیزم های توجه برای پردازش داده های ترتیبی مانند متن استفاده می کند.
- RNN (شبکه عصبی بازگشتی): نوعی شبکه عصبی که داده های ترتیبی را با حفظ یک حالت پنهان که اطلاعات ورودی های قبلی را ضبط می کند، پردازش می کند.
- ToC (تجارت به مصرف کننده): یک مدل کسب و کار که در آن محصولات یا خدمات مستقیماً به مصرف کنندگان فردی فروخته می شود.
- ToB (تجارت به تجارت): یک مدل کسب و کار که در آن محصولات یا خدمات به سایر مشاغل فروخته می شود.
- API (رابط برنامه نویسی کاربردی): مجموعه ای از قوانین و مشخصات که به برنامه های نرم افزاری مختلف اجازه می دهد با یکدیگر ارتباط برقرار کنند.
- هوش مصنوعی تجسم یافته: ادغام هوش مصنوعی با سیستم های فیزیکی مانند ربات ها برای فعال کردن آنها برای تعامل با دنیای واقعی.
- چند ابری: استفاده از چندین سرویس رایانش ابری از ارائه دهندگان مختلف.
- در محل: استقرار نرم افزار و زیرساخت ها در سرورهای خود شرکت.
- تنظیم دقیق: فرآیند تطبیق یک مدل هوش مصنوعی از پیش آموزش دیده با یک کار یا مجموعه داده خاص.
- تعبیه کلمه: تکنیکی برای نمایش کلمات به عنوان بردارهای عددی، که معنای معنایی آنها را به دست می آورد.