Published on

ویو فارمز اے آئی: جذباتی ذہانت کے ساتھ آڈیو ماڈل کا آغاز

مصنفین
  • avatar
    نام
    Ajax
    Twitter

ویو فارمز اے آئی: جذباتی عمومی ذہانت میں پیش قدمی

مصنوعی ذہانت کا منظر نامہ مسلسل ترقی پذیر ہے، جہاں نئی اختراعات اور کامیابیاں تیزی سے سامنے آ رہی ہیں۔ ترقی کے سب سے دلچسپ شعبوں میں سے ایک آڈیو اے آئی کے دائرے میں ہے، جہاں کمپنیاں تقریر کی شناخت، قدرتی زبان کی پروسیسنگ اور جذباتی سمجھ کے ساتھ ممکنہ حدود کو آگے بڑھا رہی ہیں۔ ایک حالیہ پیش رفت جس نے نمایاں توجہ حاصل کی ہے وہ ہے ویو فارمز اے آئی کا آغاز، جو کہ الیکسس کونیو کی جانب سے قائم کردہ ایک اسٹارٹ اپ ہے، جو کہ اوپن اے آئی میں جدید وائس موڈ کے سابق سربراہ تھے، جو کہ چیٹ جی پی ٹی کے پیچھے کمپنی ہے۔ ویو فارمز اے آئی جدید آڈیو لارج لینگویج ماڈلز (ایل ایل ایمز) تیار کرنے پر مرکوز ہے، جس کا مشن اے آئی کو زیادہ ہمدرد اور جذباتی طور پر ذہین بنانا ہے۔ اس منصوبے نے پہلے ہی نمایاں وینچر کیپیٹل فرم اے 16 زیڈ سے 40 ملین ڈالر کی ابتدائی فنڈنگ حاصل کر لی ہے، جس سے کمپنی کی مالیت کئی سو ملین ڈالر ہو گئی ہے۔

ویو فارمز اے آئی صرف ایک اور ٹیک اسٹارٹ اپ نہیں ہے؛ یہ ایک جرات مندانہ وژن والی کمپنی ہے۔ اپنے بنیادی طور پر، ویو فارمز آڈیو ایل ایل ایمز بنانے کے لیے وقف ہے جو آڈیو کو براہ راست پروسیس کر سکتے ہیں، بجائے اس کے کہ تقریر کو متن میں تبدیل کرنے اور پھر واپس تقریر میں تبدیل کرنے کے روایتی طریقہ پر انحصار کریں۔ یہ اینڈ ٹو اینڈ نقطہ نظر زیادہ حقیقی وقت، انسانی جیسی اور جذباتی طور پر ذہین تعاملات کی اجازت دیتا ہے۔ کمپنی کا حتمی مقصد جذباتی عمومی ذہانت (ای جی آئی) تیار کرنا ہے، جو کہ ایک ایسی اے آئی ہے جو ہمدردی کے ساتھ انسانی جذبات کو سمجھ اور ان کا جواب دے سکتی ہے۔

یہ پرجوش مقصد اس یقین سے کارفرما ہے کہ اے آئی کا مستقبل نہ صرف معلومات پر کارروائی کرنے کی صلاحیت میں ہے، بلکہ انسانی جذبات کو سمجھنے اور ان کا جواب دینے کی صلاحیت میں بھی ہے۔ ویو فارمز کے بانی الیکسس کونیو جذباتی ذہانت کو مصنوعی عمومی ذہانت (اے جی آئی) کے حصول کے لیے ایک اہم جزو کے طور پر دیکھتے ہیں۔ وہ اس بات پر زور دیتے ہیں کہ اے آئی کو نہ صرف فعال ہونا چاہیے، بلکہ ہمدرد بھی ہونا چاہیے، جو انسانوں کے ساتھ جذباتی سطح پر جڑنے کی صلاحیت رکھتا ہو۔ یہ نقطہ نظر ویو فارمز کو بہت سی دیگر اے آئی کمپنیوں سے الگ کرتا ہے جو بنیادی طور پر تکنیکی صلاحیتوں پر توجہ مرکوز کرتی ہیں۔

ویو فارمز کے پیچھے ٹیکنالوجی

ویو فارمز کے پیچھے ٹیکنالوجی وہ جگہ ہے جہاں جدت واقعی موجود ہے۔ تقریر کو متن میں تبدیل کرنے اور پھر ٹیکسٹ ٹو اسپیچ ماڈلز استعمال کرنے کے روایتی نقطہ نظر کے برعکس، ویو فارمز کے آڈیو ایل ایل ایمز کو براہ راست آڈیو پروسیس کرنے کے لیے ڈیزائن کیا گیا ہے۔ اس کا مطلب ہے کہ اے آئی انسانی تقریر کی باریکیوں کا تجزیہ کر سکتی ہے، جیسے کہ لہجہ، توقف اور جذباتی موڑ، حقیقی وقت میں۔ ٹیکسٹ ٹرانسلیشن کے مرحلے کو نظر انداز کرتے ہوئے، ویو فارمز کا مقصد زیادہ قدرتی اور ذمہ دارانہ تعاملات پیدا کرنا ہے۔ یہ نقطہ نظر اس بات سے ایک اہم انحراف ہے کہ زیادہ تر موجودہ وائس ماڈلز کیسے کام کرتے ہیں۔ روایتی طریقہ کار میں کئی مراحل شامل ہیں، جن میں سے ہر ایک میں تاخیر اور معلومات کے ضائع ہونے کا امکان ہے۔ آڈیو کو براہ راست پروسیس کرکے، ویو فارمز کے ماڈلز تاخیر کو کم کر سکتے ہیں اور جذباتی اشارے حاصل کر سکتے ہیں جو ترجمے کے عمل میں ضائع ہو سکتے ہیں۔ یہ اے آئی بنانے کے لیے بہت ضروری ہے جو واقعی انسانی جذبات کو سمجھ اور ان کا جواب دے سکے۔

بانی ٹیم: مہارت کا سنگم

ویو فارمز کے پیچھے ٹیم اتنی ہی متاثر کن ہے جتنی کہ وہ ٹیکنالوجی تیار کر رہے ہیں۔ الیکسس کونیو، سی ای او اور بانی، آڈیو اور ٹیکسٹ ایل ایل ایمز کے ایک سرکردہ ماہر ہیں۔ انہوں نے اوپن اے آئی میں جی پی ٹی-4 او کے جدید وائس موڈ کی ترقی میں اہم کردار ادا کیا۔ اوپن اے آئی میں اپنے وقت سے پہلے، کونیو گوگل اور میٹا میں ایک ریسرچ سائنسدان تھے، جہاں انہوں نے ٹیکسٹ انڈرسٹینڈنگ اور اسپیچ ریکگنیشن کے لیے ماسکڈ لینگویج ماڈلز تیار کیے۔ تحقیق اور عملی ایپلی کیشنز دونوں میں ان کا تجربہ انہیں ویو فارمز کی قیادت کرنے کے لیے منفرد طور پر اہل بناتا ہے۔

شریک بانی، کورالی لیمائٹر، کاروبار اور اسٹریٹجک مہارت کا خزانہ لے کر آتی ہیں۔ گوگل اور بی سی جی میں حکمت عملی اور آپریشنز میں ایک دہائی کے تجربے کے ساتھ، انہوں نے متعدد معروف ٹیک کمپنیوں کے لیے پروڈکٹ اور مارکیٹ کی حکمت عملیوں کی قیادت کی ہے۔ لیمائٹر کا کاروبار اور حکمت عملی کا پس منظر ویو فارمز کی ترقی اور مارکیٹ پوزیشننگ کی رہنمائی میں اہم ہوگا۔

بانی ٹیم کا تیسرا اہم رکن سی ٹی او کارتیکے کھنڈیل وال ہے، جنہوں نے پہلے پائٹورچ کے لیے اے آئی ایکو سسٹم کی قیادت کی تھی۔ کھنڈیل وال کی اے آئی انفراسٹرکچر اور ڈیولپمنٹ میں مہارت ان پیچیدہ ماڈلز کی تعمیر کے لیے ضروری ہے جو ویو فارمز تیار کر رہا ہے۔ تین بانیوں کے علاوہ، کمپنی کے دو دیگر تکنیکی ملازمین بھی ہیں، جو ایک چھوٹی لیکن انتہائی ہنر مند ٹیم بناتے ہیں۔

جذباتی عمومی ذہانت (ای جی آئی) کا وژن

ویو فارمز کا حتمی وژن جذباتی عمومی ذہانت (ای جی آئی) بنانا ہے۔ یہ ایک ایسی اے آئی ہے جو نہ صرف یہ سمجھ سکتی ہے کہ انسان کیا کہتے ہیں بلکہ یہ بھی کہ وہ کیسا محسوس کرتے ہیں۔ یہ ایک ایسی اے آئی ہے جو انسانی سطح پر انسانوں کے ساتھ جڑ سکتی ہے، جس سے زیادہ قدرتی اور بامعنی تعامل کو فروغ ملتا ہے۔ یہ وژن پرجوش ہے، لیکن یہ اس بڑھتی ہوئی پہچان کے ساتھ ہم آہنگ ہے کہ اے آئی کو صرف ذہین ہونے سے زیادہ کی ضرورت ہے؛ اسے ہمدرد ہونے کی ضرورت ہے۔

کمپنی کا ماننا ہے کہ اے آئی کے ساتھ واقعی انسانی جیسا تعامل پیدا کرنے کے لیے صرف جدید زبان کی پروسیسنگ کی صلاحیتوں سے زیادہ کی ضرورت ہے۔ اس کے لیے جذبات، تعلقات اور انسانی مواصلات کی باریکیوں کو سمجھنے کی ضرورت ہے۔ ویو فارمز اے آئی کو ان انسانی خوبیوں سے بھرنے کے لیے کام کر رہا ہے، جس کا مقصد ایک ایسا مستقبل بنانا ہے جہاں اے آئی صرف ایک آلہ نہ ہو، بلکہ انسانی کوششوں میں ایک شراکت دار ہو۔

مسابقتی منظر نامہ: ویو فارمز کا منفرد نقطہ نظر

آڈیو اے آئی مارکیٹ تیزی سے بھیڑ بھاڑ والی ہوتی جا رہی ہے، جہاں کئی کمپنیاں اسی طرح کی ٹیکنالوجیز پر کام کر رہی ہیں۔ تاہم، ویو فارمز کا ایک منفرد نقطہ نظر ہے جو اسے اپنے حریفوں سے الگ کرتا ہے۔ اگرچہ بہت سی کمپنیاں اسپیچ ٹو ٹیکسٹ اور ٹیکسٹ ٹو اسپیچ ماڈلز پر توجہ مرکوز کر رہی ہیں، ویو فارمز اینڈ ٹو اینڈ آڈیو ایل ایل ایمز تیار کرنے کے لیے پرعزم ہے جو آڈیو کو براہ راست پروسیس کر سکتے ہیں۔ ان کا ماننا ہے کہ یہ نقطہ نظر زیادہ قدرتی اور جذباتی طور پر ذہین تعاملات کا باعث بنے گا۔

ویو فارمز کے لیے اہم فرق کرنے والوں میں سے ایک جذباتی ذہانت پر اس کی توجہ ہے۔ اگرچہ دیگر کمپنیاں تقریر کی شناخت یا ٹیکسٹ جنریشن کو بہتر بنانے کے لیے دیکھ رہی ہوں گی، ویو فارمز اے آئی بنانے پر مرکوز ہے جو انسانی جذبات کو سمجھ اور ان کا جواب دے سکے۔ ہمدردی پر یہ توجہ وہی ہے جو ویو فارمز کو الگ کرتی ہے اور اسے مارکیٹ میں ایک منفرد ویلیو پروپوزیشن دیتی ہے۔

دیگر آڈیو ماڈلز کے ساتھ موازنہ

مارکیٹ میں ویو فارمز کی پوزیشن کو سمجھنے کے لیے، ان کی ٹیکنالوجی کا دیگر قابل ذکر آڈیو ماڈلز سے موازنہ کرنا مددگار ہے۔

  • اوپن اے آئی کا وسپر: وسپر ایک اوپن سورس یونیورسل آڈیو ماڈل ہے جو 99 زبانوں میں اسپیچ ٹو ٹیکسٹ کو سپورٹ کرتا ہے۔ اسے ایک وسیع ڈیٹا سیٹ پر تربیت دی گئی ہے اور یہ شور والے ماحول میں اپنی درستگی کے لیے جانا جاتا ہے۔ اگرچہ وسپر اپنی تقریر کی شناخت کی صلاحیتوں کے لیے متاثر کن ہے، لیکن یہ اس قسم کی جذباتی سمجھ پر توجہ نہیں دیتا ہے جس کی ویو فارمز پیروی کر رہا ہے۔
  • این وی آئی ڈی آئی اے اے آئی کا فوگاٹو: فوگاٹو ایک 2.5 بلین پیرامیٹر ماڈل ہے جو صوتی اثرات پیدا کر سکتا ہے، آوازوں میں ترمیم کر سکتا ہے اور قدرتی زبان کے اشاروں کی بنیاد پر موسیقی بنا سکتا ہے۔ فوگاٹو آڈیو تخلیق میں طاقتور ہے لیکن جذباتی ذہانت پر اس طرح زور نہیں دیتا جس طرح ویو فارمز کرتا ہے۔
  • کیوٹائی کا موشی: موشی ایک اوپن سورس، ریئل ٹائم آڈیو ماڈل ہے جو ملٹی اسٹریم ماڈلنگ اور اندرونی مونولوگ تکنیکوں کا استعمال کرتے ہوئے تیار کردہ تقریر کے معیار اور حقیقت پسندی کو بڑھاتا ہے۔ اگرچہ موشی آڈیو جنریشن کے لحاظ سے جدید ہے، لیکن یہ جذباتی اے آئی پر اس طرح توجہ مرکوز نہیں کرتا جس طرح ویو فارمز ہے۔

ویو فارمز کا نقطہ نظر ان سب سے مختلف ہے۔ تقریر کی شناخت، آڈیو جنریشن یا ریئل ٹائم پروسیسنگ پر توجہ مرکوز کرنے کے بجائے، ویو فارمز اے آئی بنانے پر مرکوز ہے جو انسانی جذبات کو سمجھ اور ان کا جواب دے سکے۔ جذباتی ذہانت پر یہ توجہ وہی ہے جو ویو فارمز کو الگ کرتی ہے اور اسے مارکیٹ میں ایک منفرد ویلیو پروپوزیشن دیتی ہے۔

فنڈنگ راؤنڈ: اعتماد کا ووٹ

اے 16 زیڈ کی جانب سے 40 ملین ڈالر کی ابتدائی فنڈنگ ویو فارمز کے وژن اور ٹیکنالوجی کی ایک مضبوط توثیق ہے۔ اے 16 زیڈ اپنی خلل ڈالنے والی ٹیکنالوجیز میں سرمایہ کاری کے لیے جانا جاتا ہے، جس سے اس کی حمایت ویو فارمز کی ایک اہم توثیق ہے۔ فنڈنگ ویو فارمز کو اپنی ٹیم کو وسعت دینے اور اپنی تحقیق اور ترقی کی کوششوں کو تیز کرنے کے قابل بنائے گی۔ اے 16 زیڈ کی سرمایہ کاری اے آئی میں جذباتی ذہانت کی بڑھتی ہوئی اہمیت کو اجاگر کرتی ہے۔ یہ اس یقین کو بھی اجاگر کرتا ہے کہ اے آئی کا مستقبل انسانی سطح پر زیادہ جذباتی طور پر جڑنے کی صلاحیت پر منحصر ہوگا۔ یہ سرمایہ کاری اے آئی انڈسٹری میں ایک تبدیلی کا اشارہ دیتی ہے، جہاں توجہ اب صرف تکنیکی صلاحیتوں پر نہیں بلکہ انسانی مرکزیت پر بھی ہے۔

ویو فارمز کا مستقبل: انسانی-اے آئی کنکشن کا وژن

ویو فارمز صرف ٹیکنالوجی نہیں بنا رہا ہے؛ یہ مستقبل کا ایک وژن بنا رہا ہے جہاں اے آئی زیادہ انسانی اور ہمدرد ہے۔ کمپنی کا ماننا ہے کہ یہ اے آئی کی مکمل صلاحیت کو کھولنے اور ایک ایسا مستقبل بنانے کی کلید ہے جہاں اے آئی واقعی انسانیت کی خدمت کر سکے۔

قریب المدت میں، ویو فارمز اپنی بنیادی ٹیکنالوجی تیار کرنے اور 2025 میں صارفین کے سافٹ ویئر پروڈکٹس جاری کرنے پر مرکوز ہے۔ یہ پروڈکٹس ممکنہ طور پر اوپن اے آئی اور گوگل جیسی کمپنیوں کے موجودہ آڈیو اے آئی حل کو چیلنج کریں گے۔ تاہم، صرف مصنوعات سے ہٹ کر، ویو فارمز ای جی آئی بنانے کے اپنے مشن کے لیے پرعزم ہے، ایک ایسی اے آئی جو انسانی جذبات کو سمجھ اور ان کا جواب دے سکے۔

نتیجہ: انسانی-اے آئی تعامل کی نئی تعریف

ویو فارمز اے آئی آڈیو اے آئی مارکیٹ میں ایک بڑا کھلاڑی بننے کے لیے تیار ہے۔ اپنی مضبوط ٹیم، اختراعی ٹیکنالوجی اور جذباتی ذہانت پر توجہ کے ساتھ، کمپنی اس بات کی نئی تعریف کرنے کے لیے اچھی طرح سے تیار ہے کہ انسان اے آئی کے ساتھ کیسے تعامل کرتے ہیں۔ ویو فارمز کا آغاز اے آئی بنانے کی جانب ایک اہم قدم ہے جو نہ صرف ذہین ہے بلکہ ہمدرد بھی ہے، جو ایک ایسے مستقبل کی راہ ہموار کرتا ہے جہاں اے آئی واقعی انسانی جذبات کو سمجھ اور ان کا جواب دے سکے۔

جذباتی عمومی ذہانت کا حصول ایک جرات مندانہ ہے، اور ویو فارمز اے آئی اس تحریک میں سب سے آگے ہے۔ کمپنی کی جانب سے اے آئی کو زیادہ ہمدرد اور جذباتی طور پر ذمہ دار بنانے کا عزم نہ صرف ایک تکنیکی ترقی ہے بلکہ ایک فلسفیانہ بھی ہے۔ یہ مستقبل کا ایک وژن ہے جہاں اے آئی صرف ایک آلہ نہیں ہے، بلکہ ایک شراکت دار ہے، جو انسانی جذبات کی مکمل رینج کو سمجھنے اور ان کا جواب دینے کی صلاحیت رکھتا ہے۔ جیسے جیسے ویو فارمز اپنا سفر جاری رکھے گا، یہ انسانی-اے آئی تعامل کے مستقبل کو تشکیل دینے میں ایک اہم کردار ادا کرے گا۔