- Published on
வேவ்ஃபார்ம்ஸ் AI: உணர்ச்சி நுண்ணறிவு ஆடியோ மாடல் ஸ்டார்ட்அப் $40 மில்லியன் நிதி திரட்டல்
செயற்கை நுண்ணறிவின் புதிய பரிணாமம்
செயற்கை நுண்ணறிவுத் துறையில், புதிய கண்டுபிடிப்புகளும், முன்னேற்றங்களும் அதிவேகமாக வளர்ந்து வருகின்றன. குறிப்பாக, ஆடியோ AI துறையில், பேச்சு அங்கீகாரம், இயற்கை மொழி செயலாக்கம் மற்றும் உணர்ச்சி புரிதல் போன்ற பகுதிகளில் நிறுவனங்கள் புதிய எல்லைகளைத் தொட்டு வருகின்றன. சமீபத்தில், ChatGPT-ஐ உருவாக்கிய OpenAI நிறுவனத்தின் மேம்பட்ட குரல் முறையின் முன்னாள் தலைவர் அலெக்சிஸ் கொன்னோவால் தொடங்கப்பட்ட வேவ்ஃபார்ம்ஸ் AI என்ற ஸ்டார்ட்அப், பெரும் கவனத்தை ஈர்த்துள்ளது.
வேவ்ஃபார்ம்ஸ் AI, மேம்பட்ட ஆடியோ பெரிய மொழி மாதிரிகளை (LLMs) உருவாக்குவதில் கவனம் செலுத்துகிறது. இதன் முக்கிய நோக்கம், AI-ஐ மேலும் உணர்வுப்பூர்வமாகவும், உணர்ச்சி நுண்ணறிவுடனும் உருவாக்குவதாகும். இந்த முயற்சிக்கு, முன்னணி வென்ச்சர் கேபிடல் நிறுவனமான a16z-இடமிருந்து $40 மில்லியன் விதை நிதியைப் பெற்றுள்ளது. இதன் மூலம், நிறுவனத்தின் மதிப்பு பல நூறு மில்லியன் டாலர்களாக உயர்ந்துள்ளது.
உணர்ச்சி பொது நுண்ணறிவில் முன்னோடி
வேவ்ஃபார்ம்ஸ் AI ஒரு சாதாரண தொழில்நுட்ப ஸ்டார்ட்அப் அல்ல; இது ஒரு துணிச்சலான தொலைநோக்குப் பார்வையுடன் செயல்படுகிறது. வேவ்ஃபார்ம்ஸ், ஆடியோவை நேரடியாகப் செயலாக்கக்கூடிய ஆடியோ LLM-களை உருவாக்குவதில் அர்ப்பணித்துள்ளது. இது, பேச்சு-க்கு-உரை மற்றும் உரை-க்கு-பேச்சு முறைகளைச் சார்ந்து இல்லாமல், நிகழ்நேர, மனிதனைப் போன்ற மற்றும் உணர்ச்சி நுண்ணறிவுடன் கூடிய தொடர்புகளை அனுமதிக்கிறது. இந்த நிறுவனத்தின் இறுதி இலக்கு, உணர்ச்சி பொது நுண்ணறிவு (Emotional General Intelligence - EGI) என்று அழைக்கப்படும் AI-ஐ உருவாக்குவதாகும். இது, மனித உணர்ச்சிகளைப் புரிந்துகொண்டு, அவற்றுக்கு அனுதாபத்துடன் பதிலளிக்கக்கூடியது.
இந்த லட்சிய இலக்கு, AI-ன் எதிர்காலம் தகவல்களைச் செயலாக்குவதில் மட்டுமல்ல, மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிப்பதிலும் உள்ளது என்ற நம்பிக்கையால் இயக்கப்படுகிறது. வேவ்ஃபார்ம்ஸின் நிறுவனர் அலெக்சிஸ் கொன்னோ, செயற்கை பொது நுண்ணறிவை (Artificial General Intelligence - AGI) அடைவதற்கு உணர்ச்சி நுண்ணறிவு ஒரு முக்கியமான கூறு என்று கருதுகிறார். AI செயல்பாட்டுடன் மட்டுமல்லாமல், உணர்வுப்பூர்வமாகவும், மனிதர்களுடன் உணர்ச்சி ரீதியாக இணைக்கக்கூடியதாகவும் இருக்க வேண்டும் என்று அவர் வலியுறுத்துகிறார். இந்த கண்ணோட்டம், தொழில்நுட்ப திறன்களில் மட்டுமே கவனம் செலுத்தும் பல AI நிறுவனங்களிலிருந்து வேவ்ஃபார்ம்ஸை வேறுபடுத்துகிறது.
வேவ்ஃபார்ம்ஸின் தொழில்நுட்பம்
வேவ்ஃபார்ம்ஸின் தொழில்நுட்பம் தான் உண்மையான கண்டுபிடிப்புகளின் மையமாக உள்ளது. பேச்சு-க்கு-உரை மற்றும் உரை-க்கு-பேச்சு மாதிரிகளைப் பயன்படுத்தும் வழக்கமான அணுகுமுறைக்கு மாறாக, வேவ்ஃபார்ம்ஸின் ஆடியோ LLM-கள் ஆடியோவை நேரடியாகச் செயலாக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளன. இதன் மூலம், AI மனித பேச்சின் நுணுக்கங்களை, அதாவது தொனி, இடைநிறுத்தங்கள் மற்றும் உணர்ச்சி வெளிப்பாடுகள் போன்றவற்றை நிகழ்நேரத்தில் பகுப்பாய்வு செய்ய முடியும். உரை மொழிபெயர்ப்பு படிநிலையைத் தவிர்ப்பதன் மூலம், வேவ்ஃபார்ம்ஸ் மிகவும் இயல்பான மற்றும் பதிலளிக்கக்கூடிய தொடர்புகளை உருவாக்க இலக்கு கொண்டுள்ளது.
இந்த அணுகுமுறை, தற்போதைய பெரும்பாலான குரல் மாதிரிகள் செயல்படும் முறையிலிருந்து முற்றிலும் மாறுபட்டது. பாரம்பரிய முறையில், பல படிநிலைகள் உள்ளன, ஒவ்வொன்றிலும் தாமதம் மற்றும் தகவல் இழப்புக்கான சாத்தியக்கூறுகள் உள்ளன. ஆடியோவை நேரடியாகச் செயலாக்குவதன் மூலம், வேவ்ஃபார்ம்ஸின் மாதிரிகள் தாமதத்தைக் குறைத்து, மொழிபெயர்ப்பு செயல்பாட்டில் இழக்கப்படக்கூடிய நுட்பமான உணர்ச்சி குறிப்புகளைப் பிடிக்க முடியும். இது, மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய AI-ஐ உருவாக்குவதற்கு மிகவும் முக்கியமானது.
நிறுவனர்கள்: நிபுணத்துவத்தின் சங்கமம்
வேவ்ஃபார்ம்ஸின் பின்னணியில் உள்ள குழு, அவர்கள் உருவாக்கும் தொழில்நுட்பத்தைப் போலவே ஈர்க்கக்கூடியது. CEO மற்றும் நிறுவனரான அலெக்சிஸ் கொன்னோ, ஆடியோ மற்றும் உரை LLM-களில் முன்னணி நிபுணர். OpenAI-இல் GPT-4o-ன் மேம்பட்ட குரல் முறையை உருவாக்குவதில் அவர் முக்கிய பங்கு வகித்தார். OpenAI-க்கு முன்பு, கொன்னோ கூகிள் மற்றும் மெட்டாவில் ஆராய்ச்சி விஞ்ஞானியாக இருந்தார். அங்கு அவர் உரை புரிதல் மற்றும் பேச்சு அங்கீகாரத்திற்கான மறைக்கப்பட்ட மொழி மாதிரிகளை உருவாக்கினார். ஆராய்ச்சி மற்றும் நடைமுறை பயன்பாடுகள் இரண்டிலும் அவரது அனுபவம், வேவ்ஃபார்ம்ஸை அதன் இலக்கை நோக்கி வழிநடத்த அவரைத் தகுதியுடையவராக ஆக்குகிறது.
இணை நிறுவனரான கோரலி லெமைட்ரே, வணிகம் மற்றும் மூலோபாய நிபுணத்துவத்தை வழங்குகிறார். கூகிள் மற்றும் BCG-இல் மூலோபாயம் மற்றும் செயல்பாடுகளில் ஒரு தசாப்த கால அனுபவத்துடன், அவர் பல முன்னணி தொழில்நுட்ப நிறுவனங்களுக்கான தயாரிப்பு மற்றும் சந்தை உத்திகளை வழிநடத்தியுள்ளார். லெமைட்ரேயின் வணிகம் மற்றும் மூலோபாய பின்னணி, வேவ்ஃபார்ம்ஸின் வளர்ச்சி மற்றும் சந்தை நிலைப்பாட்டை வழிநடத்துவதில் முக்கிய பங்கு வகிக்கும்.
நிறுவனத்தின் மூன்றாவது முக்கிய உறுப்பினர் CTO கார்த்திகேய கண்டேல்வால், இவர் முன்பு PyTorch-க்கான AI சுற்றுச்சூழல் அமைப்பை வழிநடத்தினார். கண்டேல்வாலின் AI உள்கட்டமைப்பு மற்றும் மேம்பாட்டு நிபுணத்துவம், வேவ்ஃபார்ம்ஸ் உருவாக்கும் சிக்கலான மாதிரிகளை உருவாக்குவதற்கு அவசியம். இந்த மூன்று நிறுவனர்களைத் தவிர, நிறுவனத்தில் மேலும் இரண்டு தொழில்நுட்ப ஊழியர்களும் உள்ளனர், இது ஒரு சிறிய ஆனால் திறமையான குழுவாக உள்ளது.
உணர்ச்சி பொது நுண்ணறிவுக்கான தொலைநோக்கு பார்வை (EGI)
வேவ்ஃபார்ம்ஸின் இறுதி தொலைநோக்கு பார்வை, உணர்ச்சி பொது நுண்ணறிவை (EGI) உருவாக்குவதாகும். இது, மனிதர்கள் என்ன சொல்கிறார்கள் என்பதைப் புரிந்துகொள்வது மட்டுமல்லாமல், அவர்கள் எப்படி உணர்கிறார்கள் என்பதையும் புரிந்துகொள்ளக்கூடிய AI ஆகும். இது, மனிதர்களுடன் உணர்ச்சி ரீதியாக இணைக்கக்கூடிய AI ஆகும், இது மிகவும் இயல்பான மற்றும் அர்த்தமுள்ள தொடர்பை ஊக்குவிக்கிறது. இந்த தொலைநோக்கு பார்வை லட்சியமானது, ஆனால் AI வெறும் அறிவார்ந்ததாக மட்டுமல்லாமல், அனுதாபமுள்ளதாகவும் இருக்க வேண்டும் என்ற வளர்ந்து வரும் அங்கீகாரத்துடன் ஒத்துப்போகிறது.
AI உடன் உண்மையான மனிதனைப் போன்ற தொடர்பை உருவாக்குவதற்கு, மேம்பட்ட மொழி செயலாக்க திறன்களை விட அதிகமாக தேவை என்று நிறுவனம் நம்புகிறது. உணர்ச்சிகள், உறவுகள் மற்றும் மனித தொடர்புகளின் நுணுக்கங்களைப் புரிந்துகொள்வது அவசியம். வேவ்ஃபார்ம்ஸ், AI-ஐ இந்த மனித குணங்களுடன் இணைக்க முயற்சிக்கிறது. இதன் மூலம், AI ஒரு கருவியாக மட்டுமல்லாமல், மனித முயற்சிகளில் ஒரு பங்காளியாக இருக்கும் எதிர்காலத்தை உருவாக்க இலக்கு கொண்டுள்ளது.
போட்டிச் சூழல்: வேவ்ஃபார்ம்ஸின் தனித்துவமான அணுகுமுறை
ஆடியோ AI சந்தை பெருகி வருகிறது, பல நிறுவனங்கள் இதே போன்ற தொழில்நுட்பங்களில் செயல்பட்டு வருகின்றன. இருப்பினும், வேவ்ஃபார்ம்ஸ் அதன் போட்டியாளர்களிடமிருந்து தனித்து நிற்கும் ஒரு தனித்துவமான அணுகுமுறையைக் கொண்டுள்ளது. பல நிறுவனங்கள் பேச்சு-க்கு-உரை மற்றும் உரை-க்கு-பேச்சு மாதிரிகளில் கவனம் செலுத்துகையில், வேவ்ஃபார்ம்ஸ் ஆடியோவை நேரடியாகச் செயலாக்கக்கூடிய எண்ட்-டு-எண்ட் ஆடியோ LLM-களை உருவாக்குவதில் உறுதியாக உள்ளது. இந்த அணுகுமுறை, மிகவும் இயல்பான மற்றும் உணர்ச்சி நுண்ணறிவுடன் கூடிய தொடர்புகளுக்கு வழிவகுக்கும் என்று அவர்கள் நம்புகிறார்கள்.
வேவ்ஃபார்ம்ஸின் முக்கிய வேறுபாடுகளில் ஒன்று, உணர்ச்சி நுண்ணறிவில் கவனம் செலுத்துவது. மற்ற நிறுவனங்கள் பேச்சு அங்கீகாரம் அல்லது உரை உருவாக்கத்தை மேம்படுத்த முயலலாம், ஆனால் வேவ்ஃபார்ம்ஸ் மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய AI-ஐ உருவாக்குவதில் கவனம் செலுத்துகிறது. அனுதாபத்தின் மீதான இந்த கவனம், வேவ்ஃபார்ம்ஸை தனித்து நிற்கச் செய்கிறது மற்றும் சந்தையில் ஒரு தனித்துவமான மதிப்பை வழங்குகிறது.
பிற ஆடியோ மாதிரிகளுடன் ஒப்பீடு
சந்தையில் வேவ்ஃபார்ம்ஸின் நிலையைப் புரிந்துகொள்ள, அவர்களின் தொழில்நுட்பத்தை மற்ற குறிப்பிடத்தக்க ஆடியோ மாதிரிகளுடன் ஒப்பிடுவது உதவியாக இருக்கும்.
OpenAI-ன் விஸ்பர்: விஸ்பர் என்பது 99 மொழிகளில் பேச்சு-க்கு-உரையை ஆதரிக்கும் ஒரு திறந்த மூல உலகளாவிய ஆடியோ மாதிரி. இது ஒரு பெரிய தரவுத்தொகுப்பில் பயிற்சி பெற்றது மற்றும் சத்தமில்லாத சூழல்களில் அதன் துல்லியத்திற்கு பெயர் பெற்றது. விஸ்பர் அதன் பேச்சு அங்கீகார திறன்களுக்கு ஈர்க்கக்கூடியதாக இருந்தாலும், வேவ்ஃபார்ம்ஸ் பின்பற்றும் உணர்ச்சி புரிதலில் இது கவனம் செலுத்துவதில்லை.
NVIDIA AI-ன் ஃபுகாட்டோ: ஃபுகாட்டோ என்பது 2.5 பில்லியன் அளவுரு மாதிரி ஆகும், இது ஒலி விளைவுகளை உருவாக்கவும், குரல்களை மாற்றவும் மற்றும் இயற்கை மொழி தூண்டுதல்களின் அடிப்படையில் இசையை உருவாக்கவும் முடியும். ஃபுகாட்டோ ஆடியோ உருவாக்கத்தில் சக்தி வாய்ந்தது, ஆனால் வேவ்ஃபார்ம்ஸ் செய்யும் அதே வழியில் உணர்ச்சி நுண்ணறிவை வலியுறுத்துவதில்லை.
Kyutai-ன் மோஷி: மோஷி என்பது ஒரு திறந்த மூல, நிகழ்நேர ஆடியோ மாதிரி ஆகும், இது பல-ஸ்ட்ரீம் மாடலிங் மற்றும் உள் உரையாடல் நுட்பங்களைப் பயன்படுத்தி உருவாக்கப்பட்ட பேச்சின் தரம் மற்றும் யதார்த்தத்தை மேம்படுத்துகிறது. மோஷி ஆடியோ உருவாக்கத்தில் மேம்பட்டதாக இருந்தாலும், வேவ்ஃபார்ம்ஸைப் போல உணர்ச்சி AI-இல் கவனம் செலுத்தவில்லை.
வேவ்ஃபார்ம்ஸின் அணுகுமுறை இவை அனைத்திலிருந்தும் வேறுபட்டது. பேச்சு அங்கீகாரம், ஆடியோ உருவாக்கம் அல்லது நிகழ்நேர செயலாக்கம் ஆகியவற்றில் கவனம் செலுத்துவதற்குப் பதிலாக, வேவ்ஃபார்ம்ஸ் மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய AI-ஐ உருவாக்குவதில் கவனம் செலுத்துகிறது. உணர்ச்சி நுண்ணறிவில் கவனம் செலுத்துவதுதான் வேவ்ஃபார்ம்ஸை தனித்து நிற்கச் செய்கிறது மற்றும் சந்தையில் ஒரு தனித்துவமான மதிப்பை வழங்குகிறது.
நிதி திரட்டல்: நம்பிக்கையின் வாக்கு
a16z-ஆல் வழிநடத்தப்பட்ட $40 மில்லியன் விதை நிதி திரட்டல், வேவ்ஃபார்ம்ஸின் தொலைநோக்குப் பார்வை மற்றும் தொழில்நுட்பத்திற்கான வலுவான அங்கீகாரமாகும். a16z, இடையூறு விளைவிக்கும் தொழில்நுட்பங்களில் முதலீடு செய்வதற்கு பெயர் பெற்றது, இது வேவ்ஃபார்ம்ஸிற்கான ஒரு குறிப்பிடத்தக்க ஆதரவாகும். இந்த நிதி, வேவ்ஃபார்ம்ஸ் அதன் குழுவை விரிவுபடுத்தவும், அதன் ஆராய்ச்சி மற்றும் மேம்பாட்டு முயற்சிகளை விரைவுபடுத்தவும் உதவும்.
AI-இல் உணர்ச்சி நுண்ணறிவின் வளர்ந்து வரும் முக்கியத்துவத்தை a16z-இன் முதலீடு அடிக்கோடிட்டுக் காட்டுகிறது. AI-ன் எதிர்காலம் மனிதர்களுடன் உணர்ச்சி ரீதியாக இணைக்கும் திறனைப் பொறுத்தது என்ற நம்பிக்கையையும் இது எடுத்துக்காட்டுகிறது. இந்த முதலீடு, AI துறையில் ஒரு மாற்றத்தை குறிக்கிறது, அங்கு கவனம் இனி தொழில்நுட்ப திறன்களில் மட்டுமல்லாமல், மனிதனை மையமாகக் கொண்ட வடிவமைப்பிலும் உள்ளது.
வேவ்ஃபார்ம்ஸின் எதிர்காலம்: மனித-AI இணைப்புக்கான தொலைநோக்கு பார்வை
வேவ்ஃபார்ம்ஸ் வெறும் தொழில்நுட்பத்தை மட்டும் உருவாக்கவில்லை; AI மேலும் மனிதனைப் போன்றும், அனுதாபமுள்ளதாகவும் இருக்கும் எதிர்காலத்திற்கான ஒரு தொலைநோக்குப் பார்வையை உருவாக்குகிறது. AI-ன் முழு திறனையும் திறப்பதற்கும், AI மனிதகுலத்திற்கு உண்மையாக சேவை செய்யக்கூடிய எதிர்காலத்தை உருவாக்குவதற்கும் இதுவே முக்கியம் என்று நிறுவனம் நம்புகிறது.
அண்மையில், வேவ்ஃபார்ம்ஸ் அதன் முக்கிய தொழில்நுட்பத்தை மேம்படுத்துவதிலும், 2025-இல் நுகர்வோர் மென்பொருள் தயாரிப்புகளை வெளியிடுவதிலும் கவனம் செலுத்துகிறது. இந்த தயாரிப்புகள் OpenAI மற்றும் Google போன்ற நிறுவனங்களின் தற்போதைய ஆடியோ AI தீர்வுகளை சவால் செய்யக்கூடும். இருப்பினும், தயாரிப்புகளைத் தாண்டி, வேவ்ஃபார்ம்ஸ் EGI-ஐ உருவாக்குவதில் உறுதியாக உள்ளது, இது மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய AI ஆகும்.
முடிவுரை: மனித-AI தொடர்பை மறுவரையறை செய்தல்
வேவ்ஃபார்ம்ஸ் AI, ஆடியோ AI சந்தையில் ஒரு முக்கிய வீரராக மாறத் தயாராக உள்ளது. அதன் வலுவான குழு, புதுமையான தொழில்நுட்பம் மற்றும் உணர்ச்சி நுண்ணறிவில் கவனம் செலுத்துவதன் மூலம், மனிதர்கள் AI உடன் எவ்வாறு தொடர்பு கொள்கிறார்கள் என்பதை மறுவரையறை செய்ய நிறுவனம் நன்கு நிலைநிறுத்தப்பட்டுள்ளது. வேவ்ஃபார்ம்ஸின் வெளியீடு, AI அறிவார்ந்ததாக மட்டுமல்லாமல், அனுதாபமுள்ளதாகவும் இருக்கும் எதிர்காலத்தை உருவாக்குவதற்கான ஒரு குறிப்பிடத்தக்க படியாகும். இது, AI மனித உணர்ச்சிகளைப் புரிந்துகொண்டு பதிலளிக்கக்கூடிய ஒரு எதிர்காலத்திற்கு வழி வகுக்கிறது.
உணர்ச்சி பொது நுண்ணறிவைத் தொடர்வது ஒரு துணிச்சலான முயற்சி, மேலும் வேவ்ஃபார்ம்ஸ் AI இந்த இயக்கத்தின் முன்னணியில் உள்ளது. AI-ஐ மேலும் அனுதாபமுள்ளதாகவும், உணர்ச்சிப்பூர்வமாகவும் மாற்றுவதற்கான நிறுவனத்தின் அர்ப்பணிப்பு ஒரு தொழில்நுட்ப முன்னேற்றம் மட்டுமல்ல, ஒரு தத்துவார்த்த முன்னேற்றமும் ஆகும். இது, AI ஒரு கருவி மட்டுமல்ல, மனித உணர்ச்சிகளின் முழு வீச்சையும் புரிந்துகொண்டு பதிலளிக்கக்கூடிய ஒரு பங்காளியாக இருக்கும் எதிர்காலத்திற்கான ஒரு தொலைநோக்குப் பார்வை. வேவ்ஃபார்ம்ஸ் அதன் பயணத்தைத் தொடரும்போது, மனித-AI தொடர்பின் எதிர்காலத்தை வடிவமைப்பதில் இது ஒரு முக்கிய பங்கு வகிக்கும்.