Published on

செயற்கை நுண்ணறிவு பயிற்சி தரவு தீர்ந்துவிட்டது: மஸ்கின் கருத்து

ஆசிரியர்கள்
  • avatar
    பெயர்
    Ajax
    Twitter

செயற்கை நுண்ணறிவு பயிற்சி தரவு குறைந்துவிட்டது: மஸ்கின் பார்வை

எலோன் மஸ்க் மற்றும் பல செயற்கை நுண்ணறிவு (AI) நிபுணர்கள் ஒருமித்த கருத்தை எட்டியுள்ளனர். செயற்கை நுண்ணறிவு மாதிரிகளுக்குப் பயிற்சி அளிக்கப் பயன்படுத்தப்படும் நிஜ உலகத் தரவு வளங்கள் கிட்டத்தட்ட தீர்ந்துவிட்டதாக அவர்கள் நம்புகின்றனர். ஸ்டாக்வெல் தலைவர் மார்க் பெய்னுடனான நேரடி உரையாடலில், மஸ்க் மனித அறிவின் ஒட்டுமொத்த திரட்சி AI பயிற்சிக்கு கிட்டத்தட்ட தீர்ந்துவிட்டதாகவும், இது கடந்த ஆண்டு வாக்கில் நிகழ்ந்ததாகவும் குறிப்பிட்டார்.

AI நிறுவனமான xAI இன் தலைவராக இருக்கும் மஸ்க், முன்னாள் OpenAI தலைமை விஞ்ஞானி இலியா சுட்ஸ்கேவர், NeurIPS இயந்திர கற்றல் மாநாட்டில் முன்வைத்த கருத்தை எதிரொலித்தார். சுட்ஸ்கேவரும் AI தொழில் "தரவு உச்சத்தை" எட்டியுள்ளது என்று நம்புகிறார், பயிற்சி தரவு பற்றாக்குறை மாதிரி மேம்பாட்டு முறைகளில் ஒரு அடிப்படை மாற்றத்தை ஏற்படுத்தும் என்று முன்னறிவித்தார்.

தொகுப்பு தரவு: செயற்கை நுண்ணறிவின் எதிர்கால பாதை

மஸ்க் தொகுப்பு தரவு, அதாவது AI மாதிரிகளால் உருவாக்கப்படும் தரவு, தற்போதைய தரவு தட்டுப்பாட்டைத் தீர்ப்பதற்கான முக்கியமாகும் என்று முன்மொழிகிறார். நிஜ உலக தரவை திறம்பட நிரப்புவதற்கான ஒரே வழி, AI ஐப் பயன்படுத்தி பயிற்சி தரவை உருவாக்குவதுதான் என்று அவர் நம்புகிறார். தொகுப்பு தரவு மூலம் AI ஒரு குறிப்பிட்ட அளவிற்கு சுய மதிப்பீடு மற்றும் சுய கற்றலை மேற்கொள்ள அனுமதிக்க வேண்டும்.

தற்போது, மைக்ரோசாப்ட், மெட்டா, OpenAI மற்றும் Anthropic போன்ற தொழில்நுட்ப நிறுவனங்கள் தங்கள் முதன்மை AI மாதிரிகளுக்கு பயிற்சி அளிக்க தொகுப்பு தரவைப் பயன்படுத்தத் தொடங்கியுள்ளன. கார்ட்னரின் கணிப்புப்படி, 2024 ஆம் ஆண்டில், AI மற்றும் பகுப்பாய்வு திட்டங்களுக்கான தரவுகளில் 60% தொகுப்பு முறையில் உருவாக்கப்படும்.

  • மைக்ரோசாஃப்ட் Phi-4: இந்த திறந்த மூல மாதிரி தொகுப்பு மற்றும் நிஜ உலக தரவுகளின் கலவையுடன் பயிற்சி அளிக்கப்பட்டது.
  • கூகிள் ஜெம்மா மாதிரி: இதுவும் கலப்பு தரவு பயிற்சி முறையைப் பயன்படுத்துகிறது.
  • ஆந்த்ரோபிக் கிளாட் 3.5 சோனெட்: இந்த சக்திவாய்ந்த அமைப்பு தொகுப்பு தரவின் ஒரு பகுதியையும் பயன்படுத்துகிறது.
  • மெட்டாவின் லாமா தொடர் மாதிரிகள்: AI மூலம் உருவாக்கப்பட்ட தரவைப் பயன்படுத்தி நன்றாகச் சரிசெய்யப்பட்டது.

தொகுப்பு தரவின் நன்மைகள் மற்றும் சவால்கள்

தரவு பற்றாக்குறையைத் தீர்ப்பதைத் தவிர, தொகுப்பு தரவு செலவு கட்டுப்பாட்டில் குறிப்பிடத்தக்க நன்மைகளையும் காட்டுகிறது. உதாரணமாக, செயற்கை நுண்ணறிவு தொடக்க நிறுவனமான ரைட்டர், அதன் பால்மைரா X 004 மாதிரி கிட்டத்தட்ட முற்றிலும் தொகுப்பு தரவை நம்பி உருவாக்கப்பட்டது என்றும், அதன் வளர்ச்சிச் செலவு 700,000 அமெரிக்க டாலர்கள் மட்டுமே என்றும் கூறியுள்ளது. இது OpenAI இன் அதே அளவிலான மாதிரியின் எதிர்பார்க்கப்படும் 4.6 மில்லியன் அமெரிக்க டாலர்களை விட மிகக் குறைவு.

இருப்பினும், தொகுப்பு தரவு குறைபாடற்றது அல்ல. தொகுப்பு தரவு மாதிரி செயல்திறனைக் குறைக்கும், அதன் வெளியீடுகளை குறைவான ஆக்கப்பூர்வமாக்கும், மேலும் பாரபட்சங்களை அதிகரிக்கக்கூடும் என்று ஆய்வுகள் காட்டுகின்றன, இது அதன் செயல்பாட்டை பெரிதும் பாதிக்கும். ஏனெனில், மாதிரிகளுக்குப் பயிற்சி அளிக்கப் பயன்படுத்தப்படும் தரவு பாரபட்சங்களையும் வரம்புகளையும் கொண்டிருந்தால், மாதிரி உருவாக்கும் தொகுப்பு தரவும் இந்த சிக்கல்களைப் பெறும்.

தொகுப்பு தரவு ஒரு முக்கியமான தீர்வாக இருந்தாலும், அதன் குறைபாடுகளைக் கவனத்தில் கொள்ள வேண்டியது அவசியம். AI மாதிரிகள் உருவாக்கப்படும் தரவின் தரம் மற்றும் பன்முகத்தன்மையைப் பொறுத்து, தொகுப்பு தரவு வெற்றிகரமான மற்றும் பயனுள்ள தீர்வாக இருக்கும். இந்த காரணத்திற்காக, AI ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்கள் தொகுப்பு தரவை எவ்வாறு பயன்படுத்துவது என்பதைப் பற்றி தொடர்ந்து ஆய்வு செய்து வருகின்றனர். தரவு பற்றாக்குறையைத் தீர்க்கும் அதே வேளையில், அதன் வரம்புகளைக் குறைப்பதற்கான வழிகளைத் தேடுகின்றனர்.

தொகுப்பு தரவு என்பது AI துறையில் ஒரு முக்கிய முன்னேற்றமாகும். இது தரவு பற்றாக்குறையைத் தீர்ப்பதற்கும், AI மாதிரிகளை விரைவாகவும், குறைந்த செலவிலும் உருவாக்கவும் உதவுகிறது. எனினும், தொகுப்பு தரவின் சவால்களைப் புரிந்துகொண்டு, அதற்கான சரியான தீர்வைக் கண்டுபிடிப்பது மிகவும் அவசியம். எதிர்காலத்தில், தொகுப்பு தரவு AI இன் வளர்ச்சிக்கு ஒரு முக்கிய பங்காற்றும் என்று எதிர்பார்க்கப்படுகிறது. மேலும், இது AI மாதிரிகளின் செயல்திறன் மற்றும் நம்பகத்தன்மையை மேம்படுத்த உதவும்.

தொகுப்பு தரவின் பயன்பாடு AI துறையில் ஒரு புதிய சகாப்தத்தை உருவாக்கும். இது AI தொழில்நுட்பத்தின் பரவலான பயன்பாட்டிற்கு வழிவகுக்கும். பல்வேறு துறைகளில் AI இன் பயன்பாட்டை மேம்படுத்துவதற்கும் இது உதவும். இதன் மூலம், மனித வாழ்க்கையை மேம்படுத்தவும், புதிய கண்டுபிடிப்புகளை உருவாக்கவும் முடியும்.

AI பயிற்சிக்குத் தேவையான தரவு குறைந்து வருவதால், தொகுப்பு தரவு ஒரு முக்கியமான தீர்வாக வெளிவருகிறது. மஸ்க் மற்றும் பிற AI நிபுணர்கள் இந்த புதிய பாதையை ஆதரிக்கின்றனர். இது AI இன் எதிர்காலத்தை மாற்றும் என்று நம்புகின்றனர். இந்த மாற்றத்தை எப்படி நாம் கையாள்கிறோம் என்பது, AI இன் எதிர்காலத்தை தீர்மானிக்கும்.

தொகுப்பு தரவு ஒரு சக்திவாய்ந்த கருவியாக இருந்தாலும், அதை பொறுப்புடனும், கவனத்துடனும் பயன்படுத்த வேண்டியது அவசியம். இதன் மூலம், AI தொழில்நுட்பம் மனித குலத்திற்கு பயனுள்ளதாக இருக்கும்.