பகிர்

கன்ட்ரோல்நெட் மற்றும் ஸ்டார்கோடர்: ஜெனரேட்டிவ் ஏஐக்கான ராப்லாக்ஸ் ஆராய்ச்சி முன்னேற்றங்கள்

எழுதியவர் மோர்கன் மெக்வைர், தலைமை விஞ்ஞானி, ராப்லாக்ஸ்

வெளியிடப்பட்டது 5 செப்., 2023

கலைமான் நுண்ணறிவு (AI) உட்பட அனைத்துத் துறைகளிலும், பொறுப்பான மற்றும் சமூக ஈடுபாடுள்ள ஆராய்ச்சியைத் தொடர்வதில் நாங்கள் ஆழ்ந்த அர்ப்பணிப்புடன் இருக்கிறோம். வெளிப்படைத்தன்மை, வெளிப்புற சரிபார்ப்பு மற்றும் ஒத்துழைப்பு மற்றும் நிதியுதவி மூலம் கல்வி நிறுவனங்களுக்கு ஆதரவளித்தல் ஆகியவற்றின் மூலம் இதை நாங்கள் அடைகிறோம். இந்த அணுகுமுறை, எங்கள் மூன்று முக்கியப் பகுதிகளான: உருவாக்கும் AI, தரவு மைய விரிவாக்கம் மற்றும் இணையப் பாதுகாப்பு ஆகியவற்றில் மிகப்பெரிய முன்னேற்றங்களை அடைவதை விரைவுபடுத்த எங்களை அனுமதிக்கிறது. இன்று, எங்களின் இரண்டு ஜெனரேட்டிவ் AI ஆராய்ச்சித் திட்டங்களின் நுண்ணறிவுகளையும் முடிவுகளையும் பகிர்ந்து கொள்கிறோம். கண்ட்ரோல்நெட் என்பது ஒரு திறந்த மூல நியூரல் நெட்வொர்க் ஆகும், இது பட உருவாக்க மாதிரிகளில் நிபந்தனைக் கட்டுப்பாட்டைச் சேர்த்து, மிகவும் துல்லியமான பட வெளியீடுகளை வழங்குகிறது. ஸ்டார்கோடர் என்பது குறியீடு உருவாக்கத்திற்கான ஒரு அதிநவீன திறந்த மூல பெரிய மொழி மாதிரி (LLM) ஆகும்.

இரண்டு திட்டங்களும் கல்வி மற்றும் தொழில் துறைகளின் கூட்டு முயற்சிகளாகும். இரண்டும் எங்கள் படைப்பாளர்களான 3D கலைஞர்கள் மற்றும் நிரலாளர்களுக்காக மிகவும் சக்திவாய்ந்த கருவிகளை உருவாக்குவதில் கவனம் செலுத்துகின்றன. மிக முக்கியமாக, மாற்றத்தை ஏற்படுத்தும் ஆராய்ச்சிகள் மூலம் நீண்டகால நோக்கில் முதலீடு செய்யும் எங்கள் நோக்கத்துடன் இணக்கமாக, இந்தத் திட்டங்கள் பல பயன்பாடுகளுக்கு அடிப்படை அறிவியல் புரிதல் மற்றும் AI-யின் கட்டுப்பாட்டில் முன்னேற்றங்களின் அறிகுறிகளைக் காட்டுகின்றன. இந்தப் பணி ரோப்லாக்ஸ் மற்றும் ஒட்டுமொத்தத் துறையின் எதிர்காலத்தில் குறிப்பிடத்தக்க தாக்கத்தை ஏற்படுத்தும் என்று நாங்கள் நம்புகிறோம், மேலும் இதை வெளிப்படையாகப் பகிர்வதில் பெருமை கொள்கிறோம்.

கன்ட்ரோல்நெட்

சமீபத்திய AI முன்னேற்றங்கள் — குறிப்பாக ஆழமான நரம்பியல் வலையமைப்புகளைப் பயன்படுத்தும் தரவு சார்ந்த இயந்திர கற்றல் (ML) முறைகள் — படைப்பு கருவிகளில் புதிய முன்னேற்றங்களை ஏற்படுத்தியுள்ளன. இந்த முன்னேற்றங்களில், எங்கள் இலவச கருவியான Roblox ஸ்டுடியோவில் பொதுமக்களுக்குக் கிடைக்கும் எங்கள் கோட் அசிஸ்ட் மற்றும் மெட்டீரியல் ஜெனரேட்டர் அம்சங்களும் அடங்கும். நவீன ஜெனரேட்டிவ் AI அமைப்புகளில் மாதிரிகள் எனப்படும் தரவுக் கட்டமைப்புகள் உள்ளன, அவை பில்லியன் கணக்கான பயிற்சி செயல்பாடுகள் மூலம் செம்மைப்படுத்தப்படுகின்றன. இன்றைய மிகவும் சக்திவாய்ந்த மாதிரிகள் பல்முனைத்தன்மை கொண்டவை, அதாவது அவை உரை, படங்கள் மற்றும் ஆடியோ போன்ற ஊடகங்களின் கலவையில் பயிற்சி அளிக்கப்படுகின்றன. இது, வண்ணத் தட்டுகள் அல்லது எழுத்துப்பிழைகள் போன்ற தரவுத் தொகுப்பின் குறிப்பிட்ட கூறுகளுக்கு அதிக முக்கியத்துவம் கொடுப்பதற்குப் பதிலாக, ஊடகங்கள் முழுவதும் உள்ள பொதுவான அடிப்படை அர்த்தங்களைக் கண்டறிய உதவுகிறது.

இந்த புதிய AI அமைப்புகளுக்கு குறிப்பிடத்தக்க வெளிப்பாட்டு சக்தி உள்ளது, ஆனால் அந்த சக்தி பெரும்பாலும் "உந்துதல் பொறியியல்" (prompt engineering) மூலம் வழிநடத்தப்படுகிறது. அவ்வாறு செய்வது என்பது, நீங்கள் எதிர்பார்த்ததைத் திரும்பத் தராதபோது ஒரு தேடுபொறி வினவலைச் செம்மைப்படுத்துவது போல, உள்ளீட்டு உரையை மாற்றுவதைக் குறிக்கிறது. ஒரு வழிகாட்டப்படாத அரட்டைப் பொறி போன்ற ஒரு புதிய தொழில்நுட்பத்துடன் விளையாடுவதற்கு இது ஒரு ஈர்க்கக்கூடிய வழியாக இருந்தாலும், உள்ளடக்கத்தை உருவாக்க இது ஒரு திறமையான அல்லது பயனுள்ள வழி அல்ல. அதற்குப் பதிலாக, யூகங்களுக்குப் பதிலாக சுறுசுறுப்பான கட்டுப்பாட்டின் மூலம் திறம்படப் பயன்படுத்தக்கூடிய சக்திவாய்ந்த கருவிகள் படைப்பாளர்களுக்குத் தேவை.

கண்ட்ரோல்நெட் திட்டம் இந்த சவால்களில் சிலவற்றைத் தீர்ப்பதற்கான ஒரு படியாகும். இது ப்ராம்ப்ட் இன்ஜினியரிங்கைச் சார்ந்திருக்காமல், ஸ்டேபிள் டிஃபியூஷன் போன்ற பெரிய, முன்கூட்டியே பயிற்சி பெற்ற AI மாடல்களின் சக்தியைப் பயன்படுத்த ஒரு திறமையான வழியை வழங்குகிறது. ராபின்ட் ப்ராம்ப்டுகளுக்கு அப்பால், கலைஞர் கூடுதல் உள்ளீட்டு நிபந்தனைகளை வழங்க அனுமதிப்பதன் மூலம் கண்ட்ரோல்நெட் கட்டுப்பாட்டை அதிகரிக்கிறது. ராப்ளாக்ஸ் ஆராய்ச்சியாளரும் ஸ்டான்போர்டு பல்கலைக்கழகப் பேராசிரியருமான மணீஷ் அகர்வாலா மற்றும் ஸ்டான்போர்டு ஆராய்ச்சியாளர் லவ்மின் ஜாங் ஆகியோர் எங்கள் கூட்டு கண்ட்ரோல்நெட் திட்டத்திற்கான இலக்குகளை இவ்வாறு அமைக்கின்றனர்:

உருவாக்கும் AI கருவிகளுக்கான சிறந்த பயனர் இடைமுகத்தை உருவாக்குதல். தெளிவற்ற உந்துதல் கையாளுதலுக்கு அப்பால் சென்று, ஒரு யோசனை அல்லது படைப்புக் கருத்தை வெளிப்படுத்துவதற்கான மிகவும் இயல்பான வழிகளை உருவாக்குதல்.
"ஒரு படத்தைப் போல" அல்லது "ஒரு படத்தின் பாணியில்..." என்பதற்கு அப்பால் சென்று, படைப்பாளியின் மனதில் உள்ள படத்தைத் துல்லியமாக வெளிப்படுத்த, மேலும் துல்லியமான இடஞ்சார்ந்த கட்டுப்பாட்டை வழங்குதல்.
உருவாக்கும் AI பயிற்சியை, விரைவாகச் செயல்படும், குறைந்த நினைவகம் தேவைப்படும், மற்றும் குறைந்த மின் ஆற்றலைப் பயன்படுத்தும் ஒரு கணக்கீட்டுத் திறன்மிக்க செயல்முறையாக மாற்றுதல்.
பட உருவாக்கும் AI-ஐ மீண்டும் பயன்படுத்தக்கூடிய ஒரு தொகுப்பு அலகாக விரிவுபடுத்தவும். பின்னர் அதைத் தரப்படுத்தப்பட்ட பட செயலாக்கம் மற்றும் 3D ரெண்டரிங் குழாய்களுடன் ஒருங்கிணைக்க முடியும்.

இடம் சார்ந்த கட்டுப்பாட்டிற்காக படைப்பாளிகள் ஒரு கூடுதல் படத்தை வழங்க அனுமதிப்பதன் மூலம், கன்ட்ரோல்நெட் இறுதி உருவாக்கப்பட்ட படத்தின் மீது அதிக கட்டுப்பாட்டை வழங்குகிறது. உதாரணமாக, ஏற்கனவே உள்ள உரை-படம் உருவாக்கி ஒன்றில் "கொம்புகளுடன் கூடிய ஆண் மான்" என்ற உரைப்பூர்வக் கட்டளை, கீழே காட்டப்பட்டுள்ளபடி பலதரப்பட்ட படங்களை உருவாக்கியது:

முந்தைய AI தீர்வுகள் மூலம் உருவாக்கப்பட்ட இந்தப் படங்கள் கவர்ச்சிகரமானவை, ஆனால் துரதிர்ஷ்டவசமாக, அவை அடிப்படையில் தன்னிச்சையான முடிவுகளாகும்—அங்கு எந்தக் கட்டுப்பாடும் இல்லை. அந்த முந்தைய படங்களை உருவாக்கும் அமைப்புகளில், உரைப் பிரம்பைத் திருத்துவதைத் தவிர, வெளியீட்டை வழிநடத்த வேறு எந்த வழியும் இல்லை.

கன்ட்ரோல்நெட் மூலம், உருவாக்குநருக்கு இப்போது அதிக அதிகாரம் உள்ளது. கன்ட்ரோல்நெட்டைப் பயன்படுத்துவதற்கான ஒரு வழி, பின்பற்ற வேண்டிய பொதுவான வடிவத்தை தீர்மானிக்க ஒரு உரையாணை மற்றும் ஒரு மூலப் படத்தை வழங்குவதாகும். இந்த நேர்வில், உருவாகும் படங்கள் பன்முகத்தன்மையை வழங்கும், ஆனால் மிக முக்கியமாக, குறிப்பிடப்பட்ட வடிவத்தைத் தக்க வைத்துக் கொள்ளும்:

உருவாக்குபவர் விளிம்புகளின் ஒரு தொகுப்பையும், எந்த உரையிடும் இல்லாமல் ஒரு படத்தையும், அல்லது அமைப்புக்கு வெளிப்பாட்டு உள்ளீட்டை வழங்க பல வழிகளையும் குறிப்பிட்டிருக்கலாம்.

ஒரு கண்ட்ரோல்நெட்டை உருவாக்க, ஒரு பெரிய டிஃப்பியூஷன் மாடலின் நெட்வொர்க்கில் உள்ள எடைகளை இரண்டு பதிப்புகளாகக் குளோன் செய்கிறோம். ஒன்று பயிற்சி செய்யக்கூடிய நெட்வொர்க் (இது கட்டுப்பாட்டை வழங்குகிறது; இதுதான் "கண்ட்ரோல்நெட்") மற்றும் மற்றொன்று பூட்டப்பட்ட நெட்வொர்க். பூட்டப்பட்ட நெட்வொர்க் பில்லியன் கணக்கான படங்களிலிருந்து கற்றுக்கொண்ட திறனைப் பாதுகாக்கிறது மற்றும் அது எந்தவொரு முந்தைய பட ஜெனரேட்டராகவும் இருக்கலாம். பின்னர், கூடுதல் படத்திலிருந்து நிபந்தனைக் கட்டுப்பாட்டைக் கற்றுக்கொள்வதற்காக, பயிற்சி செய்யக்கூடிய நெட்வொர்க்கை பணி-குறிப்பிட்ட தரவுத் தொகுப்புகளில் பயிற்சி செய்கிறோம். பயிற்சி செய்யக்கூடிய மற்றும் பூட்டப்பட்ட பிரதிகளை நாங்கள் பூஜ்ஜிய சுருக்கம் (zero convolution) என்று அழைக்கும் ஒரு தனித்துவமான வகை சுருள் அடுக்கு மூலம் இணைக்கிறோம், இதில் சுருள் எடைகள் கற்றுக்கொண்ட முறையில் பூஜ்ஜியங்களிலிருந்து உகந்த அளவுருக்களாக படிப்படியாக வளர்கின்றன. இதன் பொருள், அவை ஆரம்பத்தில் எந்த தாக்கத்தையும் கொண்டிருக்காது, மேலும் பூட்டப்பட்ட நெட்வொர்க்கில் செலுத்த வேண்டிய உகந்த கட்டுப்பாட்டு அளவை அமைப்பு தன்னிச்சையாகப் பெறுகிறது.

மூடப்பட்ட நெட்வொர்க் வழியாக அசல் எடைகள் பாதுகாக்கப்படுவதால், இந்த மாதிரி பல்வேறு அளவுகளில் உள்ள பயிற்சித் தரவுத் தொகுப்புகளுடன் சிறப்பாகச் செயல்படுகிறது. மேலும், பூஜ்ஜிய கன்வல்யூஷன் அடுக்கு இந்த செயல்முறையை மிகவும் வேகமாக்குகிறது — இது புதிதாக அடுக்குகளைப் பயிற்சி செய்வதை விட, ஒரு டிஃப்பியூஷன் மாதிரியை ஃபைன்-டியூன் செய்வதற்கு நெருக்கமாக உள்ளது.

பட உருவாக்கத்திற்கான இந்த நுட்பத்தை நாங்கள் விரிவாகச் சரிபார்த்துள்ளோம். கன்ட்ரோல்நெட் வெளியீட்டுப் படத்தின் தரத்தை மேம்படுத்துவது மட்டுமல்லாமல், ஒரு குறிப்பிட்ட பணிக்கான நெட்வொர்க்கைப் பயிற்றுவிப்பதையும் மிகவும் திறமையானதாக ஆக்குகிறது, இதனால் எங்கள் மில்லியன் கணக்கான படைப்பாளிகளுக்குப் பெரிய அளவில் பயன்படுத்த இது நடைமுறைக்கு ஏற்றதாகிறது. சோதனைகளில், ஒரு மாடலை முழுமையாக மீண்டும் பயிற்றுவிக்க வேண்டிய மாற்றுச் சூழ்நிலைகளுடன் ஒப்பிடும்போது, கன்ட்ரோல்நெட் 10 மடங்கு வரை செயல்திறன் மேம்பாட்டை வழங்குகிறது. இந்தத் திறன் மிகவும் முக்கியமானது, ஏனெனில் பாரம்பரிய மென்பொருள் உருவாக்கத்துடன் ஒப்பிடும்போது, புதிய மாதிரிகளை உருவாக்கும் செயல்முறை நேரத்தை எடுத்துக்கொள்ளும் மற்றும் அதிக வளங்களைக் கொண்டிருக்கும். பயிற்சியை மேலும் திறமையாக மாற்றுவது மின்சாரத்தைச் சேமிக்கிறது, செலவுகளைக் குறைக்கிறது, மேலும் புதிய செயல்பாடுகளைச் சேர்க்கும் விகிதத்தை அதிகரிக்கிறது.

கன்ட்ரோல்நெட்டின் தனித்துவமான கட்டமைப்பு, அது பல்வேறு அளவுகளில் உள்ள பயிற்சித் தரவுத் தொகுப்புகளுடனும் மற்றும் பல வகையான ஊடகங்களுடனும் சிறப்பாகச் செயல்படுவதை உறுதி செய்கிறது. புகைப்படங்கள், கையால் வரையப்பட்ட கோடுகள், மற்றும் ஓப்பன்போஸ் போஸ் கண்டறிதல் உள்ளிட்ட பல வகையான கட்டுப்பாட்டு முறைகளுடன் கன்ட்ரோல்நெட் செயல்படுவதாக நிரூபிக்கப்பட்டுள்ளது. உருவாக்கும் AI உள்ளடக்கத்திற்காக பல்வேறு வகையான ஊடகங்களில் ControlNet-ஐப் பயன்படுத்த முடியும் என்று நாங்கள் நம்புகிறோம். இந்த ஆராய்ச்சி சமூகத்தின் பரிசோதனைக்கும் மேம்பாட்டிற்கும் திறந்த மற்றும் பொதுவாகக் கிடைக்கிறது, மேலும் இதன் மூலம் நாங்கள் மேலும் கண்டுபிடிப்புகளைச் செய்யும்போது கூடுதல் தகவல்களைத் தொடர்ந்து வழங்குவோம்.

ஸ்டார்கோடர்

படங்கள், ஆடியோ, உரை, நிரல் மூலக் குறியீடு அல்லது வேறு எந்த வடிவிலான செறிவான ஊடகங்களையும் உருவாக்க ஜெனரேட்டிவ் AI-ஐப் பயன்படுத்தலாம். இருப்பினும், வெவ்வேறு ஊடகங்களில், வெளியீடு அகநிலை ரீதியாக மதிப்பிடப்படும் பயன்பாடுகளே மிகப்பெரிய வெற்றிகளைப் பெறுகின்றன. உதாரணமாக, ஒரு படம் ஒரு மனிதப் பார்வையாளரைக் கவரும்போது அது வெற்றி பெறுகிறது. மொத்தப் படமும் ஈர்க்கக்கூடியதாக இருந்தால், விளிம்புகளில் உள்ள விசித்திரமான அம்சங்கள் அல்லது ஒரு கையில் கூடுதல் விரல் போன்ற சில தவறுகள் கவனிக்கப்படாமல் போகலாம். அதேபோல், ஒரு கவிதையில் அல்லது சிறுகதையில் இலக்கணப் பிழைகள் அல்லது சில தர்க்கரீதியான தாவல்கள் இருக்கலாம், ஆனால் அதன் சாராம்சம் ஈர்க்கக்கூடியதாக இருந்தால், நாம் அவற்றை மன்னித்துவிடுகிறோம்.

தனிப்பட்ட அளவுகோல்களைக் கருத்தில் கொள்ள மற்றொரு வழி, முடிவு வெளி தொடர்ச்சியானது என்பதாகும். ஒரு முடிவு மற்றொன்றை விட சிறப்பாக இருக்கலாம், ஆனால் முடிவு முற்றிலும் ஏற்றுக்கொள்ளக்கூடிய அல்லது ஏற்றுக்கொள்ள முடியாத ஒரு குறிப்பிட்ட எல்லை இல்லை. மற்ற துறைகள் மற்றும் ஊடக வடிவங்களில் வெளியீடு புறநிலையாக மதிப்பிடப்படுகிறது. உதாரணமாக, ஒரு ஜெனரேட்டிவ் AI புரோகிராமிங் உதவியாளரால் உருவாக்கப்பட்ட மூலக் குறியீடு சரி அல்லது தவறு. அந்தக் குறியீடு ஒரு சோதனையில் தேர்ச்சி பெற முடியாவிட்டால், அது தோல்வியடைகிறது, அது ஒரு சரியான தீர்வுக்கான குறியீட்டைப் போல இருந்தாலும் கூட. இது ஒரு தனித்தனி முடிவு வெளியாகும். ஒரு தனித்தனி வெளியில் வெற்றி பெறுவது கடினம், ஏனெனில் அளவுகோல்கள் மிகவும் கடுமையானவை மற்றும் ஒருவர் படிப்படியாக ஒரு நல்ல தீர்வை நெருங்க முடியாது—குறியீடு திடீரென்று வேலை செய்யும் வரை அது முற்றிலும் செயலிழந்திருக்கும்.

செயல்முறைப் பயன்பாடுகளுக்குப் பயன்படுத்தப்படும் LLM-கள், அரட்டைப் பொறிகள் போன்ற அகநிலை, தொடர்ச்சியான பயன்பாடுகளுக்கு நன்றாகச் செயல்படுகின்றன. ஆங்கிலம் மற்றும் பிரெஞ்சு போன்ற பல மனித மொழிகளில் உரைநடை உருவாக்கத்திற்கும் அவை நன்றாகச் செயல்படுவதாகத் தெரிகிறது. இருப்பினும், தற்போதுள்ள LLM-கள், மனித மொழிகளுக்குச் செயல்படுவதைப் போலவே நிரலாக்க மொழிகளுக்கும் அவ்வளவு சிறப்பாகச் செயல்படுவதாகத் தெரியவில்லை. குறியீடு என்பது கணிதத்தின் ஒரு வடிவமாகும், இது இயற்கை மொழியை விட அர்த்தத்தை வெளிப்படுத்தும் மிகவும் மாறுபட்ட, புறவயமான வழியாகும். இது தொடர்ச்சியான முடிவு வெளியிடாக இல்லாமல், தனித்தனி முடிவு வெளியீடாகும். Roblox உருவாக்குநர்களுக்காக நிரலாக்க மொழி குறியீடு உருவாக்கத்தில் மிக உயர்ந்த தரத்தை அடைய, இந்த தனித்த, புறவெளி இடத்தில் சிறப்பாகச் செயல்படக்கூடிய LLM-களைப் பயன்படுத்துவதற்கான முறைகள் நமக்குத் தேவை. Lua, JavaScript அல்லது Python போன்ற ஒரு குறிப்பிட்ட மொழி இலக்கணத்தைப் பொருட்படுத்தாமல் குறியீட்டின் செயல்பாட்டை வெளிப்படுத்துவதற்கான வலுவான முறைகளும் நமக்குத் தேவை.

ஸ்டார்கோடர், குறியீடு உருவாக்கத்திற்கான ஒரு புதிய, அதிநவீன திறந்த மூல LLM, இந்த தொழில்நுட்ப சவாலில் ஒரு முக்கிய முன்னேற்றமாகும் மற்றும் அனைவருக்கும் உண்மையாகவே திறந்திருக்கும் ஒரு LLM ஆகும். ஸ்டார்கோடர், கல்வி மற்றும் தொழில்முறை ஆராய்ச்சி ஆய்வகங்களில் இருந்து 600-க்கும் மேற்பட்ட உறுப்பினர்களைக் கொண்ட பிக் கோட் (BigCode) ஆராய்ச்சி கூட்டமைப்பின் ஒரு முடிவாகும். ராப்ளாக்ஸ் ஆராய்ச்சியாளரும், நார்த்ஈஸ்டர்ன் பல்கலைக்கழகப் பேராசிரியருமான அர்ஜுன் குஹா, ஸ்டார்கோடரை உருவாக்க இந்தக் குழுவை வழிநடத்த உதவினார். இந்த முதல் வெளியிடப்பட்ட முடிவுகள், குறியீட்டு அம்சத்தில் மட்டுமே கவனம் செலுத்துகின்றன. அகநிலை முறைகளின் ஒப்பீட்டு வெற்றியைக் கருத்தில் கொள்ளும்போது, இந்தத் துறைக்கு புதிய வளர்ச்சி மிகவும் தேவைப்படும் பகுதி இதுவேயாகும்.

பெரிய AI சூழலமைப்பு மற்றும் Roblox சமூகத்தை ஆதரிக்கும் LLM-கள் மூலம் உருவாக்கும் AI-ஐ வழங்க, பொருத்தமான உரிமம் பெற்ற மற்றும் பொறுப்புடன் சேகரிக்கப்பட்ட தரவுத் தொகுப்புகளில் பிரத்தியேகமாகப் பயிற்சி பெற்ற மாதிரிகள் நமக்குத் தேவை. இவை கட்டுப்பாடற்ற உரிமங்களையும் கொண்டிருக்க வேண்டும், அப்போதுதான் எவரும் அவற்றைப் பயன்படுத்தி, அவற்றின் மீது உருவாக்கி, சூழலமைப்புக்குத் திரும்பப் பங்களிக்க முடியும். இன்று, மிகவும் சக்திவாய்ந்த LLM-கள் தனியுரிமமாக உள்ளன அல்லது வரையறுக்கப்பட்ட வணிகப் பயன்பாடுகளுக்கு உரிமம் பெற்றவை, இது ஆராய்ச்சியாளர்களின் மாதிரியைக் கொண்டு பரிசோதனை செய்யும் திறனைத் தடுக்கிறது அல்லது கட்டுப்படுத்துகிறது. இதற்கு மாறாக, ஸ்டார்கோடர் என்பது தொழில்துறை மற்றும் கல்விசார் ஆராய்ச்சியாளர்களின் கூட்டமைப்பின் மூலம் உருவாக்கப்பட்ட, எந்த அளவிலும் வணிகப் பயன்பாட்டிற்காக கட்டுப்பாடற்ற உரிமம் பெற்ற ஒரு உண்மையான திறந்த மூல மாதிரியாகும். ஸ்டார்கோடர், பொறுப்புடன் சேகரிக்கப்பட்ட, பொருத்தமான உரிமம் பெற்ற உள்ளடக்கத்தில் பிரத்தியேகமாகப் பயிற்றுவிக்கப்படுகிறது. இந்த மாதிரி ஆரம்பத்தில் பொதுக் குறியீட்டில் பயிற்றுவிக்கப்பட்டது, மேலும் தங்கள் குறியீட்டைப் பயிற்சிக்குப் பயன்படுத்த வேண்டாம் என்று விரும்புவோருக்காக ஒரு விலகல் செயல்முறை (opt-out process) உள்ளது.

இன்று, ஸ்டார்கோடர் பைத்தான், சி++, மற்றும் ஜாவா உள்ளிட்ட 86 வெவ்வேறு நிரலாக்க மொழிகளில் செயல்படுகிறது. கட்டுரை வெளியிடப்பட்ட நேரத்தில், இது பல மொழிகளை ஆதரிக்கும் ஒவ்வொரு திறந்த மூல LLM-ஐயும் விட சிறப்பாக செயல்பட்டது மற்றும் பல மூடிய, தனியுரிம மாதிரிகளுடன் போட்டியிடும் அளவிற்கும் இருந்தது.

ஸ்டார்கோடர் LLM என்பது சூழலமைப்புக்கான ஒரு பங்களிப்பு, ஆனால் எங்கள் ஆராய்ச்சியின் நோக்கம் அதைவிட ஆழமானது. இந்த ஆராய்ச்சியின் மிகப்பெரிய தாக்கம், குறியீடு, உரை, படங்கள், பேச்சு, வீடியோ உள்ளிட்ட புற மற்றும் அகப் பலவகை மாதிரிகளின் சொற்பொருள் மாதிரியாக்கலை முன்னெடுத்துச் செல்வது மற்றும் துறை-மாற்ற நுட்பங்கள் மூலம் பயிற்சித் திறனை அதிகரிப்பதாகும். மூல குறியீடு உருவாக்கம் போன்ற புறப் பணிகளுக்கான உருவாக்கும் AI-யின் பராமரிப்புத்திறன் மற்றும் கட்டுப்பாட்டுத்திறன் பற்றிய ஆழமான உள்ளுணர்வுகளையும் நாங்கள் பெறுவோம் என எதிர்பார்க்கிறோம். வளர்ந்து வரும் தொழில்நுட்பத்தின் ஒரு சுவாரஸ்யமான செயல்விளக்கத்திற்கும், அதன் பயனர் சமூகத்திற்கு மதிப்பைக் கொண்டுவரும் பாதுகாப்பான, நம்பகமான மற்றும் திறமையான தயாரிப்புக்கும் இடையே ஒரு பெரிய வேறுபாடு உள்ளது. எங்கள் எம்எல் (ML) மாதிரிகளுக்கு, நினைவகப் பயன்பாடு, ஆற்றல் பாதுகாப்பு மற்றும் செயல்படுத்தும் நேரம் ஆகியவற்றிற்காக செயல்திறனை மேம்படுத்துகிறோம். நாங்கள் ஒரு வலுவான உள்கட்டமைப்பையும் உருவாக்கியுள்ளோம், ஏஐ (AI) மையத்தை அமைப்பின் மற்ற பகுதிகளுடன் இணைக்க மென்பொருளால் அதைச் சூழ்ந்துள்ளோம், மேலும் புதிய அம்சங்கள் சேர்க்கப்படும்போது அடிக்கடி புதுப்பிப்புகளை வழங்க ஒரு தடையற்ற அமைப்பையும் உருவாக்கியுள்ளோம்.

முன்னோடியான தொழில்நுட்பத்தை நோக்கிய எங்கள் பயணத்தில், ராப்லாக்ஸின் விஞ்ஞானிகள் மற்றும் பொறியாளர்களை அறிவியல் சமூகத்தின் மிகச் சிறந்த சில சிந்தனையாளர்களுடன் ஒன்றிணைப்பது ஒரு முக்கிய அங்கமாகும். இந்த ஆரம்ப முடிவுகளைப் பகிர்வதில் நாங்கள் பெருமிதம் கொள்கிறோம், மேலும் ஆராய்ச்சி சமூகத்தை எங்களுடன் ஈடுபட்டு இந்த முன்னேற்றங்களை அடிப்படையாகக் கொண்டு மேலும் உருவாக்க அழைக்கிறோம்.

சமீபத்தியது

மேலும் முடிவுகள்

கன்ட்ரோல்நெட் மற்றும் ஸ்டார்கோடர்: ஜெனரேட்டிவ் ஏஐக்கான ராப்லாக்ஸ் ஆராய்ச்சி முன்னேற்றங்கள்

கன்ட்ரோல்நெட்

ஸ்டார்கோடர்

கன்ட்ரோல்நெட் மற்றும் ஸ்டார்கோடர்: ஜெனரேட்டிவ் ஏஐக்கான ராப்லாக்ஸ் ஆராய்ச்சி முன்னேற்றங்கள்

கன்ட்ரோல்நெட்

ஸ்டார்கோடர்

பொறியியல்

Roblox-இல் விளையாட்டுக்குள்ளான புகாரளிப்பு எவ்வாறு செயல்படுகிறது

பொறியியல்

22 புதிய மொழிகள் மற்றும் கூர்மையான கண்டறிதல் திறன்களுடன் எங்கள் வாய்ஸ் சேஃப்டி கிளாசிஃபையரை மேம்படுத்துதல்

செய்திகள்

ராப்ளாக்ஸ் ரியாலிட்டி தொலைநோக்குப் பார்வையை விரைவுபடுத்த முன்னோடி AI நிறுவனர்கள் இணைகின்றனர்