இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content

பெரும் அளவில் உள்ளடக்கத்தை நெறிப்படுத்த ரோப்லாக்ஸ் AI-ஐ எவ்வாறு பயன்படுத்துகிறது

25 மொழிகளில், ஒரு நாளைக்கு பில்லியன் கணக்கான உள்ளடக்கங்களை நிகழ்நேரத்தில் நெறிப்படுத்துதல்

  • Roblox-இல் வெளியிடப்படும் உள்ளடக்கத்தை முன்கூட்டியே நெறிப்படுத்த, நாங்கள் சுமார் ஐந்து ஆண்டுகளாக AI-ஐப் பயன்படுத்தி விரிவாக்கக்கூடிய அமைப்புகளை உருவாக்கி வருகிறோம்.
  • இன்று, எங்கள் உள்கட்டமைப்பு, இயந்திர கற்றல் மாதிரிகள் மற்றும் ஆயிரக்கணக்கான மனித வல்லுநர்கள் இணைந்து, எங்கள் பயனர்களுக்கு ரோப்லாக்ஸை ஒரு பாதுகாப்பான, மேலும் நாகரிகமான இடமாக மாற்ற உதவுகின்றன.
  • இந்த அமைப்புகள் அனைத்தையும் நாங்கள் அளவிடுதல், வேகம் மற்றும் உயர்தரத் தரவுகளுடன் தொடர்ச்சியான மேம்பாட்டிற்காக உருவாக்குகிறோம்.

ராப்ளக்ஸில் நாங்கள் செய்யும் அனைத்திற்கும் பாதுகாப்பு என்பது அடித்தளமாகும். ஆரம்பத்திலிருந்தே, பயனர் உருவாக்கிய உள்ளடக்கத்தின் மீது கட்டமைக்கப்பட்ட ஒரு தளத்திற்கு நெறிப்படுத்தல் மிகவும் முக்கியமானது என்பதை நாங்கள் அறிந்திருந்ததால், உள்ளடக்கத்தை நாங்கள் முன்கூட்டியே நெறிப்படுத்தி வருகிறோம். ராப்ளக்ஸ் கணிசமாக சிறியதாக இருந்தபோது, எங்கள் நிறுவனரும் தலைமைச் செயல் அதிகாரியுமானவர் உட்பட மனித மதிப்பாய்வாளர்கள் இதைச் செய்தனர்; அவரும் ஆரம்பத்தில் உள்ளடக்கத்தை நெறிப்படுத்த நேரம் செலவிட்டார். காலப்போக்கில், இந்தத் தளம் (அளவு மற்றும் வேகம் இரண்டிலும்) மனிதத் தணிக்கையாளர்களின் திறனைத் தாண்டி வளர்ந்தது. எந்தவொரு புதிய தயாரிப்பைத் தொடங்கும்போதும், பாதுகாப்பு எப்போதும் நாங்கள் கருத்தில் கொள்ளும் முதல் அம்சமாகும்.

சராசரியாக 97.8 மில்லியன் தினசரி செயலில் உள்ள பயனர்கள்¹ விளையாட, தொடர்பு கொள்ள மற்றும் உருவாக்க ராப்ளக்ஸுக்கு வருகிறார்கள். ஒவ்வொரு நாளும், பயனர்கள் 28 வெவ்வேறு மொழிகளில் சராசரியாக 6.1 பில்லியன் அரட்டை செய்திகளையும் 1.1 மில்லியன் மணிநேர குரல் உரையாடலையும் அனுப்புகிறார்கள். உருவாக்குநர்கள் ஒரு நாளைக்கு மில்லியன் கணக்கான சொத்துக்களைப் பதிவேற்றுகிறார்கள்—மேலும் ஆயிரக்கணக்கான பொருட்கள் எங்கள் அவதார் சந்தையில் சேர்க்கப்படுகின்றன. இந்தப் பில்லியன் கணக்கான படைப்புகள் மற்றும் செய்திகளில் பெரும்பாலானவை நாகரிகமானவை. நிஜ உலகத்தைப் போலவே—இதுதான் பெரும்பாலான மக்கள் ஒருவருக்கொருவர் தொடர்பு கொள்ளும் வழியாகும். ஆனால் அது இல்லாதபோது, எங்கள் உரை வடிகட்டுதல் அமைப்பு சிக்கலான உரைகளைப் பயனர்களைச் சென்றடைவதற்கு முன்பு தடுக்க உதவுகிறது, மேலும் குரல் மீறல்கள் நிகழ்நேரத்தில் மதிப்பீடு செய்யப்படுகின்றன. மேலும், சட்டவிரோத உள்ளடக்கம் குறித்த அறிவிப்பை நாங்கள் பெற்றால், நடவடிக்கை எடுப்பதற்கான எங்கள் இடைநிலை நேரம் பத்து நிமிடங்கள் ஆகும்.

நொடிப்பொழுதில் இந்த அளவிலான உள்ளடக்கத்தைத் தொடர்ந்து நெறிப்படுத்துவது என்பது, நம்மிடம் எத்தனை பேர் இருந்தாலும், மனிதர்களால் தனியாகச் செய்ய முடியாத ஒரு வேலை. இந்த அளவு மற்றும் வேகத்தில் செயல்பட, வார இறுதி அல்லது விடுமுறைகள் இல்லாமல், 24/7 வேலை செய்யும் லட்சக்கணக்கான மனித நெறிப்படுத்துபவர்கள் தேவைப்படுவார்கள்—அதுவும் அரட்டை செய்திகளை நெறிப்படுத்துவதற்கு மட்டுமே. Roblox-இல் உள்ள மற்ற அனைத்து உள்ளடக்க வகைகளையும் நெறிப்படுத்த எங்களுக்கு ஆயிரக்கணக்கானோர் தேவைப்படுவார்கள். Roblox-இல் தினசரி உருவாக்கப்படும் உள்ளடக்கத்தின் அளவு, விரிவாக்கக்கூடிய உள்கட்டமைப்பு, இயந்திர கற்றல் (ML) மாதிரிகள் மற்றும் பிரத்யேகமாக உருவாக்கப்பட்ட கருவிகளைக் கோருகிறது. 

எம்.எல் (ML) இந்த முடிவுகளை மில்லிவினாடிகளில், மீண்டும் மீண்டும், சீராகவும், ஒரு நாளைக்கு 24 மணி நேரமும் எடுக்க முடியும். சூழலைப் பொறுத்து ஆழமான, நுணுக்கமான மனிதத் தீர்ப்பு தேவைப்படும் அரிதான நிகழ்வுகளைக் கையாள, நாங்கள் இன்னும் மனிதர்களைப் பணியமர்த்துகிறோம். புதிய மற்றும் வளர்ந்து வரும் சவால்களைச் சமாளிக்க, வலுவான, புதுமையான பாதுகாப்பு மற்றும் தணிக்கைக் கருவிகளை, உலகெங்கிலும் உள்ள ஆயிரக்கணக்கான மனித நிபுணர்களுடன் இணைத்து, எங்கள் அமைப்புகளுக்கு அவர்கள் மேற்பார்வையையும் தொடர்ச்சியான பயிற்சியையும் வழங்குகிறோம். ரோப்லாக்ஸின் அனைத்து தணிக்கை அமைப்புகளும் பின்வரும் கொள்கைகளை அடிப்படையாகக் கொண்டவை: 

  • நாங்கள் ரோப்ளக்ஸில் உள்ளடக்கத்தை முன்கூட்டியே தணிக்கை செய்கிறோம்.
  • பெரும்பாலும் மக்களுக்கு விதிகள் தெரியாததால், முடிந்தவரை பயனர்களுக்கு நிகழ்நேரத் பின்னூட்டத்தை நாங்கள் வழங்குகிறோம்.
  • மிகப் பெரிய அளவில் மனிதர்களை விட துல்லியம் மற்றும் மீட்டெடுத்தல் ஆகிய இரண்டிலும் AI கணிசமாக அதிகமாகச் செயல்படும்போது மட்டுமே நாங்கள் அதைப் பயன்படுத்துகிறோம். 
  • தொடர்ச்சியாக AI-ஐ மேம்படுத்துவதற்கும், உருவாகி வரும் மற்றும் அரிதான நிகழ்வுகளுக்கும், சிக்கலான விசாரணைகளுக்கும், மற்றும் மேல்முறையீடுகளுக்கும் நாங்கள் மனிதர்களைப் பயன்படுத்துகிறோம். 

Roblox-இல் உருவாக்கப்படும் அதிகரித்து வரும் உள்ளடக்கத்தை திறமையாக நெறிப்படுத்த, நாங்கள் எப்போதும் அளவு, வேகம் மற்றும் தரம் ஆகிய மூன்று பரிமாணங்களில் புதுமைகளைப் புகுத்துகிறோம், மேலும் இதற்கு தொடர்ச்சியான மேம்பாடு தேவைப்படுகிறது.

அளவு: ஒரு நாளைக்கு பில்லியன் கணக்கான உள்ளடக்கப் பகுதிகளை நிர்வகித்தல்

பிப்ரவரி முதல் டிசம்பர் 2024 வரை, பயனர்கள் தோராயமாக 1 டிரில்லியன் உள்ளடக்கங்களைப் பதிவேற்றினர். பில்லியன் கணக்கான அந்த உரை அரட்டைகள், ஆடியோ, குரல் மற்றும் படங்களில், 0.01% மட்டுமே எங்கள் கொள்கைகளை மீறியதாகக் கண்டறியப்பட்டது. மேலும், எங்கள் கொள்கைகளை மீறிய கிட்டத்தட்ட அனைத்து உள்ளடக்கங்களும், பயனர்கள் அதைப் பார்ப்பதற்கு முன்பே தானாகவே முன்கூட்டியே தணிக்கை செய்யப்பட்டு நீக்கப்பட்டன. இந்த அளவு ஒப்பீட்டளவில் புதியது என்றாலும், தணிக்கையில் எங்கள் அர்ப்பணிப்பு புதியதல்ல. ஒரு தசாப்தத்திற்கு முன்பு, நாங்கள் விதிகளை அடிப்படையாகக் கொண்ட ஒரு உரை வடிப்பானை உருவாக்கினோம். சுமார் ஐந்து ஆண்டுகளுக்கு முன்பு, அப்போது அதிநவீனமாக இருந்த ஒரு டிரான்ஸ்ஃபார்மர் அடிப்படையிலான உரை வடிப்பானை நாங்கள் பயன்படுத்தினோம். இன்று, எங்கள் உரை வடிப்பான்கள் ஒரு நாளைக்கு சராசரியாக 6.1 பில்லியன் அரட்டை செய்திகளைச் செயலாக்குகின்றன, இவை வெவ்வேறு வகையான கொள்கை மீறல்களுக்காக பிரத்யேகமாக உருவாக்கப்பட்ட பல மாதிரிகளால் இயக்கப்படுகின்றன.

இவற்றில் ஒரு மாதிரி, விளையாட்டுக்குள்ளும் மற்றும் தள அரட்டைகளிலும் உள்ள தனிப்பட்ட அடையாளத் தகவல்களுக்கான (PII) எங்கள் வடிப்பான் ஆகும். பயனர்கள் மற்றவர்களிடம் PII-ஐக் கேட்பது என்பது மேலும் கடுமையான சிக்கல்களுக்கான முதல் படியாக இருக்கலாம், எனவே PII பகிரப்படுவதைத் தடுப்பதில் நாங்கள் எப்போதும் ஒரு வலுவான நிலைப்பாட்டை எடுத்துள்ளோம். அனுப்பப்படும் ஒவ்வொரு அரட்டை செய்தியும் ஒரு "கோரிக்கை" ஆகும், இது ஏதேனும் PII குறிப்பிடப்பட்டுள்ளதா என்பதை மதிப்பாய்வு செய்து தீர்மானிக்குமாறு அமைப்பைக் கேட்கிறது. இந்த உரை வடிப்பான் மாதிரி வினாடிக்கு பல கோரிக்கைகளை (RPS) கையாண்டதால், எங்கள் தற்போதைய சிபியு-அடிப்படையிலான சர்விங் ஸ்டேக்கில் அதை ஆதரிப்பது கடினமாகிவிட்டது. எனவே, எங்கள் செல்லுலார் உள்கட்டமைப்பைப் பயன்படுத்தி, ஜிபியு-களில் முற்றிலும் புதிய சர்விங் ஸ்டேக்கை உருவாக்கினோம். இந்த அதிக RPS தேவைகளை ஆதரிப்பதற்காக, நாங்கள் முதலில் டோக்கனைசேஷனை இன்ஃபர்ன்ஸிலிருந்து பிரித்தோம், பின்னர் பெரிய மாடல்களின் குவாண்டைசேஷன் மற்றும் டிஸ்டில்லேஷன் மூலம் இன்ஃபர்ன்ஸை விரைவுபடுத்தினோம். ஒட்டுமொத்தமாக, இந்த மேம்பாடுகள் எங்கள் RPS-ஐ நான்கு மடங்காக அதிகரித்துள்ளன. 

புதிய ஸ்டேக்கில், PII ஃபில்டர் இப்போது உச்சக்கட்டத்தில் 370,000 RPS-ஐக் கையாளுகிறது. எங்களின் மேம்படுத்தப்பட்ட PII ஃபில்டர் தவறான நேர்மறை முடிவுகளை 30% குறைத்துள்ளது, இது ஆதரிக்கப்படும் அனைத்து மொழிகளிலும் அமைப்பால் தானாகவே கண்டறியப்பட்ட PII குறிப்புகளில் 25% அதிகரிப்புக்கு வழிவகுத்துள்ளது. இந்த மேம்பாட்டை ஏற்கனவே பல பிற மொழிகளில் வெளியிடுவதற்கும், மற்ற உரை வடிப்பான்கள் மற்றும் தளங்களில் இதேபோன்ற மேம்பாடுகளைக் கொண்டுவருவதற்கும் நாங்கள் பணியாற்றி வருகிறோம். இந்த மேம்பாடுகளில் நாங்கள் பெருமைப்பட்டாலும், தனிப்பட்ட அடையாளத் தகவலைப் பகிர்வதற்கான முறைகள் எப்போதும் உருவாகி வருகின்றன என்பதும், இந்த மாற்றங்களுடன் எங்கள் அமைப்புகளையும் நாங்கள் மேம்படுத்தி வருகிறோம் என்பதும் எங்களுக்குத் தெரியும். 

எங்கள் முழுமையான தணிக்கை அமைப்பின் அடிப்படையாக, பல்வேறு வழிமுறைகள் குறித்த அறிவுடன் கூடிய பெரிய, டிரான்ஸ்ஃபார்மர் அடிப்படையிலான மாதிரிகள் உள்ளன. செயல்பாட்டு மற்றும் உற்பத்தித் தேவைகளைப் பொறுத்து, அமைப்பை வேகமாகவும் திறமையாகவும் வைத்திருக்க இந்த மாதிரிகளை நாங்கள் சுருக்கி, அளவீட்டுக்குட்படுத்துகிறோம். பல்வேறு வகையான பல்வழிமுறை மாதிரிகளை இயக்குவதற்கு இந்த நுட்பங்கள் அவசியமானவை; எங்கள் உரை வடிகட்டிகளை நிர்வகிக்கும் மாதிரிகள் இப்போது 750,000 RPS-க்கு மேல் திறமையாகக் கையாள்கின்றன. 

வேகம்: நிகழ்நேரப் பின்னூட்டத்தின் மூலம் பயனர் நடத்தை மாற்றம்

இயல்பான, நிகழ்நேரத் தொடர்புக்கு உரையாடல் தொடர்ந்து நடைபெற உடனடி வடிகட்டுதல் தேவைப்படுகிறது. யோசனைகளை மீண்டும் மீண்டும் மேம்படுத்துவதற்கும், ஒத்துழைப்பதற்கும் படைப்பாற்றல் தொடர்ந்து வெளிப்பட விரைவான பின்னூட்டம் தேவைப்படுகிறது. எங்கள் பல அடுக்கு பாதுகாப்பு அமைப்பில் எச்சரிக்கை அறிவிப்புகள், இடைவெளிகள், மற்றும் இடைநிறுத்தங்கள் போன்ற முன்முயற்சி நடவடிக்கைகள் அடங்கும். உரையை வடிகட்டும் போது, PII, தகாத வார்த்தைகள், மற்றும் வெறுப்புப் பேச்சு போன்ற கொள்கையை மீறும் சொற்களை மில்லிவினாடிகளுக்குள் நிகழ்நேரத்தில் தடுக்க எங்களால் முடியும், இதன் மூலம் பயனர்கள் பொருத்தமற்ற உள்ளடக்கத்திற்கு ஆளாகாமல் தடுக்கப்படுகிறார்கள். 

குரல் தகவல்தொடர்புகளை அதே வழியில் தடுக்க முடியாது, எனவே திரை அறிவிப்புகள் மூலம் பயனர்களுக்கு நாங்கள் கல்வி கற்பிக்கிறோம். எங்கள் எச்சரிக்கை அறிவிப்புகள் பயனர் நடத்தைக்குத் திறம்பட மாற்றம் கொண்டு வந்து, நாகரிகத்தையும் ஈடுபாட்டையும் அதிகரித்துள்ளன. எங்கள் குரல் பாதுகாப்பு வகைப்படுத்தி, எட்டு மொழிகளில் 15 வினாடிகளுக்குள் அரட்டைகளை நெறிப்படுத்துகிறது. தொழில்துறையுடன் பாதுகாப்பு புதுமைகளைப் பகிர்வதற்கான எங்கள் பரந்த அர்ப்பணிப்பின் ஒரு பகுதியாக, இந்த மாதிரியை நாங்கள் திறந்த மூலமாகவும் வெளியிட்டுள்ளோம்.

எந்தக் கொள்கைகளை அவர்கள் மீறுகிறார்கள் என்பதைப் புரிந்துகொள்ள அறிவிப்புகள் பயனர்களுக்கு உதவுகின்றன, மேலும் அமைப்பின் முடிவை மேல்முறையீடு செய்ய ஒரு வாய்ப்பையும் வழங்குகின்றன.

ஒரு பயனர் எங்கள் கொள்கைகளைத் தொடர்ந்து மீறினால், அதன் விளைவுகள், ஒரு சிறிய எச்சரிக்கை முதல் குரல் அரட்டைக்கான அணுகலை இழப்பது வரை, படிப்படியாகக் கடுமையாகின்றன. இடைநீக்கங்கள் அதன் பிறகு மூன்று வாரங்கள் வரை தாக்கத்தை ஏற்படுத்துவதாகவும், மீண்டும் தவறு செய்யும் விகிதங்களையும் சமர்ப்பிக்கப்படும் பயனர் புகார்களின் எண்ணிக்கையையும் குறைப்பதாகவும் உள் ஆராய்ச்சி காட்டுகிறது. இந்த வகையான உடனடித் தலையீடுகள் மற்றும் விளைவுகள் நாகரிகத்தில் ஒரு நேர்மறையான விளைவைக் கொண்டிருப்பதாக ஆரம்பகட்ட சோதனைகள் காட்டியுள்ளன. எங்கள் குரல் வகைப்படுத்தியின் சமீபத்திய பதிப்பு, எங்கள் ஆரம்பப் பதிப்பை விட 92% அதிக மீட்டெடுப்பு விகிதத்தையும், 1% தவறான நேர்மறை விகிதத்தையும் கொண்டுள்ளது—மேலும் இது உச்சத்தில், நிமிடத்திற்கு 8,300 வரையிலான கோரிக்கைகளைக் கையாள்கிறது. துல்லியம் மற்றும் மீட்டெடுப்பு ஆகிய இரண்டையும் மேம்படுத்துவதற்கான கூடுதல் வழிகளை நாங்கள் தொடர்ந்து ஆராய்ந்து வருகிறோம்.

குரல் அரட்டையில் அறிவிப்புகளால் கிடைத்த வெற்றியின் அடிப்படையில், உரை அரட்டைக்கும் நிகழ்நேரத் பின்னூட்டத்தைச் செயல்படுத்தத் தொடங்கியுள்ளோம். சமீபத்திய சோதனைகளில், அனுபவத்திற்குள்ளேயே உரை அரட்டை அறிவிப்புகளை வெளியிடுவதும், நேர வரம்புகளை அமைப்பதும், வடிகட்டப்பட்ட அரட்டைச் செய்திகளில் 5% குறைவையும், தவறான பயன்பாட்டு அறிக்கைகளிலிருந்து ஏற்படும் விளைவுகளில் 6% குறைவையும் ஏற்படுத்தியதாகக் கண்டறிந்தோம். படைப்பாளர்கள் தங்கள் படைப்புகளைப் பதிவேற்றும்போது அவர்களுக்கு நிகழ்நேரத் பின்னூட்டத்தை வழங்கி சோதனை செய்வதையும் நாங்கள் தொடங்கியுள்ளோம்.

தரத் தரம்: தொடர்ச்சியான மேம்பாட்டிற்கான பயிற்சி மாதிரிகள்

குறைவான தவறான எதிர்மறைகளைக் குறைப்பதற்காக இந்த அமைப்புகளை நாங்கள் பயிற்சி செய்கிறோம்—அதாவது கொள்கை மீறலைக் கொண்டிருக்கக்கூடிய எதையும் நீக்கும் பக்கம் தவறு செய்வதை நாங்கள் விரும்புகிறோம். பயனர்கள் ஒரு விஷயம் விதிமுறைகளுக்கு இணக்கமானது என்று நம்பும்போது, அது நீக்கப்படுவது அவர்களுக்கு ஏமாற்றமளிக்கிறது என்பதும் எங்களுக்குத் தெரியும். எனவே, தவறான நேர்மறைகளையும் குறைப்பதற்காக எங்கள் அமைப்புகளை நாங்கள் தொடர்ந்து மேம்படுத்துகிறோம். எங்கள் அனைத்து வகைப்படுத்திகளுக்கும் துல்லியத்தை மேம்படுத்துவதற்கு சரியாக லேபிளிடப்பட்ட தரவு அவசியமானது. 

வலிமையான பயிற்சி மற்றும் மதிப்பீட்டுத் தரவுத்தொகுப்புகளை உருவாக்க, போதுமான உயர்தர எடுத்துக்காட்டுகளும், அவற்றைத் துல்லியமாகக் குறியிட மனித வல்லுநர்களும் தேவை. இது ஒரு அரிதான நிகழ்வு அல்லது ஒரு விளிம்புநிலை வழக்கு என்பதால், எங்களிடம் போதுமான தரவுகள் இல்லாத சந்தர்ப்பங்களும் உள்ளன. சில நேரங்களில் எங்களிடம் அதிகப்படியான தரவுகள் இருக்கும், மேலும் மிகவும் பயனுள்ள எடுத்துக்காட்டுகளைக் கண்டறிய வேண்டும். மேலும், ரோப்லாக்ஸில் உண்மையில் என்ன நடக்கிறதோ அதற்குப் பொருந்தக்கூடிய தரவுகள் எங்களுக்குத் தேவை. அதில், வட்டார வழக்கு அல்லது மீம்கள் போன்ற தற்காலிக எடுத்துக்காட்டுகளும் அடங்கும். குழந்தைகள், பதின்ம வயதினர் மற்றும் விளையாட்டாளர்களைக் கொண்ட எங்கள் பயனர் சமூகம், எப்போதும் புதிய பேச்சு வழக்குகள், புதிய போக்குகள் மற்றும் எங்கள் நெறிப்படுத்தல் கருவிகளைத் தவிர்ப்பதற்கான புதிய வழிகளை எங்களுக்கு அறிமுகப்படுத்துகிறார்கள். அவர்கள் எங்களை எப்போதும் விழிப்புடன் வைத்திருக்கிறார்கள், அதனால்தான் நாங்கள் எங்கள் நெறிப்படுத்தல் கருவிகள் மற்றும் கொள்கைகள் இரண்டையும் தொடர்ந்து சோதித்து மதிப்பிடுகிறோம். 

இந்த தரவுத்தொகுப்புகளைத் தொகுக்க நாங்கள் பல்வேறு மாதிரி உத்திகளைப் பயன்படுத்துகிறோம், மேலும் இந்த தரவு எடுத்துக்காட்டுகளை உருவாக்கவும் லேபிளிங் செய்யவும் AI மற்றும் மனித வல்லுநர்கள் இரண்டையும் பயன்படுத்துகிறோம். எங்கள் கொள்கை வல்லுநர்கள் எடுத்துக்காட்டுகளைக் கையால் தொகுக்கிறார்கள், அதை நாங்கள் 'கோல்டன் செட்' (golden set) என்று அழைக்கிறோம். இவை, அமைப்பு கண்டறிய நாங்கள் விரும்பும் சிக்கல்களுடன் மிகவும் நெருக்கமாகப் பொருந்தும் எடுத்துக்காட்டுகள் ஆகும். நாங்கள் மிகப்பெரிய தரவுத்தொகுப்புகளிலிருந்து பல மாதிரி உத்திகளைப் பயன்படுத்தி மாதிரிகளை எடுக்கிறோம், இதில் நிச்சயமற்ற தன்மை மாதிரியெடுத்தல் (uncertainty sampling) அடங்கும், இதன் மூலம் முன்பு மாடல் குழப்பமடைந்த விளிம்புநிலை நிகழ்வுகளிலிருந்து (edge cases) நாங்கள் மாதிரிகளை எடுக்கிறோம். எங்களுக்கு மனித வல்லுநர்கள் மற்றும் AI-உதவி சிவப்பு அணிகளிடமிருந்து (AARTs பற்றி மேலும்) மாதிரிகள் கிடைக்கின்றன, அவர்கள் பலவீனங்களை ஆராய்வதற்காக எதிர்வினைத் தாக்குதல்களைப் போலச் செய்து அமைப்பைச் சோதிக்கிறார்கள். 

புதிய சிக்கல்கள், வழக்குச் சொற்கள், மீம்கள் போன்றவற்றைக் கண்டறியும்போது, எங்கள் பயிற்சித் தொகுப்புகளையும் நாங்கள் விரிவுபடுத்தி மேம்படுத்துகிறோம். பயனர்கள் கூடுதல் மதிப்பாய்வைக் கோரக்கூடிய எங்கள் மேல்முறையீட்டு செயல்முறை மூலம் இந்த எடுத்துக்காட்டுகளில் சிலவற்றைப் பெறுகிறோம். முடிவின் மீது மேல்முறையீடு வெற்றி பெற்றால், அந்த எடுத்துக்காட்டு எங்கள் தரவுத்தொகுப்பில் சேர்க்கப்பட்டு, அடுத்த முறை எங்கள் அமைப்பு சரியாகச் செயல்பட உதவுகிறது. 

மற்றவற்றை எங்கள் வலுவான துஷ்பிரயோக அறிக்கை அமைப்பிலிருந்து பெறுகிறோம், இது இந்த அனுபவங்கள் மற்றும் சமூகத்தைப் பற்றி அக்கறை கொண்ட கோடிக்கணக்கான பயனர்களை உள்ளடக்கிய எங்கள் மனித மத்தியஸ்தர்களின் குழுவை திறம்பட விரிவுபடுத்துகிறது. பயனர்கள் அவதாரம் மற்றும் பொருள் ஐடி-கள் உட்பட ஒரு முழு காட்சியையும் படம்பிடித்து, தாங்கள் புகாரளிக்க விரும்பும் பகுதியை முன்னிலைப்படுத்தும் விருப்பத்தை வழங்கும் வகையில் எங்கள் அறிக்கை கருவியை சமீபத்தில் மேம்படுத்தியுள்ளோம். தகுதியான அறிக்கைகளில் சுமார் 15% அறிக்கைகளில் பயனர்கள் காட்சிக்குறிப்புகளை வழங்குவதால், பயனர்கள் அடிக்கடி கவலைகளைத் தெரிவிக்கும் சிக்கலான அனுபவங்களை முன்கூட்டியே கண்டறிய இந்த கூடுதல் சூழல் எங்களுக்கு உதவுகிறது. மாதிரிப் பயிற்சி உடனடியாக நடப்பதில்லை என்பதால், எங்கள் பதிலளிப்பு வேகத்தை அதிகரிக்க, பயனர் அறிக்கைகளிலிருந்து தானாகவே செயற்கை நுண்ணறிவு அடிப்படையிலான விதிகளை உருவாக்குவதையும் நாங்கள் ஆராய்ந்து வருகிறோம். 

A interface do usuário do relatório de experiência agora permite que os usuários destaquem o que desejam relatar (ou seja, o círculo verde ao redor do avatar do pato).

நாங்கள் இந்தத் தரவுத்தொகுப்புகளுடன் செயற்கைத் தரவைச் சேர்க்கிறோம், இதில் பெரிய மொழி மாதிரிகள் (LLMs) உண்மையான உலக எடுத்துக்காட்டுகளைப் பிரதிபலிக்கும் செயற்கைத் தரவு எடுத்துக்காட்டுகளையும் லேபிள்களையும் உருவாக்குகின்றன. இங்குள்ள நன்மை என்னவென்றால், ஒரு அரிதான அல்லது விளிம்புநிலை நிகழ்வுக்காகக் கூட, மில்லியன் கணக்கான எடுத்துக்காட்டுகளையும் லேபிள்களையும் உருவாக்கும் திறன் உள்ளது. எங்களிடம் போதுமான லேபிளிடப்பட்ட தரவு கிடைத்தவுடன், அதை இரண்டு தரவுத்தொகுப்புகளாகப் பிரிக்கிறோம்: ஒன்று பயிற்சிக்கும் மற்றொன்று மதிப்பீட்டிற்கும். ஒரு வலுவான மதிப்பீட்டுத் தரவுத்தொகுப்பைக் கொண்டிருப்பது மிகவும் முக்கியம்: ஒரு மதிப்பீட்டுத் தொகுப்பு மிகவும் எளிதாக இருந்தால், மாதிரியின் அளவீடுகள் அது நன்றாக வேலை செய்வதாகத் தோன்றும்—ஆனால் அது உற்பத்தியில் செயலிழந்துவிடும். தரவின் அளவை விட அதன் துல்லியமே மிகவும் முக்கியமானது. தரவுத்தொகுப்பில் உள்ள தரவுகளின் தரம், செயற்கை நுண்ணறிவு மாதிரியின் செயல்திறனைப் பெரிதும் பாதிக்கும் என்பதால், 'தரமற்ற தரவு உள்ளிடப்பட்டது, தரமற்ற தரவு வெளியிடப்பட்டது' என்பது ஒரு உண்மையான கவலையாகும். 

எங்களிடம் ஒரு வலுவான மதிப்பீட்டுத் தரவுத்தொகுப்பு கிடைத்தவுடன், அதை இரண்டு முக்கிய அளவீடுகளின் அடிப்படையில் மதிப்பிடுகிறோம்: சீரமைப்பு மற்றும் தரம். சீரமைப்பைச் சோதிக்க, அதே எடுத்துக்காட்டுகள் பல மனிதர்களுக்குக் குறியிட அனுப்பப்பட்டு, அவர்களின் குறியீடுகள் ஒப்புக்கொள்கின்றனவா (அல்லது சீரமைக்கப்பட்டுள்ளனவா) என்று பார்க்கப்படுகிறது. அவர்களின் குறியீடுகளுக்கு இடையே சீரமைப்பு 80% அல்லது அதற்கு மேல் இருந்தால், எங்கள் நெறிப்படுத்துபவர்கள் பெரிய அளவில் சீரான முடிவுகளை எடுக்க முடியும் என்று அர்த்தம். அது 80% க்கும் குறைவாக இருந்தால், கொள்கை அல்லது பயிற்சி குழப்பமாக இருக்கலாம், மேலும் நாங்கள் மீண்டும் மீண்டும் செய்ய வேண்டும். தரத்தைச் சோதிக்க, கொள்கையை மீறுகிறதா இல்லையா என்பதை மதிப்பிடுவதற்காக, 'கோல்டன் செட்'-ஐ மனிதர்களுக்கு அனுப்புகிறோம், மேலும் அவர்கள் சரியான முடிவை எடுக்கிறார்களா என்பதை உறுதிசெய்கிறோம். நிபுணர்கள் மதிப்பாய்வு செய்வதற்காக முடிவுகளின் மாதிரிகளையும் நாங்கள் எடுக்கிறோம். அவர்கள் அனைவரும் சரியான முடிவை எடுத்தால், எங்கள் கொள்கையைச் சரியாக அமல்படுத்த முடியும். அதிக இணக்கமும் அதிக தரமும், எங்கள் கொள்கையைச் சரியாகவும் சீராகவும் அமல்படுத்த முடியும் என்பதைக் குறிக்கிறது. இல்லையெனில், நாங்கள் மீண்டும் சென்று கொள்கை மற்றும் பயிற்சித் தொகுப்பு இரண்டையும் மதிப்பீடு செய்கிறோம். 

ராப்லாக்ஸ் போன்ற ஒரு தளத்தின் படைப்பாற்றல் தன்மை, பயனர்கள் கிட்டத்தட்ட எதையும் உருவாக்கவும் தொடர்பு கொள்ளவும் சுதந்திரம் பெற்றிருப்பதால், அது எப்போதும் உருவாகிக்கொண்டே இருக்கிறது. நமது சமூகத்தை பாதுகாப்பாகவும் நாகரிகமாகவும் வைத்திருக்க நமது தணிக்கை முறைகளும் அதே வேகத்தில் உருவாக வேண்டும். மொழி உருவாகும்போது, பயனர் முறைகள் மாறும்போது, மற்றும் நிஜ உலக நிகழ்வுகள் நடக்கும்போது, நமது செயலில் கற்றல் அமைப்புகள் தொடர்ந்து மாதிரிகளைப் புதுப்பிக்கின்றன. அளவிடக்கூடிய, வேகமான, துல்லியமான, மற்றும் நாம் அனைவரும் வாழும் இந்த மாறும் உலகத்திற்கு தொடர்ந்து தங்களைத் தகவமைத்துக் கொள்ளும் அமைப்புகளை நாங்கள் தொடர்ந்து உருவாக்கி வருகிறோம். 

1 2025-இன் முதல் காலாண்டு நிலவரப்படி.

2 பிப்ரவரி 17, 2024 முதல் டிசம்பர் 31, 2024 வரையிலான அறிக்கை காலத்தை உள்ளடக்கியது.