ఈ సైట్‌లోని విషయాలు కృత్రిమ మేధస్సు (AI) లేదా యంత్ర అనువాద సాంకేతికత ఉపయోగించి అనువదించబడ్డాయి మరియు లోపాలు ఉండవచ్చు.

Skip to content

విపరీతమైన స్థాయిలో కంటెంట్‌ను మోడరేట్ చేయడానికి రోబ్లాక్స్ AIని ఎలా ఉపయోగిస్తుంది

25 భాషలలో ప్రతిరోజూ బిలియన్ల కొద్దీ కంటెంట్‌ను నిజ సమయంలో మోడరేట్ చేయడం

  • రాబ్లాక్స్‌లో ప్రచురించబడిన కంటెంట్‌ను ముందుగానే నియంత్రించడానికి, మేము సుమారు ఐదేళ్లుగా AIని ఉపయోగించుకుంటూ విస్తరించగల వ్యవస్థలను నిర్మిస్తున్నాము.
  • ఈ రోజు, మా మౌలిక సదుపాయాలు, ML మోడల్‌లు, మరియు వేలాది మంది మానవ నిపుణులు కలిసి పనిచేసి, మా వినియోగదారుల కోసం రాబ్లాక్స్‌ను సురక్షితమైన, మరింత మర్యాదపూర్వకమైన ప్రదేశంగా మార్చడంలో సహాయపడతాయి.
  • మేము ఈ వ్యవస్థలన్నింటినీ అధిక నాణ్యత గల డేటాతో, విస్తరణ, వేగం మరియు నిరంతర అభివృద్ధి కోసం అభివృద్ధి చేస్తాము.

రాబ్లాక్స్‌లో మేము చేసే ప్రతి పనికి భద్రత అనేది పునాది. మొదటి నుండి, మేము కంటెంట్‌ను ముందుగానే నియంత్రించాము, ఎందుకంటే వినియోగదారు-సృష్టించిన కంటెంట్‌పై నిర్మించిన ప్లాట్‌ఫారమ్‌కు నియంత్రణ చాలా కీలకమని మాకు తెలుసు. రాబ్లాక్స్ చాలా చిన్నదిగా ఉన్నప్పుడు, మా వ్యవస్థాపకుడు మరియు CEOతో సహా మానవ సమీక్షకులు ఈ పనిని చేసేవారు, వారు ప్రారంభంలో కంటెంట్‌ను నియంత్రించడానికి సమయం కేటాయించారు. కాలక్రమేణా, ప్లాట్‌ఫారమ్ (స్థాయి మరియు వేగం రెండింటిలోనూ) మానవ మోడరేటర్‌ల సామర్థ్యానికి మించి అభివృద్ధి చెందింది. ఏదైనా కొత్త ఉత్పత్తిని ప్రారంభించేటప్పుడు, భద్రత అనేది మేము ఎల్లప్పుడూ పరిగణించే మొదటి అంశం.

సగటున 97.8 మిలియన్ల రోజువారీ యాక్టివ్ వినియోగదారులు¹ ఆడటానికి, సంభాషించడానికి మరియు సృష్టించడానికి రాబ్లాక్స్‌కు వస్తారు. ప్రతిరోజూ, వినియోగదారులు 28 విభిన్న భాషలలో సగటున 6.1 బిలియన్ల చాట్ సందేశాలను మరియు 1.1 మిలియన్ గంటల వాయిస్ సంభాషణను పంపుతారు. సృష్టికర్తలు ప్రతిరోజూ లక్షలాది ఆస్తులను అప్‌లోడ్ చేస్తారు—మరియు మా అవతార్ మార్కెట్‌ప్లేస్‌కు వేలాది ఇతర వస్తువులు జోడించబడతాయి. ఈ బిలియన్ల సృష్టిలు మరియు సందేశాలలో చాలా భాగం సభ్యమైనవి. నిజ జీవితంలో లాగే—చాలా మంది ఒకరితో ఒకరు సంభాషించే విధానం ఇదే. కానీ అది సభ్యంగా లేనప్పుడు, మా టెక్స్ట్ ఫిల్టరింగ్ సిస్టమ్ వినియోగదారులకు చేరకముందే సమస్యాత్మక టెక్స్ట్‌ను బ్లాక్ చేయడంలో సహాయపడుతుంది మరియు వాయిస్ ఉల్లంఘనలు నిజ సమయంలో అంచనా వేయబడతాయి. మరియు మేము చట్టవిరుద్ధమైన కంటెంట్ యొక్క నోటీసును స్వీకరించిన సందర్భంలో, చర్య తీసుకోవడానికి మా సగటు సమయం పది నిమిషాలు.

ఈ పరిమాణంలో ఉన్న కంటెంట్‌ను మిల్లీసెకన్లలో నిరంతరం మోడరేట్ చేయడం అనేది మనుషులు ఒంటరిగా చేయలేని పని—మన వద్ద ఎంత మంది ఉన్నా సరే. ఈ స్థాయిలో మరియు వేగంతో పని చేయాలంటే, వారాంతాలు లేదా సెలవులను పక్కన పెడితే, 24/7 పనిచేసే లక్షలాది మంది మానవ మోడరేటర్లు అవసరం—మరియు అది కేవలం చాట్ సందేశాలను మోడరేట్ చేయడానికే. రాబ్లాక్స్‌లోని అన్ని ఇతర కంటెంట్ రకాలను మోడరేట్ చేయడానికి మాకు వేలాది మంది ఇంకా అవసరం. రాబ్లాక్స్‌లో ప్రతిరోజూ ఉత్పత్తి అయ్యే కంటెంట్ పరిమాణం, విస్తరించగల మౌలిక సదుపాయాలు, మెషిన్ లెర్నింగ్ (ML) మోడళ్లు, మరియు ప్రత్యేక ప్రయోజనం కోసం రూపొందించిన సాధనాలను డిమాండ్ చేస్తుంది. 

ML ఈ నిర్ణయాలను మిల్లీసెకన్లలో, పదేపదే, స్థిరంగా మరియు రోజుకు 24 గంటలూ తీసుకోగలదు. సందర్భానుసారంగా లోతైన, సూక్ష్మమైన మానవ తీర్పు అవసరమయ్యే అరుదైన కేసులను పరిష్కరించడానికి మాకు ఇప్పటికీ మానవులు అవసరం, మరియు మేము వారిని ఉపయోగిస్తాము. కొత్త మరియు అభివృద్ధి చెందుతున్న సవాళ్లను పరిష్కరించడానికి, మేము దృఢమైన, వినూత్నమైన భద్రతా మరియు మోడరేషన్ సాధనాలను ప్రపంచవ్యాప్తంగా ఉన్న వేలాది మంది మానవ నిపుణులతో మిళితం చేస్తాము, వీరు మా సిస్టమ్‌లకు పర్యవేక్షణ మరియు నిరంతర శిక్షణను అందిస్తారు. Roblox యొక్క అన్ని మోడరేషన్ సిస్టమ్‌లు ఈ క్రింది సూత్రాలపై ఆధారపడి ఉన్నాయి: 

  • మేము రాబ్‌లాక్స్‌లో కంటెంట్‌ను ముందుగానే నియంత్రిస్తాము.
  • చాలా సార్లు ప్రజలకు నియమాలు తెలియకపోవడం వల్ల, సాధ్యమైనప్పుడల్లా మేము వినియోగదారులకు నిజ-సమయ ఫీడ్‌బ్యాక్ అందిస్తాము.
  • విస్తృతంగా మానవుల కంటే ప్రెసిషన్ మరియు రికాల్‌లో AI గణనీయంగా మెరుగ్గా పనిచేసినప్పుడు మాత్రమే మేము దానిని ఉపయోగిస్తాము. 
  • AIని నిరంతరం మెరుగుపరచడం, అభివృద్ధి చెందుతున్న మరియు అరుదైన కేసులు, సంక్లిష్టమైన దర్యాప్తులు, మరియు అప్పీళ్ల కోసం మేము మానవులను ఉపయోగించుకుంటాము. 

రాబ్లాక్స్‌లో ఉత్పత్తి అవుతున్న పెరుగుతున్న కంటెంట్‌ను సమర్థవంతంగా మోడరేట్ చేయడానికి, మేము ఎల్లప్పుడూ మూడు అంశాలైన స్కేల్, వేగం మరియు నాణ్యతలో ఆవిష్కరణలు చేస్తూ ఉంటాము, మరియు దీనికి నిరంతర అభివృద్ధి అవసరం.

స్థాయి: రోజుకు బిలియన్ల కొద్దీ కంటెంట్‌ను నియంత్రించడం

ఫిబ్రవరి నుండి డిసెంబర్ 20241 వరకు, వినియోగదారులు సుమారు 1 ట్రిలియన్ ముక్కల కంటెంట్‌ను అప్‌లోడ్ చేశారు. ఆ బిలియన్ల కొద్దీ టెక్స్ట్ చాట్‌లు, ఆడియో, వాయిస్ మరియు చిత్రాలలో కేవలం 0.01% మాత్రమే మా విధానాలలో దేనినైనా ఉల్లంఘించినట్లు గుర్తించబడింది. మరియు మా విధానాలను ఉల్లంఘించిన దాదాపు అన్ని కంటెంట్‌ను వినియోగదారులు చూడక ముందే ఆటోమేటిక్‌గా ప్రీస్క్రీన్ చేసి తొలగించబడింది. ఈ స్థాయి సాపేక్షంగా కొత్తదే అయినప్పటికీ, మా మోడరేషన్‌కు మా నిబద్ధత కొత్తది కాదు. దశాబ్దానికి పైగా క్రితం, మేము నియమాల-ఆధారిత టెక్స్ట్ ఫిల్టర్‌ను నిర్మించాము. సుమారు ఐదేళ్ల క్రితం, అప్పటి అత్యాధునిక ట్రాన్స్‌ఫార్మర్-ఆధారిత టెక్స్ట్ ఫిల్టర్‌ను మేము అమలు చేశాము. ఈ రోజు, మా టెక్స్ట్ ఫిల్టర్‌లు రోజుకు సగటున 6.1 బిలియన్ల చాట్ సందేశాలను ప్రాసెస్ చేస్తాయి, ఇవి వివిధ రకాల విధాన ఉల్లంఘనల కోసం ప్రత్యేకంగా రూపొందించబడిన అనేక మోడళ్ల ద్వారా శక్తివంతంగా పనిచేస్తాయి.

వీటిలో ఒకటి, ఇన్-గేమ్ మరియు ప్లాట్‌ఫారమ్ చాట్‌ల కోసం వ్యక్తిగతంగా గుర్తించదగిన సమాచారం (PII) కోసం మా ఫిల్టర్. ఇతరులను PII కోసం అడిగే వినియోగదారులు మరింత తీవ్రమైన సమస్యల వైపు మొదటి అడుగు వేసినట్లు కావచ్చు, కాబట్టి PII పంచుకోవడాన్ని నివారించడంలో మేము ఎల్లప్పుడూ కఠినమైన వైఖరిని తీసుకున్నాము. పంపిన ప్రతి చాట్ సందేశం ఒక "విన్నపం", ఏదైనా PII ప్రస్తావించబడిందో లేదో సమీక్షించి నిర్ధారించమని సిస్టమ్‌ను అడుగుతుంది. ఈ టెక్స్ట్ ఫిల్టర్ మోడల్ సెకనుకు ఎన్నో అభ్యర్థనలను (RPS) నిర్వహిస్తోంది, దానిని మా ప్రస్తుత CPU-ఆధారిత సర్వీసింగ్ స్టాక్‌పై మద్దతు ఇవ్వడం కష్టంగా మారింది. కాబట్టి మేము మా సెల్యులార్ ఇన్‌ఫ్రాస్ట్రక్చర్‌ను ఉపయోగించుకుంటూ, GPUలపై పూర్తిగా కొత్త సర్వీసింగ్ స్టాక్‌ను నిర్మించాము. ఈ అధిక RPS డిమాండ్‌లకు మద్దతు ఇవ్వడానికి, మేము మొదట టోకెనైజేషన్‌ను ఇన్‌ఫెరెన్స్ నుండి వేరు చేసి, ఆపై పెద్ద మోడళ్ల క్వాంటిజేషన్ మరియు డిస్టిలేషన్‌తో ఇన్‌ఫెరెన్స్‌ను వేగవంతం చేశాము. ఈ మెరుగుదలలన్నీ కలిసి మా RPSను నాలుగు రెట్లు పెంచాయి. 

కొత్త స్టాక్‌పై, PII ఫిల్టర్ ఇప్పుడు గరిష్టంగా 370,000 RPSను నిర్వహిస్తోంది. మా మెరుగైన PII ఫిల్టర్ ఫాల్స్ పాజిటివ్‌లను 30% తగ్గించింది, ఇది అన్ని మద్దతు ఉన్న భాషలలో సిస్టమ్ ద్వారా స్వయంచాలకంగా గుర్తించబడిన PII ప్రస్తావనలలో 25% పెరుగుదలకు దారితీసింది. మేము ఇప్పటికే ఈ మెరుగుదలను అనేక ఇతర భాషలలోకి విస్తరించడంపై మరియు ఇతర టెక్స్ట్ ఫిల్టర్‌లు మరియు సర్ఫేస్‌లకు ఇలాంటి మెరుగుదలలను తీసుకురావడంపై పని చేస్తున్నాము. ఈ మెరుగుదలల పట్ల మేము గర్వపడుతున్నప్పటికీ, PIIని పంచుకోవడానికి ఉపయోగించే పద్ధతులు ఎల్లప్పుడూ అభివృద్ధి చెందుతున్నాయని మాకు తెలుసు మరియు ఈ మార్పులతో పాటు మా సిస్టమ్‌లను కూడా మేము అభివృద్ధి చేస్తున్నాము. 

మా మొత్తం మోడరేషన్ వ్యవస్థకు ఆధారంగా, వివిధ మాడాలిటీలపై పరిజ్ఞానం ఉన్న పెద్ద, ట్రాన్స్‌ఫార్మర్-ఆధారిత మోడల్‌లు ఉన్నాయి. కార్యాచరణ మరియు ఉత్పత్తి అవసరాలను బట్టి, సిస్టమ్‌ను వేగంగా మరియు సమర్థవంతంగా ఉంచడానికి మేము ఈ మోడల్‌లను డిస్టిల్ మరియు క్వాంటిజేట్ చేస్తాము. వివిధ రకాల మల్టీమోడల్ మోడల్‌లను నడపడానికి ఈ పద్ధతులు చాలా అవసరం, మా టెక్స్ట్ ఫిల్టర్‌లను నిర్వహించే మోడల్‌లు ఇప్పుడు 750,000 RPS కంటే ఎక్కువగా సమర్థవంతంగా నిర్వహిస్తున్నాయి. 

వేగం: నిజ-సమయ ఫీడ్‌బ్యాక్‌తో వినియోగదారు ప్రవర్తనను మార్చడం

సహజమైన, నిజ-సమయ సంభాషణలో సంభాషణ సజావుగా సాగడానికి దాదాపు తక్షణ ఫిల్టరింగ్ అవసరం. ఆలోచనలపై పునరావృతమయ్యే అభిప్రాయ మార్పిడి మరియు సహకారానికి, సృజనాత్మకతను కొనసాగించడానికి వేగవంతమైన ఫీడ్‌బ్యాక్ అవసరం. మా బహుళ-పొరల రక్షణ వ్యవస్థలో హెచ్చరిక నోటిఫికేషన్‌లు, టైమ్-అవుట్‌లు మరియు సస్పెన్షన్‌ల వంటి ముందుజాగ్రత్త చర్యలు ఉంటాయి. టెక్స్ట్‌ను ఫిల్టర్ చేసేటప్పుడు, మేము PII, అశ్లీలత మరియు ద్వేషపూరిత ప్రసంగం వంటి విధాన-తిరస్కార పదాలను మిల్లీసెకన్లలో నిరోధించడానికి నిజ-సమయంలో ప్రతిస్పందించగలము, తద్వారా వినియోగదారులు అనుచితమైన కంటెంట్‌కు గురికాకుండా నివారిస్తాము. 

వాయిస్ కమ్యూనికేషన్‌లను అదే విధంగా నిరోధించలేము, కాబట్టి మేము స్క్రీన్‌పై కనిపించే నోటిఫికేషన్ల ద్వారా వినియోగదారులకు అవగాహన కల్పిస్తాము. మా హెచ్చరిక నోటిఫికేషన్లు వినియోగదారుల ప్రవర్తనను సమర్థవంతంగా మార్చాయి మరియు మర్యాద, నిమగ్నత రెండింటినీ పెంచాయి. మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్ ఎనిమిది భాషలలో 15 సెకన్లలోపు చాట్‌ను మోడరేట్ చేస్తుంది. పరిశ్రమతో భద్రతా ఆవిష్కరణలనుంచుకోవాలనే మా విస్తృతమైన నిబద్ధతలో భాగంగా మేము ఈ మోడల్‌ను ఓపెన్ సోర్స్ కూడా చేసాము.

వారు ఏ పాలసీలను ఉల్లంఘిస్తున్నారో అర్థం చేసుకోవడానికి నోటిఫికేషన్‌లు వినియోగదారులకు సహాయపడతాయి మరియు సిస్టమ్ నిర్ణయంపై అప్పీల్ చేసుకునే అవకాశాన్ని అందిస్తాయి.

ఒక వినియోగదారు మా విధానాలను ఉల్లంఘించడం కొనసాగిస్తే, పరిణామాలు మరింత తీవ్రమవుతాయి, ఒక చిన్న హెచ్చరిక నుండి వాయిస్ చాట్‌కు యాక్సెస్ కోల్పోయే వరకు ఉంటాయి. అంతర్గత పరిశోధన ప్రకారం, సస్పెన్షన్‌లు ఆ తర్వాత మూడు వారాల వరకు ప్రభావం చూపుతాయి, పునరావృత ఉల్లంఘన రేట్లను మరియు సమర్పించబడిన వినియోగదారుల ఫిర్యాదుల సంఖ్యను తగ్గిస్తాయి. ప్రారంభ ప్రయోగాలు, ఈ రకమైన తక్షణ జోక్యాలు మరియు పరిణామాలు మర్యాదపూర్వక ప్రవర్తనపై సానుకూల ప్రభావాన్ని చూపుతాయని నిరూపించాయి. మా వాయిస్ క్లాసిఫైయర్ యొక్క తాజా వెర్షన్, మా ప్రారంభ వెర్షన్ కంటే 92% ఎక్కువ రికాల్ రేటును కలిగి ఉంది, 1% ఫాల్స్ పాజిటివ్ రేటుతో—మరియు గరిష్టంగా 8,300 RPS వరకు నిర్వహిస్తోంది. మేము ప్రెసిషన్ మరియు రికాల్ రెండింటినీ మెరుగుపరచడానికి మరిన్ని మార్గాలను అన్వేషించడం కొనసాగిస్తున్నాము.

వాయిస్ చాట్‌లో నోటిఫికేషన్‌లతో మేము సాధించిన విజయం ఆధారంగా, మేము టెక్స్ట్ చాట్ కోసం రియల్-టైమ్ ఫీడ్‌బ్యాక్‌ను కూడా అమలు చేయడం ప్రారంభించాము. ఇటీవలి ప్రయోగాలలో, అనుభవంలోనే టెక్స్ట్ చాట్ నోటిఫికేషన్‌లను జారీ చేయడం మరియు టైమ్-అవుట్‌లు ఫిల్టర్ చేయబడిన చాట్ సందేశాలలో 5% తగ్గుదలకు మరియు దుర్వినియోగ నివేదికల నుండి వచ్చే పరిణామాలలో 6% తగ్గుదలకు దారితీశాయని మేము కనుగొన్నాము. సృష్టికర్తలు తమ సృష్టిలను అప్‌లోడ్ చేస్తున్నప్పుడు వారికి రియల్-టైమ్ ఫీడ్‌బ్యాక్‌తో ప్రయోగాలు చేయడం కూడా మేము ప్రారంభిస్తున్నాము.

డేటా నాణ్యత: నిరంతర మెరుగుదల కోసం శిక్షణా నమూనాలు

పాలసీ ఉల్లంఘనను కలిగి ఉండగల దేనినైనా తొలగించే వైపు పొరబడకుండా, తక్కువ ఫాల్స్ నెగటివ్‌లను (తప్పుగా తొలగించబడినవి) పొందడానికి మేము ఈ సిస్టమ్‌లను శిక్షణ ఇస్తాము. నిబంధనలకు అనుగుణంగా ఉందని వారు నమ్మేది ఏదైనా తొలగించబడినప్పుడు వినియోగదారులకు నిరాశ కలిగిస్తుందని కూడా మాకు తెలుసు. కాబట్టి మేము ఫాల్స్ పాజిటివ్‌లను (తప్పుగా గుర్తించబడినవి) కూడా తగ్గించడానికి మా సిస్టమ్‌లను నిరంతరం మెరుగుపరుస్తాము. మా అన్ని క్లాసిఫైయర్‌ల యొక్క కచ్చితత్వాన్ని మెరుగుపరచడానికి సరిగ్గా లేబుల్ చేయబడిన డేటా చాలా అవసరం. 

దృఢమైన శిక్షణ మరియు మూల్యాంకన డేటాసెట్‌లను నిర్మించడానికి తగినంత నాణ్యమైన ఉదాహరణలు మరియు వాటిని కచ్చితంగా లేబుల్ చేయడానికి మానవ నిపుణులు ఇద్దరూ అవసరం. అరుదైన సందర్భం లేదా ఎడ్జ్ కేస్ అయినప్పుడు మా వద్ద తగినంత డేటా లేని సందర్భాలు కూడా ఉన్నాయి. కొన్నిసార్లు మా వద్ద చాలా డేటా ఉంటుంది మరియు అత్యంత ప్రభావవంతమైన ఉదాహరణలను గుర్తించాల్సి ఉంటుంది. మరియు రాబ్లాక్స్‌లో వాస్తవంగా ఏమి జరుగుతుందో దానికి సరిపోయే డేటా మాకు అవసరం. అందులో స్లాంగ్ లేదా మీమ్స్ వంటి తాత్కాలిక ఉదాహరణలు కూడా ఉంటాయి. పిల్లలు, యువకులు మరియు గేమర్‌లతో కూడిన మా ప్రేక్షకులు మాకు ఎల్లప్పుడూ కొత్త స్లాంగ్ పదాలు, కొత్త ట్రెండ్‌లు మరియు మా మోడరేషన్ సాధనాలను తప్పించుకోవడానికి కొత్త మార్గాలను పరిచయం చేస్తుంటారు. వారు మమ్మల్ని అప్రమత్తంగా ఉంచుతారు, అందుకే మేము మా మోడరేషన్ సాధనాలు మరియు మా విధానాలు రెండింటినీ నిరంతరం పరీక్షిస్తూ, మూల్యాంకనం చేస్తూ ఉంటాము. 

ఈ డేటాసెట్‌లను క్యూరేట్ చేయడానికి మేము వివిధ రకాల శాంప్లింగ్ వ్యూహాలను ఉపయోగిస్తాము, మరియు ఈ డేటా ఉదాహరణలను రూపొందించడానికి మరియు లేబుల్ చేయడానికి AI మరియు మానవ నిపుణులను ఉపయోగించుకుంటాము. మా పాలసీ నిపుణులు ఉదాహరణలను చేతితో క్యూరేట్ చేస్తారు, దీనిని మేము గోల్డెన్ సెట్ అని పిలుస్తాము. ఇవి సిస్టమ్ గుర్తించాలని మేము కోరుకునే సమస్యలకు అత్యంత సన్నిహితంగా సరిపోయే ఉదాహరణలు. మేము అనిశ్చితి శాంప్లింగ్‌తో సహా అనేక శాంప్లింగ్ వ్యూహాలతో చాలా పెద్ద డేటాసెట్‌ల నుండి శాంపిల్ చేస్తాము, ఇక్కడ గతంలో మోడల్ గందరగోళానికి గురైన ఎడ్జ్ కేస్‌లను మేము శాంపిల్ చేస్తాము. మేము మానవ నిపుణులు మరియు AI-సహాయక రెడ్ టీమ్‌ల (AARTల గురించి మరింత) నుండి నమూనాలను పొందుతాము, వారు బలహీనతలను శోధించడానికి వ్యతిరేక దాడులను అనుకరించడం ద్వారా సిస్టమ్‌ను పరీక్షిస్తారు. 

మేము కొత్త సమస్యలు, యాస, మీమ్స్ మొదలైనవి గుర్తించినప్పుడు మా శిక్షణా సెట్‌లను కూడా విస్తరిస్తాము మరియు మెరుగుపరుస్తాము. వినియోగదారులు అదనపు సమీక్షను అభ్యర్థించగల మా అప్పీల్ ప్రక్రియ ద్వారా ఈ ఉదాహరణలలో కొన్నింటిని మేము పొందుతాము. నిర్ణయం రద్దు చేయబడితే, ఆ ఉదాహరణ తదుపరిసారి మా సిస్టమ్ సరిగ్గా చేయడానికి సహాయపడటానికి మా డేటాసెట్‌లో భాగమవుతుంది. 

మిగతావి మా బలమైన దుర్వినియోగ నివేదన వ్యవస్థ నుండి మాకు అందుతాయి, ఇది ఈ అనుభవాలు మరియు కమ్యూనిటీ గురించి శ్రద్ధ వహించే కోట్లాది మంది వినియోగదారులను మా మానవ మోడరేటర్ల బృందంలోకి సమర్థవంతంగా చేర్చుతుంది. వినియోగదారులు అవతార్ మరియు ఆబ్జెక్ట్ IDలతో సహా మొత్తం దృశ్యాన్ని క్యాప్చర్ చేయడానికి మరియు వారు నివేదించాలనుకుంటున్న భాగాన్ని హైలైట్ చేయడానికి అవకాశం కల్పిస్తూ మేము ఇటీవల మా నివేదన సాధనాన్ని మెరుగుపరిచాము. వినియోగదారులు దీనిని బలంగా స్వీకరించడం మేము చూశాము, అర్హత ఉన్న నివేదికలలో సుమారు 15% దృశ్య వ్యాఖ్యానాలను అందిస్తున్నాయి. వినియోగదారులు తరచుగా ఆందోళనలను నివేదించే సమస్యాత్మక అనుభవాలను ముందుగానే గుర్తించడానికి ఈ అదనపు సందర్భం మాకు సహాయపడుతుంది. మోడల్ శిక్షణ తక్షణమే జరగదు కాబట్టి, మా ప్రతిస్పందనను పెంచడానికి వినియోగదారుల నివేదికల నుండి AI-ఆధారిత నియమాలను స్వయంచాలకంగా సృష్టించే మార్గాలను కూడా మేము అన్వేషిస్తున్నాము. 

ఇన్-ఎక్స్‌పీరియన్స్ రిపోర్ట్ UI ఇప్పుడు వినియోగదారులు వారు ఏమి నివేదించాలనుకుంటున్నారో హైలైట్ చేయడానికి అనుమతిస్తుంది (అంటే, డక్ అవతార్ చుట్టూ ఉన్న పచ్చని వృత్తం).

మేము ఈ డేటాసెట్‌లకు సింథటిక్ డేటాను జోడిస్తాము, ఇక్కడ పెద్ద భాషా మోడల్‌లు (LLMs) వాస్తవ ప్రపంచ ఉదాహరణలను అనుకరించే కృత్రిమ డేటా ఉదాహరణలు మరియు లేబుల్‌లను రూపొందిస్తాయి. ఇక్కడ ప్రయోజనం ఏమిటంటే, అరుదైన లేదా ఎడ్జ్ కేస్ కోసం కూడా, లక్షలాది ఉదాహరణలు మరియు లేబుల్‌లను రూపొందించగల సామర్థ్యం. మా వద్ద తగినంత లేబుల్ చేయబడిన డేటా ఉన్న తర్వాత, మేము దానిని రెండు డేటాసెట్‌లుగా విభజిస్తాము: ఒకటి శిక్షణ కోసం మరియు మరొకటి మూల్యాంకనం కోసం. దృఢమైన మూల్యాంకన డేటాసెట్‌ను కలిగి ఉండటం చాలా కీలకం: ఒకవేళ మూల్యాంకన సెట్ చాలా సులభంగా ఉంటే, మోడల్ మెట్రిక్స్ అది బాగా పనిచేస్తున్నట్లు కనిపిస్తుంది—కానీ అది ప్రొడక్షన్‌లో విఫలమవుతుంది. డేటా పరిమాణం కంటే దాని కచ్చితత్వం చాలా ముఖ్యం. 'చెత్త ఇన్పుట్, చెత్త అవుట్‌పుట్' అనేది MLలో ఒక నిజమైన ఆందోళన, ఎందుకంటే మోడల్ పనితీరు దానిని శిక్షణ మరియు మూల్యాంకనం చేయడానికి ఉపయోగించిన డేటా యొక్క కచ్చితత్వంపై ఎక్కువగా ఆధారపడి ఉంటుంది. 

మా వద్ద ఒక పటిష్టమైన మూల్యాంకన డేటాసెట్ ఉన్న తర్వాత, మేము దానిని రెండు కీలక కొలమానాల ఆధారంగా అంచనా వేస్తాము: అనుసంధానం మరియు నాణ్యత. అనుసంధానాన్ని పరీక్షించడానికి, అదే ఉదాహరణలను లేబుల్ చేయడానికి బహుళ వ్యక్తులకు పంపి, వారి లేబుల్స్ ఒకదానితో ఒకటి ఏకీభవిస్తాయో (లేదా అనుసంధానం అవుతాయో) చూస్తాము. వారి లేబుల్స్ మధ్య అనుసంధానం 80% లేదా అంతకంటే ఎక్కువగా ఉంటే, మా మోడరేటర్లు పెద్ద ఎత్తున స్థిరమైన నిర్ణయాలు తీసుకోగలరని అర్థం. అది 80% కంటే తక్కువగా ఉంటే, విధానం లేదా శిక్షణ గందరగోళంగా ఉండవచ్చు, మరియు మేము పునరావృతం చేయవలసి ఉంటుంది. నాణ్యతను పరీక్షించడానికి, అది విధానాన్ని ఉల్లంఘిస్తుందో లేదో అంచనా వేయడానికి మేము 'గోల్డెన్ సెట్'ను మానవులకు పంపుతాము మరియు వారు సరైన నిర్ణయం తీసుకున్నారని నిర్ధారించుకుంటాము. నిపుణులు సమీక్షించడానికి మేము నిర్ణయాల నమూనాలను కూడా తీసుకుంటాము. వారందరూ సరైన నిర్ణయం తీసుకుంటే, మా విధానాన్ని సరిగ్గా అమలు చేయవచ్చు. అధిక అనుసంధానం మరియు అధిక నాణ్యత అనేవి మా విధానాన్ని సరిగ్గా మరియు స్థిరంగా అమలు చేయవచ్చని సూచిస్తాయి. ఒకవేళ అలా కాకపోతే, మేము వెనక్కి వెళ్లి విధానం మరియు శిక్షణా సెట్ రెండింటినీ పునఃపరిశీలిస్తాము. 

రోబ్లాక్స్ వంటి ప్లాట్‌ఫారమ్ యొక్క సృజనాత్మక స్వభావం, ఇక్కడ వినియోగదారులు దాదాపు దేనినైనా సృష్టించడానికి మరియు సంభాషించడానికి స్వేచ్ఛగా ఉంటారు, అది ఎల్లప్పుడూ అభివృద్ధి చెందుతూ ఉంటుంది. మా కమ్యూనిటీని సురక్షితంగా మరియు పౌరసభ్యతతో ఉంచడానికి మా మోడరేషన్ పద్ధతులు కూడా అంతే వేగంగా అభివృద్ధి చెందాలి. భాష అభివృద్ధి చెందుతున్నప్పుడు, వినియోగదారుల నమూనాలు మారుతున్నప్పుడు మరియు వాస్తవ ప్రపంచ సంఘటనలు జరిగినప్పుడు మా యాక్టివ్ లెర్నింగ్ సిస్టమ్స్ నిరంతరం మోడళ్లను అప్‌డేట్ చేస్తాయి. మనం అందరం జీవిస్తున్న గతిశీల ప్రపంచానికి అనుగుణంగా స్కేలబుల్, వేగవంతమైన, కచ్చితమైన మరియు స్థిరంగా మారే సిస్టమ్స్‌ను మేము నిరంతరం నిర్మిస్తున్నాము. 

1 2025 మొదటి త్రైమాసికం నాటికి.

2 ఫిబ్రవరి 17, 2024 నుండి డిసెంబర్ 31, 2024 వరకు ఉన్న రిపోర్టింగ్ కాలాన్ని కవర్ చేస్తుంది.