విపరీతమైన స్థాయిలో కంటెంట్ను మోడరేట్ చేయడానికి రోబ్లాక్స్ AIని ఎలా ఉపయోగిస్తుంది
25 భాషలలో ప్రతిరోజూ బిలియన్ల కొద్దీ కంటెంట్ను నిజ సమయంలో మోడరేట్ చేయడం

- రాబ్లాక్స్లో ప్రచురించబడిన కంటెంట్ను ముందుగానే నియంత్రించడానికి, మేము సుమారు ఐదేళ్లుగా AIని ఉపయోగించుకుంటూ విస్తరించగల వ్యవస్థలను నిర్మిస్తున్నాము.
- ఈ రోజు, మా మౌలిక సదుపాయాలు, ML మోడల్లు, మరియు వేలాది మంది మానవ నిపుణులు కలిసి పనిచేసి, మా వినియోగదారుల కోసం రాబ్లాక్స్ను సురక్షితమైన, మరింత మర్యాదపూర్వకమైన ప్రదేశంగా మార్చడంలో సహాయపడతాయి.
- మేము ఈ వ్యవస్థలన్నింటినీ అధిక నాణ్యత గల డేటాతో, విస్తరణ, వేగం మరియు నిరంతర అభివృద్ధి కోసం అభివృద్ధి చేస్తాము.
రాబ్లాక్స్లో మేము చేసే ప్రతి పనికి భద్రత అనేది పునాది. మొదటి నుండి, మేము కంటెంట్ను ముందుగానే నియంత్రించాము, ఎందుకంటే వినియోగదారు-సృష్టించిన కంటెంట్పై నిర్మించిన ప్లాట్ఫారమ్కు నియంత్రణ చాలా కీలకమని మాకు తెలుసు. రాబ్లాక్స్ చాలా చిన్నదిగా ఉన్నప్పుడు, మా వ్యవస్థాపకుడు మరియు CEOతో సహా మానవ సమీక్షకులు ఈ పనిని చేసేవారు, వారు ప్రారంభంలో కంటెంట్ను నియంత్రించడానికి సమయం కేటాయించారు. కాలక్రమేణా, ప్లాట్ఫారమ్ (స్థాయి మరియు వేగం రెండింటిలోనూ) మానవ మోడరేటర్ల సామర్థ్యానికి మించి అభివృద్ధి చెందింది. ఏదైనా కొత్త ఉత్పత్తిని ప్రారంభించేటప్పుడు, భద్రత అనేది మేము ఎల్లప్పుడూ పరిగణించే మొదటి అంశం.
సగటున 97.8 మిలియన్ల రోజువారీ యాక్టివ్ వినియోగదారులు¹ ఆడటానికి, సంభాషించడానికి మరియు సృష్టించడానికి రాబ్లాక్స్కు వస్తారు. ప్రతిరోజూ, వినియోగదారులు 28 విభిన్న భాషలలో సగటున 6.1 బిలియన్ల చాట్ సందేశాలను మరియు 1.1 మిలియన్ గంటల వాయిస్ సంభాషణను పంపుతారు. సృష్టికర్తలు ప్రతిరోజూ లక్షలాది ఆస్తులను అప్లోడ్ చేస్తారు—మరియు మా అవతార్ మార్కెట్ప్లేస్కు వేలాది ఇతర వస్తువులు జోడించబడతాయి. ఈ బిలియన్ల సృష్టిలు మరియు సందేశాలలో చాలా భాగం సభ్యమైనవి. నిజ జీవితంలో లాగే—చాలా మంది ఒకరితో ఒకరు సంభాషించే విధానం ఇదే. కానీ అది సభ్యంగా లేనప్పుడు, మా టెక్స్ట్ ఫిల్టరింగ్ సిస్టమ్ వినియోగదారులకు చేరకముందే సమస్యాత్మక టెక్స్ట్ను బ్లాక్ చేయడంలో సహాయపడుతుంది మరియు వాయిస్ ఉల్లంఘనలు నిజ సమయంలో అంచనా వేయబడతాయి. మరియు మేము చట్టవిరుద్ధమైన కంటెంట్ యొక్క నోటీసును స్వీకరించిన సందర్భంలో, చర్య తీసుకోవడానికి మా సగటు సమయం పది నిమిషాలు.
ఈ పరిమాణంలో ఉన్న కంటెంట్ను మిల్లీసెకన్లలో నిరంతరం మోడరేట్ చేయడం అనేది మనుషులు ఒంటరిగా చేయలేని పని—మన వద్ద ఎంత మంది ఉన్నా సరే. ఈ స్థాయిలో మరియు వేగంతో పని చేయాలంటే, వారాంతాలు లేదా సెలవులను పక్కన పెడితే, 24/7 పనిచేసే లక్షలాది మంది మానవ మోడరేటర్లు అవసరం—మరియు అది కేవలం చాట్ సందేశాలను మోడరేట్ చేయడానికే. రాబ్లాక్స్లోని అన్ని ఇతర కంటెంట్ రకాలను మోడరేట్ చేయడానికి మాకు వేలాది మంది ఇంకా అవసరం. రాబ్లాక్స్లో ప్రతిరోజూ ఉత్పత్తి అయ్యే కంటెంట్ పరిమాణం, విస్తరించగల మౌలిక సదుపాయాలు, మెషిన్ లెర్నింగ్ (ML) మోడళ్లు, మరియు ప్రత్యేక ప్రయోజనం కోసం రూపొందించిన సాధనాలను డిమాండ్ చేస్తుంది.
ML ఈ నిర్ణయాలను మిల్లీసెకన్లలో, పదేపదే, స్థిరంగా మరియు రోజుకు 24 గంటలూ తీసుకోగలదు. సందర్భానుసారంగా లోతైన, సూక్ష్మమైన మానవ తీర్పు అవసరమయ్యే అరుదైన కేసులను పరిష్కరించడానికి మాకు ఇప్పటికీ మానవులు అవసరం, మరియు మేము వారిని ఉపయోగిస్తాము. కొత్త మరియు అభివృద్ధి చెందుతున్న సవాళ్లను పరిష్కరించడానికి, మేము దృఢమైన, వినూత్నమైన భద్రతా మరియు మోడరేషన్ సాధనాలను ప్రపంచవ్యాప్తంగా ఉన్న వేలాది మంది మానవ నిపుణులతో మిళితం చేస్తాము, వీరు మా సిస్టమ్లకు పర్యవేక్షణ మరియు నిరంతర శిక్షణను అందిస్తారు. Roblox యొక్క అన్ని మోడరేషన్ సిస్టమ్లు ఈ క్రింది సూత్రాలపై ఆధారపడి ఉన్నాయి:
- మేము రాబ్లాక్స్లో కంటెంట్ను ముందుగానే నియంత్రిస్తాము.
- చాలా సార్లు ప్రజలకు నియమాలు తెలియకపోవడం వల్ల, సాధ్యమైనప్పుడల్లా మేము వినియోగదారులకు నిజ-సమయ ఫీడ్బ్యాక్ అందిస్తాము.
- విస్తృతంగా మానవుల కంటే ప్రెసిషన్ మరియు రికాల్లో AI గణనీయంగా మెరుగ్గా పనిచేసినప్పుడు మాత్రమే మేము దానిని ఉపయోగిస్తాము.
- AIని నిరంతరం మెరుగుపరచడం, అభివృద్ధి చెందుతున్న మరియు అరుదైన కేసులు, సంక్లిష్టమైన దర్యాప్తులు, మరియు అప్పీళ్ల కోసం మేము మానవులను ఉపయోగించుకుంటాము.
రాబ్లాక్స్లో ఉత్పత్తి అవుతున్న పెరుగుతున్న కంటెంట్ను సమర్థవంతంగా మోడరేట్ చేయడానికి, మేము ఎల్లప్పుడూ మూడు అంశాలైన స్కేల్, వేగం మరియు నాణ్యతలో ఆవిష్కరణలు చేస్తూ ఉంటాము, మరియు దీనికి నిరంతర అభివృద్ధి అవసరం.
స్థాయి: రోజుకు బిలియన్ల కొద్దీ కంటెంట్ను నియంత్రించడం
ఫిబ్రవరి నుండి డిసెంబర్ 20241 వరకు, వినియోగదారులు సుమారు 1 ట్రిలియన్ ముక్కల కంటెంట్ను అప్లోడ్ చేశారు. ఆ బిలియన్ల కొద్దీ టెక్స్ట్ చాట్లు, ఆడియో, వాయిస్ మరియు చిత్రాలలో కేవలం 0.01% మాత్రమే మా విధానాలలో దేనినైనా ఉల్లంఘించినట్లు గుర్తించబడింది. మరియు మా విధానాలను ఉల్లంఘించిన దాదాపు అన్ని కంటెంట్ను వినియోగదారులు చూడక ముందే ఆటోమేటిక్గా ప్రీస్క్రీన్ చేసి తొలగించబడింది. ఈ స్థాయి సాపేక్షంగా కొత్తదే అయినప్పటికీ, మా మోడరేషన్కు మా నిబద్ధత కొత్తది కాదు. దశాబ్దానికి పైగా క్రితం, మేము నియమాల-ఆధారిత టెక్స్ట్ ఫిల్టర్ను నిర్మించాము. సుమారు ఐదేళ్ల క్రితం, అప్పటి అత్యాధునిక ట్రాన్స్ఫార్మర్-ఆధారిత టెక్స్ట్ ఫిల్టర్ను మేము అమలు చేశాము. ఈ రోజు, మా టెక్స్ట్ ఫిల్టర్లు రోజుకు సగటున 6.1 బిలియన్ల చాట్ సందేశాలను ప్రాసెస్ చేస్తాయి, ఇవి వివిధ రకాల విధాన ఉల్లంఘనల కోసం ప్రత్యేకంగా రూపొందించబడిన అనేక మోడళ్ల ద్వారా శక్తివంతంగా పనిచేస్తాయి.
వీటిలో ఒకటి, ఇన్-గేమ్ మరియు ప్లాట్ఫారమ్ చాట్ల కోసం వ్యక్తిగతంగా గుర్తించదగిన సమాచారం (PII) కోసం మా ఫిల్టర్. ఇతరులను PII కోసం అడిగే వినియోగదారులు మరింత తీవ్రమైన సమస్యల వైపు మొదటి అడుగు వేసినట్లు కావచ్చు, కాబట్టి PII పంచుకోవడాన్ని నివారించడంలో మేము ఎల్లప్పుడూ కఠినమైన వైఖరిని తీసుకున్నాము. పంపిన ప్రతి చాట్ సందేశం ఒక "విన్నపం", ఏదైనా PII ప్రస్తావించబడిందో లేదో సమీక్షించి నిర్ధారించమని సిస్టమ్ను అడుగుతుంది. ఈ టెక్స్ట్ ఫిల్టర్ మోడల్ సెకనుకు ఎన్నో అభ్యర్థనలను (RPS) నిర్వహిస్తోంది, దానిని మా ప్రస్తుత CPU-ఆధారిత సర్వీసింగ్ స్టాక్పై మద్దతు ఇవ్వడం కష్టంగా మారింది. కాబట్టి మేము మా సెల్యులార్ ఇన్ఫ్రాస్ట్రక్చర్ను ఉపయోగించుకుంటూ, GPUలపై పూర్తిగా కొత్త సర్వీసింగ్ స్టాక్ను నిర్మించాము. ఈ అధిక RPS డిమాండ్లకు మద్దతు ఇవ్వడానికి, మేము మొదట టోకెనైజేషన్ను ఇన్ఫెరెన్స్ నుండి వేరు చేసి, ఆపై పెద్ద మోడళ్ల క్వాంటిజేషన్ మరియు డిస్టిలేషన్తో ఇన్ఫెరెన్స్ను వేగవంతం చేశాము. ఈ మెరుగుదలలన్నీ కలిసి మా RPSను నాలుగు రెట్లు పెంచాయి.
కొత్త స్టాక్పై, PII ఫిల్టర్ ఇప్పుడు గరిష్టంగా 370,000 RPSను నిర్వహిస్తోంది. మా మెరుగైన PII ఫిల్టర్ ఫాల్స్ పాజిటివ్లను 30% తగ్గించింది, ఇది అన్ని మద్దతు ఉన్న భాషలలో సిస్టమ్ ద్వారా స్వయంచాలకంగా గుర్తించబడిన PII ప్రస్తావనలలో 25% పెరుగుదలకు దారితీసింది. మేము ఇప్పటికే ఈ మెరుగుదలను అనేక ఇతర భాషలలోకి విస్తరించడంపై మరియు ఇతర టెక్స్ట్ ఫిల్టర్లు మరియు సర్ఫేస్లకు ఇలాంటి మెరుగుదలలను తీసుకురావడంపై పని చేస్తున్నాము. ఈ మెరుగుదలల పట్ల మేము గర్వపడుతున్నప్పటికీ, PIIని పంచుకోవడానికి ఉపయోగించే పద్ధతులు ఎల్లప్పుడూ అభివృద్ధి చెందుతున్నాయని మాకు తెలుసు మరియు ఈ మార్పులతో పాటు మా సిస్టమ్లను కూడా మేము అభివృద్ధి చేస్తున్నాము.
మా మొత్తం మోడరేషన్ వ్యవస్థకు ఆధారంగా, వివిధ మాడాలిటీలపై పరిజ్ఞానం ఉన్న పెద్ద, ట్రాన్స్ఫార్మర్-ఆధారిత మోడల్లు ఉన్నాయి. కార్యాచరణ మరియు ఉత్పత్తి అవసరాలను బట్టి, సిస్టమ్ను వేగంగా మరియు సమర్థవంతంగా ఉంచడానికి మేము ఈ మోడల్లను డిస్టిల్ మరియు క్వాంటిజేట్ చేస్తాము. వివిధ రకాల మల్టీమోడల్ మోడల్లను నడపడానికి ఈ పద్ధతులు చాలా అవసరం, మా టెక్స్ట్ ఫిల్టర్లను నిర్వహించే మోడల్లు ఇప్పుడు 750,000 RPS కంటే ఎక్కువగా సమర్థవంతంగా నిర్వహిస్తున్నాయి.

వేగం: నిజ-సమయ ఫీడ్బ్యాక్తో వినియోగదారు ప్రవర్తనను మార్చడం
సహజమైన, నిజ-సమయ సంభాషణలో సంభాషణ సజావుగా సాగడానికి దాదాపు తక్షణ ఫిల్టరింగ్ అవసరం. ఆలోచనలపై పునరావృతమయ్యే అభిప్రాయ మార్పిడి మరియు సహకారానికి, సృజనాత్మకతను కొనసాగించడానికి వేగవంతమైన ఫీడ్బ్యాక్ అవసరం. మా బహుళ-పొరల రక్షణ వ్యవస్థలో హెచ్చరిక నోటిఫికేషన్లు, టైమ్-అవుట్లు మరియు సస్పెన్షన్ల వంటి ముందుజాగ్రత్త చర్యలు ఉంటాయి. టెక్స్ట్ను ఫిల్టర్ చేసేటప్పుడు, మేము PII, అశ్లీలత మరియు ద్వేషపూరిత ప్రసంగం వంటి విధాన-తిరస్కార పదాలను మిల్లీసెకన్లలో నిరోధించడానికి నిజ-సమయంలో ప్రతిస్పందించగలము, తద్వారా వినియోగదారులు అనుచితమైన కంటెంట్కు గురికాకుండా నివారిస్తాము.
వాయిస్ కమ్యూనికేషన్లను అదే విధంగా నిరోధించలేము, కాబట్టి మేము స్క్రీన్పై కనిపించే నోటిఫికేషన్ల ద్వారా వినియోగదారులకు అవగాహన కల్పిస్తాము. మా హెచ్చరిక నోటిఫికేషన్లు వినియోగదారుల ప్రవర్తనను సమర్థవంతంగా మార్చాయి మరియు మర్యాద, నిమగ్నత రెండింటినీ పెంచాయి. మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్ ఎనిమిది భాషలలో 15 సెకన్లలోపు చాట్ను మోడరేట్ చేస్తుంది. పరిశ్రమతో భద్రతా ఆవిష్కరణలను పంచుకోవాలనే మా విస్తృతమైన నిబద్ధతలో భాగంగా మేము ఈ మోడల్ను ఓపెన్ సోర్స్ కూడా చేసాము.

ఒక వినియోగదారు మా విధానాలను ఉల్లంఘించడం కొనసాగిస్తే, పరిణామాలు మరింత తీవ్రమవుతాయి, ఒక చిన్న హెచ్చరిక నుండి వాయిస్ చాట్కు యాక్సెస్ కోల్పోయే వరకు ఉంటాయి. అంతర్గత పరిశోధన ప్రకారం, సస్పెన్షన్లు ఆ తర్వాత మూడు వారాల వరకు ప్రభావం చూపుతాయి, పునరావృత ఉల్లంఘన రేట్లను మరియు సమర్పించబడిన వినియోగదారుల ఫిర్యాదుల సంఖ్యను తగ్గిస్తాయి. ప్రారంభ ప్రయోగాలు, ఈ రకమైన తక్షణ జోక్యాలు మరియు పరిణామాలు మర్యాదపూర్వక ప్రవర్తనపై సానుకూల ప్రభావాన్ని చూపుతాయని నిరూపించాయి. మా వాయిస్ క్లాసిఫైయర్ యొక్క తాజా వెర్షన్, మా ప్రారంభ వెర్షన్ కంటే 92% ఎక్కువ రికాల్ రేటును కలిగి ఉంది, 1% ఫాల్స్ పాజిటివ్ రేటుతో—మరియు గరిష్టంగా 8,300 RPS వరకు నిర్వహిస్తోంది. మేము ప్రెసిషన్ మరియు రికాల్ రెండింటినీ మెరుగుపరచడానికి మరిన్ని మార్గాలను అన్వేషించడం కొనసాగిస్తున్నాము.
వాయిస్ చాట్లో నోటిఫికేషన్లతో మేము సాధించిన విజయం ఆధారంగా, మేము టెక్స్ట్ చాట్ కోసం రియల్-టైమ్ ఫీడ్బ్యాక్ను కూడా అమలు చేయడం ప్రారంభించాము. ఇటీవలి ప్రయోగాలలో, అనుభవంలోనే టెక్స్ట్ చాట్ నోటిఫికేషన్లను జారీ చేయడం మరియు టైమ్-అవుట్లు ఫిల్టర్ చేయబడిన చాట్ సందేశాలలో 5% తగ్గుదలకు మరియు దుర్వినియోగ నివేదికల నుండి వచ్చే పరిణామాలలో 6% తగ్గుదలకు దారితీశాయని మేము కనుగొన్నాము. సృష్టికర్తలు తమ సృష్టిలను అప్లోడ్ చేస్తున్నప్పుడు వారికి రియల్-టైమ్ ఫీడ్బ్యాక్తో ప్రయోగాలు చేయడం కూడా మేము ప్రారంభిస్తున్నాము.
డేటా నాణ్యత: నిరంతర మెరుగుదల కోసం శిక్షణా నమూనాలు
పాలసీ ఉల్లంఘనను కలిగి ఉండగల దేనినైనా తొలగించే వైపు పొరబడకుండా, తక్కువ ఫాల్స్ నెగటివ్లను (తప్పుగా తొలగించబడినవి) పొందడానికి మేము ఈ సిస్టమ్లను శిక్షణ ఇస్తాము. నిబంధనలకు అనుగుణంగా ఉందని వారు నమ్మేది ఏదైనా తొలగించబడినప్పుడు వినియోగదారులకు నిరాశ కలిగిస్తుందని కూడా మాకు తెలుసు. కాబట్టి మేము ఫాల్స్ పాజిటివ్లను (తప్పుగా గుర్తించబడినవి) కూడా తగ్గించడానికి మా సిస్టమ్లను నిరంతరం మెరుగుపరుస్తాము. మా అన్ని క్లాసిఫైయర్ల యొక్క కచ్చితత్వాన్ని మెరుగుపరచడానికి సరిగ్గా లేబుల్ చేయబడిన డేటా చాలా అవసరం.
దృఢమైన శిక్షణ మరియు మూల్యాంకన డేటాసెట్లను నిర్మించడానికి తగినంత నాణ్యమైన ఉదాహరణలు మరియు వాటిని కచ్చితంగా లేబుల్ చేయడానికి మానవ నిపుణులు ఇద్దరూ అవసరం. అరుదైన సందర్భం లేదా ఎడ్జ్ కేస్ అయినప్పుడు మా వద్ద తగినంత డేటా లేని సందర్భాలు కూడా ఉన్నాయి. కొన్నిసార్లు మా వద్ద చాలా డేటా ఉంటుంది మరియు అత్యంత ప్రభావవంతమైన ఉదాహరణలను గుర్తించాల్సి ఉంటుంది. మరియు రాబ్లాక్స్లో వాస్తవంగా ఏమి జరుగుతుందో దానికి సరిపోయే డేటా మాకు అవసరం. అందులో స్లాంగ్ లేదా మీమ్స్ వంటి తాత్కాలిక ఉదాహరణలు కూడా ఉంటాయి. పిల్లలు, యువకులు మరియు గేమర్లతో కూడిన మా ప్రేక్షకులు మాకు ఎల్లప్పుడూ కొత్త స్లాంగ్ పదాలు, కొత్త ట్రెండ్లు మరియు మా మోడరేషన్ సాధనాలను తప్పించుకోవడానికి కొత్త మార్గాలను పరిచయం చేస్తుంటారు. వారు మమ్మల్ని అప్రమత్తంగా ఉంచుతారు, అందుకే మేము మా మోడరేషన్ సాధనాలు మరియు మా విధానాలు రెండింటినీ నిరంతరం పరీక్షిస్తూ, మూల్యాంకనం చేస్తూ ఉంటాము.
ఈ డేటాసెట్లను క్యూరేట్ చేయడానికి మేము వివిధ రకాల శాంప్లింగ్ వ్యూహాలను ఉపయోగిస్తాము, మరియు ఈ డేటా ఉదాహరణలను రూపొందించడానికి మరియు లేబుల్ చేయడానికి AI మరియు మానవ నిపుణులను ఉపయోగించుకుంటాము. మా పాలసీ నిపుణులు ఉదాహరణలను చేతితో క్యూరేట్ చేస్తారు, దీనిని మేము గోల్డెన్ సెట్ అని పిలుస్తాము. ఇవి సిస్టమ్ గుర్తించాలని మేము కోరుకునే సమస్యలకు అత్యంత సన్నిహితంగా సరిపోయే ఉదాహరణలు. మేము అనిశ్చితి శాంప్లింగ్తో సహా అనేక శాంప్లింగ్ వ్యూహాలతో చాలా పెద్ద డేటాసెట్ల నుండి శాంపిల్ చేస్తాము, ఇక్కడ గతంలో మోడల్ గందరగోళానికి గురైన ఎడ్జ్ కేస్లను మేము శాంపిల్ చేస్తాము. మేము మానవ నిపుణులు మరియు AI-సహాయక రెడ్ టీమ్ల (AARTల గురించి మరింత) నుండి నమూనాలను పొందుతాము, వారు బలహీనతలను శోధించడానికి వ్యతిరేక దాడులను అనుకరించడం ద్వారా సిస్టమ్ను పరీక్షిస్తారు.
మేము కొత్త సమస్యలు, యాస, మీమ్స్ మొదలైనవి గుర్తించినప్పుడు మా శిక్షణా సెట్లను కూడా విస్తరిస్తాము మరియు మెరుగుపరుస్తాము. వినియోగదారులు అదనపు సమీక్షను అభ్యర్థించగల మా అప్పీల్ ప్రక్రియ ద్వారా ఈ ఉదాహరణలలో కొన్నింటిని మేము పొందుతాము. నిర్ణయం రద్దు చేయబడితే, ఆ ఉదాహరణ తదుపరిసారి మా సిస్టమ్ సరిగ్గా చేయడానికి సహాయపడటానికి మా డేటాసెట్లో భాగమవుతుంది.
మిగతావి మా బలమైన దుర్వినియోగ నివేదన వ్యవస్థ నుండి మాకు అందుతాయి, ఇది ఈ అనుభవాలు మరియు కమ్యూనిటీ గురించి శ్రద్ధ వహించే కోట్లాది మంది వినియోగదారులను మా మానవ మోడరేటర్ల బృందంలోకి సమర్థవంతంగా చేర్చుతుంది. వినియోగదారులు అవతార్ మరియు ఆబ్జెక్ట్ IDలతో సహా మొత్తం దృశ్యాన్ని క్యాప్చర్ చేయడానికి మరియు వారు నివేదించాలనుకుంటున్న భాగాన్ని హైలైట్ చేయడానికి అవకాశం కల్పిస్తూ మేము ఇటీవల మా నివేదన సాధనాన్ని మెరుగుపరిచాము. వినియోగదారులు దీనిని బలంగా స్వీకరించడం మేము చూశాము, అర్హత ఉన్న నివేదికలలో సుమారు 15% దృశ్య వ్యాఖ్యానాలను అందిస్తున్నాయి. వినియోగదారులు తరచుగా ఆందోళనలను నివేదించే సమస్యాత్మక అనుభవాలను ముందుగానే గుర్తించడానికి ఈ అదనపు సందర్భం మాకు సహాయపడుతుంది. మోడల్ శిక్షణ తక్షణమే జరగదు కాబట్టి, మా ప్రతిస్పందనను పెంచడానికి వినియోగదారుల నివేదికల నుండి AI-ఆధారిత నియమాలను స్వయంచాలకంగా సృష్టించే మార్గాలను కూడా మేము అన్వేషిస్తున్నాము.

మేము ఈ డేటాసెట్లకు సింథటిక్ డేటాను జోడిస్తాము, ఇక్కడ పెద్ద భాషా మోడల్లు (LLMs) వాస్తవ ప్రపంచ ఉదాహరణలను అనుకరించే కృత్రిమ డేటా ఉదాహరణలు మరియు లేబుల్లను రూపొందిస్తాయి. ఇక్కడ ప్రయోజనం ఏమిటంటే, అరుదైన లేదా ఎడ్జ్ కేస్ కోసం కూడా, లక్షలాది ఉదాహరణలు మరియు లేబుల్లను రూపొందించగల సామర్థ్యం. మా వద్ద తగినంత లేబుల్ చేయబడిన డేటా ఉన్న తర్వాత, మేము దానిని రెండు డేటాసెట్లుగా విభజిస్తాము: ఒకటి శిక్షణ కోసం మరియు మరొకటి మూల్యాంకనం కోసం. దృఢమైన మూల్యాంకన డేటాసెట్ను కలిగి ఉండటం చాలా కీలకం: ఒకవేళ మూల్యాంకన సెట్ చాలా సులభంగా ఉంటే, మోడల్ మెట్రిక్స్ అది బాగా పనిచేస్తున్నట్లు కనిపిస్తుంది—కానీ అది ప్రొడక్షన్లో విఫలమవుతుంది. డేటా పరిమాణం కంటే దాని కచ్చితత్వం చాలా ముఖ్యం. 'చెత్త ఇన్పుట్, చెత్త అవుట్పుట్' అనేది MLలో ఒక నిజమైన ఆందోళన, ఎందుకంటే మోడల్ పనితీరు దానిని శిక్షణ మరియు మూల్యాంకనం చేయడానికి ఉపయోగించిన డేటా యొక్క కచ్చితత్వంపై ఎక్కువగా ఆధారపడి ఉంటుంది.
మా వద్ద ఒక పటిష్టమైన మూల్యాంకన డేటాసెట్ ఉన్న తర్వాత, మేము దానిని రెండు కీలక కొలమానాల ఆధారంగా అంచనా వేస్తాము: అనుసంధానం మరియు నాణ్యత. అనుసంధానాన్ని పరీక్షించడానికి, అదే ఉదాహరణలను లేబుల్ చేయడానికి బహుళ వ్యక్తులకు పంపి, వారి లేబుల్స్ ఒకదానితో ఒకటి ఏకీభవిస్తాయో (లేదా అనుసంధానం అవుతాయో) చూస్తాము. వారి లేబుల్స్ మధ్య అనుసంధానం 80% లేదా అంతకంటే ఎక్కువగా ఉంటే, మా మోడరేటర్లు పెద్ద ఎత్తున స్థిరమైన నిర్ణయాలు తీసుకోగలరని అర్థం. అది 80% కంటే తక్కువగా ఉంటే, విధానం లేదా శిక్షణ గందరగోళంగా ఉండవచ్చు, మరియు మేము పునరావృతం చేయవలసి ఉంటుంది. నాణ్యతను పరీక్షించడానికి, అది విధానాన్ని ఉల్లంఘిస్తుందో లేదో అంచనా వేయడానికి మేము 'గోల్డెన్ సెట్'ను మానవులకు పంపుతాము మరియు వారు సరైన నిర్ణయం తీసుకున్నారని నిర్ధారించుకుంటాము. నిపుణులు సమీక్షించడానికి మేము నిర్ణయాల నమూనాలను కూడా తీసుకుంటాము. వారందరూ సరైన నిర్ణయం తీసుకుంటే, మా విధానాన్ని సరిగ్గా అమలు చేయవచ్చు. అధిక అనుసంధానం మరియు అధిక నాణ్యత అనేవి మా విధానాన్ని సరిగ్గా మరియు స్థిరంగా అమలు చేయవచ్చని సూచిస్తాయి. ఒకవేళ అలా కాకపోతే, మేము వెనక్కి వెళ్లి విధానం మరియు శిక్షణా సెట్ రెండింటినీ పునఃపరిశీలిస్తాము.
రోబ్లాక్స్ వంటి ప్లాట్ఫారమ్ యొక్క సృజనాత్మక స్వభావం, ఇక్కడ వినియోగదారులు దాదాపు దేనినైనా సృష్టించడానికి మరియు సంభాషించడానికి స్వేచ్ఛగా ఉంటారు, అది ఎల్లప్పుడూ అభివృద్ధి చెందుతూ ఉంటుంది. మా కమ్యూనిటీని సురక్షితంగా మరియు పౌరసభ్యతతో ఉంచడానికి మా మోడరేషన్ పద్ధతులు కూడా అంతే వేగంగా అభివృద్ధి చెందాలి. భాష అభివృద్ధి చెందుతున్నప్పుడు, వినియోగదారుల నమూనాలు మారుతున్నప్పుడు మరియు వాస్తవ ప్రపంచ సంఘటనలు జరిగినప్పుడు మా యాక్టివ్ లెర్నింగ్ సిస్టమ్స్ నిరంతరం మోడళ్లను అప్డేట్ చేస్తాయి. మనం అందరం జీవిస్తున్న గతిశీల ప్రపంచానికి అనుగుణంగా స్కేలబుల్, వేగవంతమైన, కచ్చితమైన మరియు స్థిరంగా మారే సిస్టమ్స్ను మేము నిరంతరం నిర్మిస్తున్నాము.
1 2025 మొదటి త్రైమాసికం నాటికి.
2 ఫిబ్రవరి 17, 2024 నుండి డిసెంబర్ 31, 2024 వరకు ఉన్న రిపోర్టింగ్ కాలాన్ని కవర్ చేస్తుంది.


