22 కొత్త భాషలు మరియు మరింత పదునైన గుర్తింపు సామర్థ్యాలతో మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్ను అప్గ్రేడ్ చేయడం
కొత్త భాషలు, 2 కొత్త ఉల్లంఘన వర్గాలు, మరియు 14% అధిక రికాల్

రోబ్లాక్స్ రోజుకు 30 భాషలలో లక్షలాది నిమిషాల వాయిస్ డేటాను సులభతరం చేస్తుంది, ఇది భారీ స్థాయిలో నిజ-సమయ భద్రతలో ఒక పెద్ద సవాలును సూచిస్తుంది. గత రెండు సంవత్సరాలుగా, మా అంతర్గత వ్యవస్థలు గణనీయంగా అభివృద్ధి చెందాయి—94.6 మిలియన్ల నుండి 320 మిలియన్ల పారామితులకు పెరిగాయి మరియు ఐదు నుండి ఎనిమిది పాలసీ ఉల్లంఘన వర్గాలకు విస్తరించాయి—ఇప్పుడు గరిష్టంగా సెకనుకు 10,000 అభ్యర్థనలను నిర్వహించగలుగుతున్నాయి.
పరిశ్రమలో వాయిస్ భద్రతను ముందుకు తీసుకెళ్లడానికి సహాయపడటానికి, మేము 2024లో మా అంతర్లీన వాయిస్ భద్రతా వర్గీకరణ మోడల్ను ఓపెన్ సోర్స్ చేసాము, మరియు ఈ రోజు మేము మోడల్ యొక్క v3 వెర్షన్ను విడుదల చేస్తున్నాము. ఇది మునుపటి వెర్షన్తో పోలిస్తే, వినియోగదారులకు 22 కొత్త భాషలకు మద్దతును మరియు రెండు అదనపు పాలసీ ఉల్లంఘన వర్గాలను 14% ఎక్కువ రికాల్తో మరియు 5% ఎక్కువ ప్రెసిషన్తో అందిస్తుంది.
V1 నుండి V3 మరియు అంతకు మించి
మేము నిజ-సమయ వాయిస్ భద్రత కోసం ఒక వ్యవస్థను నిర్మించడానికి ప్రారంభించినప్పుడు, మేము మొదట ఇంగ్లీష్పై దృష్టి పెట్టాము. అధిక పరిమాణంలో శిక్షణా డేటాను రూపొందించడానికి మేము ఒక ఆటోమేటెడ్ మెషిన్-లేబులింగ్ పైప్లైన్ను నిర్మించాము. 2024లో, ఓపెన్-సోర్స్ మోడల్ యొక్క v1, మోడల్ శిక్షణ కోసం 2,400 గంటల మెషిన్-లేబుల్ చేయబడిన ఇంగ్లీష్ డేటాను ఉపయోగించింది. ప్రారంభ ప్రారంభం మరియు నోటిఫికేషన్ అమలు తర్వాత, U.S. దుర్వినియోగ నివేదిక రేట్లు ప్రతి గంట మాటలలో 50% కంటే ఎక్కువ తగ్గాయి.
2025లో, మేము మరిన్ని భాషలను జోడించి, మోడల్ను మరింతగా ట్యూన్ చేసి, మోడల్ యొక్క v2ని విడుదల చేశాము. 2026లో తాజా v3 మోడల్ను శిక్షణ ఇవ్వడానికి, మేము 250,000 గంటల మెషిన్-లేబుల్డ్ బహుభాషా డేటాను మరియు 29,000 గంటల హ్యూమన్-లేబుల్డ్ బహుభాషా డేటాను ఉపయోగించాము. ప్రతి మోడల్ను హ్యూమన్-లేబుల్డ్ డేటాసెట్లను ఉపయోగించి మూల్యాంకనం చేయబడింది.
ఓపెన్-సోర్స్ మోడల్ యొక్క V3, 1% ఫాల్స్ పాజిటివ్ రేటు వద్ద, రాబ్లాక్స్ వాయిస్ చాట్ భాషల పంపిణీతో వెయిటెడ్ రికాల్లో 61% సాధిస్తుంది. పోలిక కోసం కేవలం మోడల్ యొక్క v2 మద్దతు ఇచ్చే భాషలను ఉపయోగించి, భాషా ప్రాబల్యంతో వెయిటెడ్ రికాల్లో v3 14% సాపేక్ష మెరుగుదలను చూపుతుంది.
వాయిస్ భద్రత అనేది ఏకంగా పరిష్కరించడానికి చాలా ముఖ్యమైన విషయం. భద్రతా సాంకేతికతలో పురోగతిని పంచుకోవడం మొత్తం పరిశ్రమను బలోపేతం చేస్తుందని మేము నమ్ముతున్నాము కాబట్టి, మేము మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్ను ఓపెన్ సోర్స్ చేసాము మరియు ROOSTలో వ్యవస్థాపక భాగస్వామిగా చేరాము. మొదటి విడుదల నుండి హగ్గింగ్ ఫేస్లో ఈ మోడల్ 70,000 కంటే ఎక్కువ సార్లు డౌన్లోడ్ చేయబడింది, మరియు మా కమ్యూనిటీ అంతటా మా అంతర్గత మోడల్లను పెద్ద ఎత్తున నడపడం ద్వారా మేము నేర్చుకున్న విషయాల ఆధారంగా ప్రతి అప్డేట్ రూపుదిద్దుకుంది. మేము మా భద్రతా వ్యవస్థలపై నిరంతరం మెరుగుదలలు చేస్తూనే ఉన్నాము, మరియు భవిష్యత్తులో మరిన్ని అప్డేట్లను పంచుకోవడానికి ఎదురుచూస్తున్నాము.
కృతజ్ఞతలు: ఈ ప్రాజెక్ట్పై వారి పని కోసం థామస్ బుయి, మెఘాత్రిసా ఛటర్జీ, బ్రిడ్జెట్ డాలీ, జాసన్ గోలుబాక్, హానెస్ హెకిన్హీమో, మారెక్ కాపోల్కా, చెరిల్ క్వాన్, మార్కస్ లాంగ్, ఆష్నా శర్మ, హావో-ఎన్ సుంగ్, టింగ్టింగ్ టాంగ్, మరియు అలెక్స్ ట్రిమ్ లకు మేము ధన్యవాదాలు తెలియజేస్తున్నాము.


