ఈ సైట్‌లోని విషయాలు కృత్రిమ మేధస్సు (AI) లేదా యంత్ర అనువాద సాంకేతికత ఉపయోగించి అనువదించబడ్డాయి మరియు లోపాలు ఉండవచ్చు.

Skip to content

22 కొత్త భాషలు మరియు మరింత పదునైన గుర్తింపు సామర్థ్యాలతో మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్‌ను అప్‌గ్రేడ్ చేయడం

కొత్త భాషలు, 2 కొత్త ఉల్లంఘన వర్గాలు, మరియు 14% అధిక రికాల్

రోబ్లాక్స్ రోజుకు 30 భాషలలో లక్షలాది నిమిషాల వాయిస్ డేటాను సులభతరం చేస్తుంది, ఇది భారీ స్థాయిలో నిజ-సమయ భద్రతలో ఒక పెద్ద సవాలును సూచిస్తుంది. గత రెండు సంవత్సరాలుగా, మా అంతర్గత వ్యవస్థలు గణనీయంగా అభివృద్ధి చెందాయి—94.6 మిలియన్ల నుండి 320 మిలియన్ల పారామితులకు పెరిగాయి మరియు ఐదు నుండి ఎనిమిది పాలసీ ఉల్లంఘన వర్గాలకు విస్తరించాయి—ఇప్పుడు గరిష్టంగా సెకనుకు 10,000 అభ్యర్థనలను నిర్వహించగలుగుతున్నాయి. 

పరిశ్రమలో వాయిస్ భద్రతను ముందుకు తీసుకెళ్లడానికి సహాయపడటానికి, మేము 2024లో మా అంతర్లీన వాయిస్ భద్రతా వర్గీకరణ మోడల్‌ను ఓపెన్ సోర్స్ చేసాము, మరియు ఈ రోజు మేము మోడల్ యొక్క v3 వెర్షన్‌ను విడుదల చేస్తున్నాము. ఇది మునుపటి వెర్షన్‌తో పోలిస్తే, వినియోగదారులకు 22 కొత్త భాషలకు మద్దతును మరియు రెండు అదనపు పాలసీ ఉల్లంఘన వర్గాలను 14% ఎక్కువ రికాల్‌తో మరియు 5% ఎక్కువ ప్రెసిషన్‌తో అందిస్తుంది.

V1 నుండి V3 మరియు అంతకు మించి 

మేము నిజ-సమయ వాయిస్ భద్రత కోసం ఒక వ్యవస్థను నిర్మించడానికి ప్రారంభించినప్పుడు, మేము మొదట ఇంగ్లీష్‌పై దృష్టి పెట్టాము. అధిక పరిమాణంలో శిక్షణా డేటాను రూపొందించడానికి మేము ఒక ఆటోమేటెడ్ మెషిన్-లేబులింగ్ పైప్‌లైన్‌ను నిర్మించాము. 2024లో, ఓపెన్-సోర్స్ మోడల్ యొక్క v1, మోడల్ శిక్షణ కోసం 2,400 గంటల మెషిన్-లేబుల్ చేయబడిన ఇంగ్లీష్ డేటాను ఉపయోగించింది. ప్రారంభ ప్రారంభం మరియు నోటిఫికేషన్ అమలు తర్వాత, U.S. దుర్వినియోగ నివేదిక రేట్లు ప్రతి గంట మాటలలో 50% కంటే ఎక్కువ తగ్గాయి. 

2025లో, మేము మరిన్ని భాషలను జోడించి, మోడల్‌ను మరింతగా ట్యూన్ చేసి, మోడల్ యొక్క v2ని విడుదల చేశాము. 2026లో తాజా v3 మోడల్‌ను శిక్షణ ఇవ్వడానికి, మేము 250,000 గంటల మెషిన్-లేబుల్డ్ బహుభాషా డేటాను మరియు 29,000 గంటల హ్యూమన్-లేబుల్డ్ బహుభాషా డేటాను ఉపయోగించాము. ప్రతి మోడల్‌ను హ్యూమన్-లేబుల్డ్ డేటాసెట్‌లను ఉపయోగించి మూల్యాంకనం చేయబడింది.

ఓపెన్-సోర్స్ మోడల్ యొక్క V3, 1% ఫాల్స్ పాజిటివ్ రేటు వద్ద, రాబ్లాక్స్ వాయిస్ చాట్ భాషల పంపిణీతో వెయిటెడ్ రికాల్‌లో 61% సాధిస్తుంది. పోలిక కోసం కేవలం మోడల్ యొక్క v2 మద్దతు ఇచ్చే భాషలను ఉపయోగించి, భాషా ప్రాబల్యంతో వెయిటెడ్ రికాల్‌లో v3 14% సాపేక్ష మెరుగుదలను చూపుతుంది.

వాయిస్ భద్రత అనేది ఏకంగా పరిష్కరించడానికి చాలా ముఖ్యమైన విషయం. భద్రతా సాంకేతికతలో పురోగతిని పంచుకోవడం మొత్తం పరిశ్రమను బలోపేతం చేస్తుందని మేము నమ్ముతున్నాము కాబట్టి, మేము మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్‌ను ఓపెన్ సోర్స్ చేసాము మరియు ROOSTలో వ్యవస్థాపక భాగస్వామిగా చేరాము. మొదటి విడుదల నుండి హగ్గింగ్ ఫేస్‌లో ఈ మోడల్ 70,000 కంటే ఎక్కువ సార్లు డౌన్‌లోడ్ చేయబడింది, మరియు మా కమ్యూనిటీ అంతటా మా అంతర్గత మోడల్‌లను పెద్ద ఎత్తున నడపడం ద్వారా మేము నేర్చుకున్న విషయాల ఆధారంగా ప్రతి అప్‌డేట్ రూపుదిద్దుకుంది. మేము మా భద్రతా వ్యవస్థలపై నిరంతరం మెరుగుదలలు చేస్తూనే ఉన్నాము, మరియు భవిష్యత్తులో మరిన్ని అప్‌డేట్‌లను పంచుకోవడానికి ఎదురుచూస్తున్నాము. 

కృతజ్ఞతలు: ఈ ప్రాజెక్ట్‌పై వారి పని కోసం థామస్ బుయి, మెఘాత్రిసా ఛటర్జీ, బ్రిడ్జెట్ డాలీ, జాసన్ గోలుబాక్, హానెస్ హెకిన్‌హీమో, మారెక్ కాపోల్కా, చెరిల్ క్వాన్, మార్కస్ లాంగ్, ఆష్నా శర్మ, హావో-ఎన్ సుంగ్, టింగ్‌టింగ్ టాంగ్, మరియు అలెక్స్ ట్రిమ్ లకు మేము ధన్యవాదాలు తెలియజేస్తున్నాము.