हमारे वॉइस सेफ्टी क्लासिफायर को 22 नई भाषाओं और बेहतर पहचान क्षमताओं के साथ अपग्रेड करना
नई भाषाएँ, 2 नई उल्लंघन श्रेणियाँ, और 14% अधिक रिकॉल

रॉब्लॉक्स 30 भाषाओं में प्रतिदिन लाखों मिनट का वॉयस डेटा संसाधित करता है, जो बड़े पैमाने पर रीयल-टाइम सुरक्षा में एक बड़ी चुनौती पेश करता है। पिछले दो वर्षों में, हमारी आंतरिक प्रणालियाँ काफी विकसित हुई हैं—94.6 मिलियन से बढ़कर 320 मिलियन पैरामीटर और पाँच से बढ़कर आठ नीति उल्लंघन श्रेणियों तक विस्तारित—अब पीक पर प्रति सेकंड 10,000 अनुरोधों को संभालने के लिए।
हमने उद्योग भर में वॉयस सुरक्षा को आगे बढ़ाने में मदद करने के लिए 2024 में अपने अंतर्निहित वॉयस सेफ्टी क्लासिफायर मॉडल को ओपन-सोर्स किया, और आज हम मॉडल का v3 जारी कर रहे हैं, जो पिछले संस्करण की तुलना में उपयोगकर्ताओं को 22 नई भाषाओं और दो अतिरिक्त नीति उल्लंघन श्रेणियों के लिए 14% अधिक रिकॉल और 5% अधिक सटीकता के साथ समर्थन देता है।
V1 से V3 और आगे
जब हमने रीयल-टाइम वॉयस सेफ्टी के लिए एक सिस्टम बनाने की शुरुआत की, तो हमने पहले अंग्रेज़ी पर ध्यान केंद्रित किया। हमने उच्च मात्रा में प्रशिक्षण डेटा उत्पन्न करने के लिए एक स्वचालित मशीन-लेबलिंग पाइपलाइन बनाई। 2024 में, ओपन-सोर्स मॉडल के v1 ने मॉडल प्रशिक्षण के लिए 2,400 घंटे के मशीन-लेबल किए गए अंग्रेज़ी डेटा का उपयोग किया। शुरुआती लॉन्च और सूचना कार्यान्वयन के बाद, अमेरिकी दुर्व्यवहार रिपोर्ट की दरें प्रति घंटे की वाक् में 50% से अधिक कम हो गईं।
2025 में, हमने और अधिक भाषाएँ जोड़ीं और मॉडल को और बेहतर बनाया और मॉडल का v2 जारी किया। 2026 में नवीनतम v3 मॉडल को प्रशिक्षित करने के लिए, हमने 250,000 घंटे के मशीन-लेबल किए गए बहुभाषी डेटा और 29,000 घंटे के मानव-लेबल किए गए बहुभाषी डेटा का उपयोग किया। प्रत्येक मॉडल का मूल्यांकन मानव-लेबल किए गए डेटासेट का उपयोग करके किया गया।
ओपन-सोर्स मॉडल का V3, 1% फॉलस पॉज़िटिव दर पर, रॉब्लॉक्स वॉयस चैट भाषा वितरण से वेटेड 61% रिकॉल प्राप्त करता है। तुलना के लिए केवल मॉडल के v2 द्वारा समर्थित भाषाओं का उपयोग करने पर, v3 भाषा प्रचलन से वेटेड रिकॉल में 14% सापेक्ष सुधार दिखाता है।
आवाज़ सुरक्षा बहुत महत्वपूर्ण है कि इसे अलग से हल किया जाए। हमने अपने वॉयस सेफ्टी क्लासिफायर को ओपन-सोर्स किया और ROOST में एक संस्थापक भागीदार के रूप में शामिल हुए क्योंकि हमारा मानना है कि सुरक्षा तकनीक में प्रगति साझा करने से पूरा उद्योग मजबूत होता है। पहले रिलीज़ के बाद से हगिंग फेस (Hugging Face) पर इस मॉडल को 70,000 से अधिक बार डाउनलोड किया गया है, और प्रत्येक अपडेट को हमारे समुदाय में बड़े पैमाने पर अपने आंतरिक मॉडल चलाने से मिली सीख के आधार पर आकार दिया गया है। हम अपनी सुरक्षा प्रणालियों पर लगातार सुधार करते रहते हैं, और हम भविष्य में और अपडेट साझा करने के लिए उत्सुक हैं।
कृतज्ञता: हम इस परियोजना पर उनके काम के लिए थॉमस बूई, मेघाट्रिसा चटर्जी, ब्रिजेट डेली, जेसन गोलुबॉक, हान्स हेकिनहेइमो, मारెక్ कापोल्का, शेरील क्वान, मार्कस लैंग, आश्ना शर्मा, हाओ-एन सुंग, टिंगटिंग टैंग, और एलेक्स ट्रिम को धन्यवाद देना चाहेंगे।


