इस साइट की सामग्री का अनुवाद कृत्रिम बुद्धिमत्ता (AI) या मशीन अनुवाद तकनीक का उपयोग करके किया गया है, और इसमें त्रुटियाँ हो सकती हैं.

Skip to content

हमारे वॉइस सेफ्टी क्लासिफायर को 22 नई भाषाओं और बेहतर पहचान क्षमताओं के साथ अपग्रेड करना

नई भाषाएँ, 2 नई उल्लंघन श्रेणियाँ, और 14% अधिक रिकॉल

रॉब्लॉक्स 30 भाषाओं में प्रतिदिन लाखों मिनट का वॉयस डेटा संसाधित करता है, जो बड़े पैमाने पर रीयल-टाइम सुरक्षा में एक बड़ी चुनौती पेश करता है। पिछले दो वर्षों में, हमारी आंतरिक प्रणालियाँ काफी विकसित हुई हैं—94.6 मिलियन से बढ़कर 320 मिलियन पैरामीटर और पाँच से बढ़कर आठ नीति उल्लंघन श्रेणियों तक विस्तारित—अब पीक पर प्रति सेकंड 10,000 अनुरोधों को संभालने के लिए। 

हमने उद्योग भर में वॉयस सुरक्षा को आगे बढ़ाने में मदद करने के लिए 2024 में अपने अंतर्निहित वॉयस सेफ्टी क्लासिफायर मॉडल को ओपन-सोर्स किया, और आज हम मॉडल का v3 जारी कर रहे हैं, जो पिछले संस्करण की तुलना में उपयोगकर्ताओं को 22 नई भाषाओं और दो अतिरिक्त नीति उल्लंघन श्रेणियों के लिए 14% अधिक रिकॉल और 5% अधिक सटीकता के साथ समर्थन देता है।

V1 से V3 और आगे 

जब हमने रीयल-टाइम वॉयस सेफ्टी के लिए एक सिस्टम बनाने की शुरुआत की, तो हमने पहले अंग्रेज़ी पर ध्यान केंद्रित किया। हमने उच्च मात्रा में प्रशिक्षण डेटा उत्पन्न करने के लिए एक स्वचालित मशीन-लेबलिंग पाइपलाइन बनाई। 2024 में, ओपन-सोर्स मॉडल के v1 ने मॉडल प्रशिक्षण के लिए 2,400 घंटे के मशीन-लेबल किए गए अंग्रेज़ी डेटा का उपयोग किया। शुरुआती लॉन्च और सूचना कार्यान्वयन के बाद, अमेरिकी दुर्व्यवहार रिपोर्ट की दरें प्रति घंटे की वाक् में 50% से अधिक कम हो गईं। 

2025 में, हमने और अधिक भाषाएँ जोड़ीं और मॉडल को और बेहतर बनाया और मॉडल का v2 जारी किया। 2026 में नवीनतम v3 मॉडल को प्रशिक्षित करने के लिए, हमने 250,000 घंटे के मशीन-लेबल किए गए बहुभाषी डेटा और 29,000 घंटे के मानव-लेबल किए गए बहुभाषी डेटा का उपयोग किया। प्रत्येक मॉडल का मूल्यांकन मानव-लेबल किए गए डेटासेट का उपयोग करके किया गया।

ओपन-सोर्स मॉडल का V3, 1% फॉलस पॉज़िटिव दर पर, रॉब्लॉक्स वॉयस चैट भाषा वितरण से वेटेड 61% रिकॉल प्राप्त करता है। तुलना के लिए केवल मॉडल के v2 द्वारा समर्थित भाषाओं का उपयोग करने पर, v3 भाषा प्रचलन से वेटेड रिकॉल में 14% सापेक्ष सुधार दिखाता है।

आवाज़ सुरक्षा बहुत महत्वपूर्ण है कि इसे अलग से हल किया जाए। हमने अपने वॉयस सेफ्टी क्लासिफायर को ओपन-सोर्स किया और ROOST में एक संस्थापक भागीदार के रूप में शामिल हुए क्योंकि हमारा मानना है कि सुरक्षा तकनीक में प्रगति साझा करने से पूरा उद्योग मजबूत होता है। पहले रिलीज़ के बाद से हगिंग फेस (Hugging Face) पर इस मॉडल को 70,000 से अधिक बार डाउनलोड किया गया है, और प्रत्येक अपडेट को हमारे समुदाय में बड़े पैमाने पर अपने आंतरिक मॉडल चलाने से मिली सीख के आधार पर आकार दिया गया है। हम अपनी सुरक्षा प्रणालियों पर लगातार सुधार करते रहते हैं, और हम भविष्य में और अपडेट साझा करने के लिए उत्सुक हैं। 

कृतज्ञता: हम इस परियोजना पर उनके काम के लिए थॉमस बूई, मेघाट्रिसा चटर्जी, ब्रिजेट डेली, जेसन गोलुबॉक, हान्स हेकिनहेइमो, मारెక్ कापोल्का, शेरील क्वान, मार्कस लैंग, आश्ना शर्मा, हाओ-एन सुंग, टिंगटिंग टैंग, और एलेक्स ट्रिम को धन्यवाद देना चाहेंगे।