शेअर करा

आमच्या व्हॉइस सेफ्टी क्लासिफायरचे 22 नवीन भाषा आणि अधिक तीक्ष्ण शोध क्षमतांसह अपग्रेड

नवीन भाषा, 2 नवीन उल्लंघन श्रेण्या, आणि 14% अधिक रिकॉल

लेखक नरेन कोनेरू, उपाध्यक्ष, अभियांत्रिकी, वेसा सिल्वोला आणि जॅने पिल्क्कोनेन

प्रकाशित १७ जून, २०२६

Roblox दररोज 30 भाषांमध्ये दशलक्ष मिनिटांचा व्हॉइस डेटा सुलभ करते, जे मोठ्या प्रमाणावर रिअल-टाइम सुरक्षिततेसाठी एक प्रचंड आव्हान आहे. गेल्या दोन वर्षांत, आमच्या अंतर्गत प्रणालींमध्ये लक्षणीय बदल झाले आहेत—पॅरामीटर्स 94.6 दशलक्षांवरून 320 दशलक्ष झाले आहेत आणि धोरण उल्लंघन श्रेण्या पाचवरून आठपर्यंत वाढवल्या आहेत—आणि आता शिखरावर प्रति सेकंद 10,000 विनंत्या हाताळू शकतात.

उद्योगात व्हॉइस सेफ्टी पुढे नेण्यासाठी मदत करण्यासाठी, आम्ही २०२४ मध्ये आमचा अंतर्निहित व्हॉइस सेफ्टी क्लासिफायर मॉडेल ओपन-सोर्स केला आहे, आणि आज आम्ही या मॉडेलची v3 आवृत्ती जारी करत आहोत, जी वापरकर्त्यांना २२ नवीन भाषांसाठी समर्थन आणि दोन अतिरिक्त धोरण उल्लंघन श्रेण्यांसह, मागील आवृत्तीच्या तुलनेत १४% अधिक रिकॉल आणि ५% अधिक प्रिसिजन प्रदान करते.

V1 ते V3 आणि त्यापलीकडे

जेव्हा आम्ही रिअल-टाइम व्हॉइस सेफ्टीसाठी एक प्रणाली तयार करण्यास सुरुवात केली, तेव्हा आम्ही प्रथम इंग्रजीवर लक्ष केंद्रित केले. आम्ही मोठ्या प्रमाणात प्रशिक्षण डेटा तयार करण्यासाठी एक स्वयंचलित मशीन-लेबलिंग पाइपलाइन तयार केली. २०२४ मध्ये, ओपन-सोर्स मॉडेलच्या v1 मध्ये मॉडेल प्रशिक्षणासाठी २,४०० तासांचा मशीन-लेबल केलेला इंग्रजी डेटा वापरला गेला. प्रारंभिक लॉन्च आणि सूचना अंमलबजावणीनंतर, अमेरिकेतील गैरवापर अहवाल दर प्रति तास भाषणावर ५०% पेक्षा जास्त घटला.

२०२५ मध्ये, आम्ही अधिक भाषा जोडल्या, मॉडेलचे आणखी ट्यूनिंग केले आणि मॉडेलचे v2 जारी केले. २०२६ मध्ये नवीनतम v3 मॉडेलचे प्रशिक्षण देण्यासाठी, आम्ही २,५०,००० तासांचा मशीन-लेबल केलेला बहुभाषिक डेटा आणि २९,००० तासांचा मानवी-लेबल केलेला बहुभाषिक डेटा वापरला. प्रत्येक मॉडेलचे मूल्यांकन मानवी-लेबल केलेल्या डेटासेटचा वापर करून केले गेले.

ओपन-सोर्स मॉडेलच्या V3 ने Roblox व्हॉइस चॅटमधील भाषा वितरणावर आधारित 1% खोटे सकारात्मक दरावर 61% रिकॉल प्राप्त केले आहे. फक्त मॉडेलच्या v2 द्वारे समर्थित भाषांचा वापर करून तुलना केल्यास, भाषा प्रसारानुसार वजनीकृत रिकॉलमध्ये v3 मध्ये 14% सापेक्ष सुधारणा दिसून येते.

स्वतंत्रपणे सोडवण्यासाठी व्हॉइस सुरक्षा खूपच महत्त्वाची आहे. आम्ही आमचा व्हॉइस सुरक्षा वर्गीकरणकर्ता (classifier) ओपन-सोर्स केला आणि ROOST मध्ये संस्थापक भागीदार म्हणून सामील झालो कारण आमचा विश्वास आहे की सुरक्षा तंत्रज्ञानातील प्रगती शेअर केल्याने संपूर्ण उद्योग बळकट होतो. पहिल्या प्रकाशनापासून Hugging Face वर हा मॉडेल 70,000 पेक्षा जास्त वेळा डाउनलोड झाला आहे, आणि प्रत्येक अद्यतनाला आमच्या समुदायात मोठ्या प्रमाणावर आमचे अंतर्गत मॉडेल चालवून मिळालेल्या शिकवणींनी आकार दिला आहे. आम्ही आमच्या सुरक्षा प्रणालींवर सातत्याने सुधारणा करत आहोत, आणि भविष्यात आणखी अद्यतने शेअर करण्यास उत्सुक आहोत.

कृतज्ञता: या प्रकल्पावर केलेल्या कामाबद्दल आम्हाला थॉमस बुई, मेघाट्रिसा चॅटर्जी, ब्रिजेट डेली, जेसन गोलुबॉक, हॅनेस हेकिनहाइमो, मारेक कॅपोल्का, चेरिल क्वान, मार्कस लँग, आश्ना शर्मा, हाओ-एन सुंग, टिंगटिंग टँग आणि अॅलेक्स ट्रिम यांचे आभार मानायचे आहेत.

आमच्या व्हॉइस सेफ्टी क्लासिफायरचे 22 नवीन भाषा आणि अधिक तीक्ष्ण शोध क्षमतांसह अपग्रेड

V1 ते V3 आणि त्यापलीकडे

बातमी

प्रगतीशील एआय संस्थापक रॉब्लॉक्स रिऍलिटी व्हिजन गतीने पुढे नेण्यासाठी एकत्र आले

अभियांत्रिकी

क्यूबपार्ट: एक खुल्या शब्दसंग्रहाचा, भागात्मकपणे नियंत्रित 3D जनरेटर

अभियांत्रिकी

Roblox हायब्रिड आर्किटेक्चर सादर करत आहोत: फोटोरियालिस्टिक, मल्टीप्लेअर गेमिंगचे लोकशाहीकरण