تحديث مصنف الأمان الصوتي الخاص بنا بإضافة 22 لغة جديدة وقدرات كشف أكثر دقة
لغات جديدة، وفئتان جديدتان للمخالفات، وزيادة بنسبة 14% في معدل الاسترجاع

تقوم Roblox بمعالجة ملايين الدقائق من البيانات الصوتية يوميًا بـ 30 لغة، مما يمثل تحديًا هائلاً في مجال السلامة في الوقت الفعلي على نطاق واسع. على مدار العامين الماضيين، تطورت أنظمتنا الداخلية بشكل كبير — حيث زاد عدد المعلمات من 94.6 مليون إلى 320 مليون، وتوسعت فئات انتهاكات السياسات من خمس إلى ثماني فئات — لتتمكن الآن من معالجة 10,000 طلب في الثانية في أوقات الذروة.
لقد قمنا بإتاحة نموذج مصنف أمان الصوت الأساسي الخاص بنا كمصدر مفتوح في عام 2024 للمساعدة في تعزيز أمان الصوت في جميع أنحاء الصناعة، واليوم نطلق الإصدار الثالث من النموذج، الذي يوفر للمستخدمين دعمًا لـ 22 لغة جديدة وفئتين إضافيتين لانتهاكات السياسة مع زيادة معدل الاسترجاع بنسبة 14٪ والدقة بنسبة 5٪، مقارنة بالإصدار السابق.
من الإصدار الأول إلى الإصدار الثالث وما بعده
عندما شرعنا في بناء نظام لسلامة المحتوى الصوتي في الوقت الفعلي، ركزنا على اللغة الإنجليزية أولاً. قمنا ببناء مسار تصنيف آلي لتوليد حجم كبير من بيانات التدريب. في عام 2024، استخدم الإصدار الأول (v1) من النموذج مفتوح المصدر 2,400 ساعة من البيانات الإنجليزية المصنفة آليًّا لتدريب النموذج. عقب الإطلاق الأولي وتنفيذ نظام الإبلاغ، انخفضت معدلات الإبلاغ عن الإساءات في الولايات المتحدة بأكثر من 50% لكل ساعة من الكلام.
في عام 2025، أضفنا المزيد من اللغات وقمنا بضبط النموذج بشكل أكبر وأصدرنا الإصدار الثاني (v2) من النموذج. لتدريب أحدث إصدار (v3) من النموذج في عام 2026، استخدمنا 250,000 ساعة من البيانات متعددة اللغات المصنفة آليًّا و29,000 ساعة من البيانات متعددة اللغات المصنفة يدويًّا. تم تقييم كل نموذج باستخدام مجموعات البيانات المصنفة يدويًّا.
يحقق الإصدار v3 من النموذج مفتوح المصدر نسبة استرجاع تبلغ 61% مرجحة حسب توزيع لغات الدردشة الصوتية في Roblox بمعدل إيجابي كاذب يبلغ 1%. وبالمقارنة مع اللغات التي يدعمها الإصدار v2 من النموذج فقط، يُظهر الإصدار v3 تحسناً نسبياً بنسبة 14% في نسبة الاسترجاع المرجحة حسب انتشار اللغة.
تعد سلامة الصوت مسألة بالغة الأهمية بحيث لا يمكن معالجتها بمعزل عن غيرها. لقد قمنا بجعل مصنف سلامة الصوت الخاص بنا مفتوح المصدر وانضممنا إلى ROOST كشريك مؤسس لأننا نؤمن بأن مشاركة التطورات في تكنولوجيا السلامة تعزز الصناعة بأكملها. تم تنزيل النموذج أكثر من 70,000 مرة على Hugging Face منذ الإصدار الأول، وقد تم تشكيل كل تحديث بناءً على ما تعلمناه من تشغيل نماذجنا الداخلية على نطاق واسع عبر مجتمعنا. نواصل تطوير أنظمة السلامة لدينا، ونتطلع إلى مشاركة المزيد من التحديثات في المستقبل.
شكر وتقدير: نود أن نشكر توماس بوي، وميغاتريسا تشاترجي، وبريدجيت دالي، وجيسون جولوبوك، وهانيس هيكينهايمو، وماريك كابولكا، وشيريل كوان، وماركوس لانغ، وآشنا شارما، وهاو-إن سونغ، وتينغتينغ تانغ، وأليكس تريم على عملهم في هذا المشروع.


