Bu sitedeki içerik yapay zeka (AI) veya makine çeviri teknolojisi kullanılarak çevrilmiştir ve hatalar içerebilir.

Skip to content

Ses Güvenliği Sınıflandırıcımızı 22 Yeni Dil ve Daha Keskin Algılama Yetenekleriyle Güncelliyoruz

Yeni Diller, 2 Yeni İhlal Kategorisi ve %14 Daha Yüksek Geri Çağırma Oranı

Roblox, her gün 30 dilde milyonlarca dakikalık ses verisini işliyor ve bu da büyük ölçekte gerçek zamanlı güvenlik açısından muazzam bir zorluk teşkil ediyor. Son iki yıl içinde, iç sistemlerimiz önemli ölçüde gelişti; parametre sayısı 94,6 milyondan 320 milyona çıktı ve politika ihlali kategorileri beşten sekize genişledi. Artık en yoğun anlarda saniyede 10.000 isteği işleyebiliyoruz. 

Sektör genelinde ses güvenliğinin gelişmesine katkıda bulunmak amacıyla 2024 yılında temel ses güvenliği sınıflandırma modelimizi açık kaynak olarak yayınladık. Bugün ise, önceki sürüme kıyasla %14 daha yüksek geri çağırma oranı ve %5 daha yüksek doğruluk oranı sunan, kullanıcılara 22 yeni dil ve iki ek politika ihlali kategorisi desteği sağlayan modelin v3 sürümünü yayınlıyoruz.

V1’den V3’e ve Ötesi 

Gerçek zamanlı ses güvenliği için bir sistem kurmaya başladığımızda, öncelikle İngilizceye odaklandık. Büyük hacimde eğitim verisi üretmek için otomatik bir makine etiketleme süreci oluşturduk. 2024 yılında, açık kaynaklı modelin v1 sürümü, model eğitimi için 2.400 saatlik makine etiketli İngilizce veri kullandı. İlk lansman ve bildirim uygulamasının ardından, ABD’deki kötüye kullanım bildirim oranları konuşma saati başına %50’nin üzerinde düştü. 

2025 yılında, daha fazla dil ekledik, modeli daha da iyileştirdik ve modelin v2 sürümünü yayınladık. 2026’da en son v3 modelini eğitmek için 250.000 saatlik makine etiketli çok dilli veri ve 29.000 saatlik insan etiketli çok dilli veri kullandık. Her model, insan etiketli veri kümeleri kullanılarak değerlendirildi.

Açık kaynaklı modelin v3 sürümü, %1 yanlış pozitif oranında Roblox sesli sohbet dil dağılımına göre ağırlıklandırılmış %61 geri çağırma oranına ulaşmaktadır. Karşılaştırma amacıyla yalnızca modelin v2 sürümü tarafından desteklenen dilleri kullanarak, v3 sürümü dil yaygınlığına göre ağırlıklandırılmış geri çağırma oranında %14’lük göreceli bir iyileşme göstermektedir.

Ses güvenliği, tek başına çözülemeyecek kadar önemli bir konudur. Ses güvenliği sınıflandırıcımızı açık kaynak olarak yayınladık ve ROOST’a kurucu ortak olarak katıldık; çünkü güvenlik teknolojisindeki ilerlemeleri paylaşmanın tüm sektörü güçlendireceğine inanıyoruz. Model, ilk sürümünden bu yana Hugging Face’te 70.000’den fazla kez indirildi ve her güncelleme, topluluğumuz genelinde iç modellerimizi büyük ölçekte çalıştırarak edindiğimiz bilgiler ışığında şekillendirildi. Güvenlik sistemlerimizi geliştirmeye devam ediyoruz ve gelecekte daha fazla güncelleme paylaşmayı sabırsızlıkla bekliyoruz. 

Teşekkürler: Bu projede emek veren Thomas Bui, Meghatrisa Chatterjee, Bridget Daly, Jason Golubock, Hannes Heikinheimo, Marek Kapolka, Cheryl Kwan, Markus Lang, Aashna Sharma, Hao-En Sung, Tingting Tang ve Alex Trimm’e teşekkür ederiz.