De content op deze site is vertaald met behulp van kunstmatige intelligentie (AI) of machinevertalingstechnologie en kan fouten bevatten.

Skip to content

Uitbreiding van onze Voice Safety Classifier met 22 nieuwe talen en verbeterde detectiemogelijkheden

Nieuwe talen, 2 nieuwe categorieën overtredingen en 14% betere recall

Roblox verwerkt dagelijks miljoenen minuten aan spraakgegevens in 30 talen, wat een enorme uitdaging vormt voor realtime veiligheid op grote schaal. In de afgelopen twee jaar zijn onze interne systemen aanzienlijk geëvolueerd – van 94,6 miljoen naar 320 miljoen parameters en van vijf naar acht categorieën voor beleidsschendingen – waardoor we nu tijdens piekmomenten 10.000 verzoeken per seconde kunnen verwerken. 

In 2024 hebben we ons onderliggende classificatiemodel voor spraakveiligheid als open source vrijgegeven om de spraakveiligheid in de hele sector te bevorderen, en vandaag brengen we versie 3 van het model uit, die gebruikers ondersteuning biedt voor 22 nieuwe talen en twee extra categorieën voor beleidsschendingen, met een 14% hogere recall en een 5% hogere precisie in vergelijking met de vorige versie.

Van V1 naar V3 en verder 

Toen we begonnen met het bouwen van een systeem voor realtime spraakveiligheid, richtten we ons eerst op het Engels. We bouwden een geautomatiseerde pijplijn voor machinale labeling om een grote hoeveelheid trainingsdata te genereren. In 2024 gebruikte versie 1 van het open-source-model 2.400 uur aan machinaal gelabelde Engelse data voor het trainen van het model. Na de eerste lancering en de implementatie van meldingsmechanismen daalde het aantal meldingen van misbruik in de VS met meer dan 50% per uur spraak. 

In 2025 voegden we meer talen toe, verfijnden we het model verder en brachten we versie 2 van het model uit. Voor het trainen van het nieuwste v3-model in 2026 gebruikten we 250.000 uur aan door machines gelabelde meertalige gegevens en 29.000 uur aan door mensen gelabelde meertalige gegevens. Elk model werd geëvalueerd met behulp van door mensen gelabelde datasets.

V3 van het open-source-model bereikt een recall van 61%, gewogen naar de taalverdeling in de Roblox-spraakchat, bij een percentage valse positieven van 1%. Als we ter vergelijking alleen de talen gebruiken die door v2 van het model worden ondersteund, laat v3 een relatieve verbetering van 14% zien in de recall, gewogen naar de prevalentie van de taal.

Spraakveiligheid is te belangrijk om afzonderlijk aan te pakken. We hebben onze classificator voor spraakveiligheid als open source beschikbaar gesteld en zijn als oprichtingspartner toegetreden tot ROOST, omdat we geloven dat het delen van vooruitgang op het gebied van veiligheidstechnologie de hele sector versterkt. Het model is sinds de eerste release meer dan 70.000 keer gedownload op Hugging Face, en elke update is gevormd door wat we hebben geleerd bij het op grote schaal draaien van onze interne modellen binnen onze community. We blijven onze veiligheidssystemen verder ontwikkelen en kijken ernaar uit om in de toekomst meer updates te delen. 

Dankwoord: We willen Thomas Bui, Meghatrisa Chatterjee, Bridget Daly, Jason Golubock, Hannes Heikinheimo, Marek Kapolka, Cheryl Kwan, Markus Lang, Aashna Sharma, Hao-En Sung, Tingting Tang en Alex Trimm bedanken voor hun bijdrage aan dit project.