22の新しい言語とより精度の高い検出機能を備えた「Voice Safety」分類器のアップグレード
対応言語の追加、違反カテゴリの2つの新設、およびリコール率14%向上

Robloxでは、30の言語にわたる音声データを毎日数百万分規模で処理しており、これは大規模なリアルタイムの安全対策において極めて大きな課題となっています。過去2年間で、当社の内部システムは大幅に進化しました。パラメータ数は9,460万から3億2,000万に増加し、ポリシー違反のカテゴリーも5つから8つに拡大し、現在ではピーク時に1秒あたり1万件のリクエストを処理できるようになりました。
当社は2024年、業界全体の音声安全性の向上に貢献するため、基盤となる音声安全分類モデルをオープンソース化しました。そして本日、同モデルのバージョン3をリリースします。このバージョンでは、22の新しい言語と2つの追加ポリシー違反カテゴリに対応し、前バージョンと比較してリコール率が14%向上、精度が5%向上しています。
V1からV3、そしてその先へ
リアルタイムの音声安全システムを構築するにあたり、当社はまず英語に焦点を当てました。大量のトレーニングデータを生成するため、自動機械ラベリングパイプラインを構築しました。2024年、オープンソースモデルのv1では、モデルトレーニングに2,400時間分の機械ラベリング済み英語データを使用しました。初期リリースと通知機能の実装後、米国における虐待報告率は、音声1時間あたり50%以上減少しました。
2025年には、さらに多くの言語を追加し、モデルを微調整してv2をリリースしました。2026年に最新のv3モデルを学習させるために、25万時間の機械ラベリング済み多言語データと2万9,000時間のヒトによるラベリング済み多言語データを使用しました。すべてのモデルは、ヒトによるラベリング済みデータセットを用いて評価されました。
オープンソースモデルのv3は、Robloxのボイスチャットにおける言語分布で重み付けされたリコール率61%を、誤検知率1%で達成しています。比較のためにv2モデルが対応していた言語のみを対象とした場合、v3は言語の普及率で重み付けされたリコール率において14%の相対的な改善を示しています。
音声の安全性は、単独で解決できるほど単純な問題ではありません。私たちは、音声安全分類モデルをオープンソース化し、ROOSTに創設パートナーとして参加しました。これは、安全技術の進歩を共有することが業界全体を強化すると信じているからです。このモデルは、最初のリリース以来、Hugging Faceで70,000回以上ダウンロードされており、各アップデートは、コミュニティ全体で内部モデルを大規模に運用して得た知見に基づいて形作られています。 私たちは引き続き安全システムの改良を重ねており、今後さらなるアップデートを共有できることを楽しみにしています。
謝辞:本プロジェクトに携わってくださったThomas Bui、Meghatrisa Chatterjee、Bridget Daly、Jason Golubock、Hannes Heikinheimo、Marek Kapolka、Cheryl Kwan、Markus Lang、Aashna Sharma、Hao-En Sung、Tingting Tang、Alex Trimmの各氏に感謝申し上げます。


