このサイトのコンテンツは、人工知能(AI)または機械翻訳技術を使用して翻訳されており、誤りが含まれている場合があります。

Skip to content

オープンソースの音声安全モデルに対応言語を拡充

  • オープンソースの音声安全分類モデルを更新し、パラメータ数を9,460万から1億2,020万に増やし、対応言語を7言語追加しました。
  • 分類器の最初のバージョン以来、英語音声チャットデータにおいて、誤検知率1%で59.1%のリコール率を達成し、精度を向上させました。これは、前回のリリース時のリコール率30.9%から92%の改善となります。

安全性と礼節の促進は、Robloxにおけるあらゆる活動の根幹を成すものです。私たちは20年近くにわたり堅牢な安全システムの構築に取り組んできましたが、新しい技術が登場するにつれ、それらを継続的に拡充・進化させています。2024年には、本日改めて更新を行う「ペアレンタルコントロールの刷新を含め、40件以上の安全機能の改善を実施しました。 また、業界初となるオープンソースの音声安全分類器をリリースし、これまでに23,000回以上ダウンロードされています。本日、さらに精度が向上し、より多くの言語に対応した更新版を公開します。

この分類器を含め、ユーザーの保護に役立つ安全システムの多くは、AIモデルによって支えられています。AIによる安全技術の進歩を共有することが業界全体にとって有益であると認識しているため、これらの技術の一部をオープンソース化しています。また、オープンソースの安全ツールを推進することでデジタル安全の重要な分野に取り組むことを目的とした新しい非営利団体「ROOST」に、私たちは最近、創設パートナーとして参加しました

世界中で毎日当社のプラットフォーム上で発生する膨大な量のコンテンツややり取りを管理する上で、AIはユーザーの安全を守るために不可欠な要素です。私たちが構築したモデルが、こうしたニーズを支えていると確信しています。例えば、2024年第4四半期には、Robloxユーザーが3,000億件のコンテンツをアップロードしました。 これら数十億件に及ぶ動画、音声、テキスト、ボイスチャット、アバター、3D体験のうち、当社のポリシーに違反していると検出されたのはわずか0.01%でした。そして、そのポリシー違反コンテンツのほぼすべては、ユーザーが目にすることがないうちに自動的に事前スクリーニングされ、削除されました。  

音声安全分類器のオープンソース版を更新し、精度を向上させるとともに、より多くの言語でのコンテンツ管理を可能にしました。新しいモデルは:

  • 多言語データを用いたトレーニングにより、スペイン語、ドイツ語、フランス語、ポルトガル語、イタリア語、韓国語、日本語の7言語で違反を検出できるようになりました。
  • 全体的なリコール率は59.1%に向上し、前回のリリース時の30.9%から92%の改善を達成するとともに、誤検知率も低く抑えられています。
  • 大規模な運用に最適化されており、ピーク時には1秒あたり最大8,300件のリクエスト(その大部分は違反を含まないもの)を処理可能です。

最初のモデルのリリース以来、米国のユーザーにおける音声1時間あたりの不正利用報告率は50%以上減少しました。また、このモデルにより、1日数百万分にも及ぶボイスチャットを、人間のモデレーターよりも正確に監視できるようになりました。私たちは安全システムの向上に絶えず取り組んでおり、オープンソース版も引き続き更新していきます。

効率的な多言語音声安全分類器

当初のオープンソース音声安全分類器は、WavLMベースモデルを基盤とし、機械ラベル付けされた英語のボイスチャット音声サンプルを用いて微調整したものでした。このエンドツーエンドアーキテクチャによる有望な結果を受け、カスタマイズされたアーキテクチャを用いたさらなる実験を行いました。大規模な推論サービスに適したモデルの複雑さと精度を最適化するため、ナレッジディスティレーションを採用しました。 新しい分類器はこれらの基本構成要素を活用しつつ、データ活用とアーキテクチャの改良において、これまでの成果を拡張・拡大しています。

多言語データを用いて学習させることで、当社の単一分類器モデルは、サポートする上位8言語のいずれに対してもシームレスに動作します。また、学習手法の改善により、このモデルは初代バージョンと比較して精度が向上しただけでなく、一般的な推論シナリオにおいて実行速度が20%から30%高速化されています。

新しい音声安全分類器は依然としてWavLMアーキテクチャに基づいていますが、層の構成は前回のリリースやWavLMの事前学習済みモデルとは異なります。特に、トランスフォーマー層の内部時間分解能を低減するために、畳み込み層を追加しました。 新しいモデルアーキテクチャのパラメータ総数は1億2020万で、前バージョンの9460万から27%増加しています。パラメータ数が増加したにもかかわらず、4秒から15秒の入力セグメントを使用した場合、新しいモデルの計算時間は20%から30%短縮されています。これは、モデルが入力信号を以前よりも短い表現に圧縮できるためです。

多様なラベリング戦略の活用

エンドツーエンドモデルの教師あり学習には、音声とクラスラベルのペアを精選したデータが必要です。私たちはデータパイプラインを大幅に改善し、ラベル付きデータの安定した供給を確保しました。トレーニングデータの基盤となるのは、対応言語で構成される10万時間以上の音声からなる大規模な機械ラベル付けデータセットです。 音声データを自動的に文字起こしし、当社の社内テキストベースの有害性分類器に投入しました。この分類器は、所定のポリシーおよび有害性カテゴリを共有しています。データ収集においては、境界事例やあまり一般的ではないポリシー違反をより的確に捕捉できるよう、無害な音声よりも有害なコンテンツを高い確率でサンプリングしています。

音声トランスクリプトやテキストベースの分類に基づくラベルだけでは、ボイスチャットコンテンツに見られるニュアンスを完全に捉えることはできません。そこで、前回のトレーニング段階からモデルを微調整するために、人間によるラベル付けデータを活用しました。分類タスク自体は同じですが、この後のトレーニング段階では、判定境界を洗練させ、ボイスチャット特有の表現に対する反応性を高めることができます。これはカリキュラム学習の一形態であり、貴重な人間によるラベル付け例を最大限に活用するのに役立ちます。

エンドツーエンドのモデル学習における課題の一つは、ラベリング方針が時間の経過とともに変更されると、ターゲットラベルが陳腐化してしまう可能性があることです。そのため、許容される音声ポリシーを洗練させていくにつれ、古いラベリング基準を使用したデータに対して特別な処理が必要となります。 このため、我々は、現在のボイスチャットポリシーに合致しないデータセットからもモデルが学習できるマルチタスクアプローチを採用しました。これには、旧ポリシー専用の分類ヘッドを設けることが含まれ、これにより、モデル本体(トランク)がターゲットラベルやメインのヘッドに影響を与えることなく、旧データセットから学習できるようになります。

導入を容易にするためのキャリブレーション済みモデル

分類モデルを使用するには、動作点を決定し、タスク要件に応じて分類器の感度を調整する必要があります。モデルのデプロイを容易にするため、音声チャットモデレーション向けに調整されたモデル出力をキャリブレーションしました。 保持データセットから区分線形変換を推定し、各出力ヘッドおよび対応言語ごとに個別に処理を行いました。これらの変換はモデル蒸留の過程で適用され、最終モデルがネイティブにキャリブレーションされることを保証しました。これにより、推論時の後処理が不要になりました。

この新しいオープンソースモデルをコミュニティの皆様と共有できることを嬉しく思います。今後のアップデートについても、随時共有していく所存です。