本網站內容使用人工智慧(AI)或機器翻譯技術翻譯,可能存在錯誤。

Skip to content

透過新增 22 種語言與更精準的偵測能力,升級我們的「語音安全分類器」

新增多種語言、2 種新違規類別,以及召回率提升 14%

Roblox 每天處理跨越 30 種語言、總計數百萬分鐘的語音數據,這對大規模即時安全防護構成了巨大挑戰。過去兩年來,我們的內部系統已大幅進化——參數數量從 9,460 萬增加至 3.2 億,政策違規類別也從五類擴展至八類——如今在高峰時段可處理每秒 10,000 次請求。 

我們於 2024 年將底層的語音安全分類器模型開源,以推動全產業的語音安全發展;今日我們發布該模型的 v3 版本,除新增 22 種語言支援及 2 個政策違規類別外,相較於前一版本,其召回率提升 14%,精確度提升 5%。

從 V1 到 V3 及未來 

當我們著手建構即時語音安全系統時,首先將重點放在英語上。我們建立了一條自動化機器標註管道,以產生大量訓練資料。2024 年,開源模型的 v1 版本使用了 2,400 小時的機器標註英語資料進行模型訓練。在初步上線並實施通知機制後,美國每小時語音內容的濫用通報率下降了超過 50%。 

2025年,我們新增了更多語言並進一步微調模型,隨後發布了 v2 版本。在 2026 年訓練最新的 v3 模型時,我們使用了 250,000 小時的機器標註多語言數據以及 29,000 小時的人工標註多語言數據。每個模型均使用人工標註的數據集進行評估。

這款開源模型的 v3 版本,在 1% 假陽性率下,依據 Roblox 語音聊天語言分佈加權計算的召回率達 61%。若僅以 v2 模型所支援的語言作為比較基準,v3 在依據語言普及度加權計算的召回率方面,展現出 14% 的相對提升。

語音安全至關重要,絕不能孤立解決。我們將語音安全分類器開源,並以創始夥伴身分加入 ROOST,因為我們相信分享安全技術的進展能強化整個產業。自首次發布以來,該模型在 Hugging Face 上的下載次數已超過 70,000 次,而每次更新都基於我們在社群中大規模運行內部模型所獲得的經驗教訓。 我們將持續優化安全系統,並期待未來分享更多更新內容。 

致謝:謹此感謝 Thomas Bui、Meghatrisa Chatterjee、Bridget Daly、Jason Golubock、Hannes Heikinheimo、Marek Kapolka、Cheryl Kwan、Markus Lang、Aashna Sharma、Hao-En Sung、Tingting Tang 以及 Alex Trimm 對本專案的貢獻。