通过新增22种语言和更精准的检测能力，升级我们的语音安全分类器

新增语言、2个违规类别，以及召回率提升14%

作者 Vesa Silvola、Janne Pylkkonen 以及工程副总裁 Naren Koneru

已发布 2026年6月17日

Roblox 每天处理 30 种语言的数百万分钟语音数据，这对大规模实时安全构成了巨大挑战。过去两年间，我们的内部系统已实现显著演进——参数数量从 9460 万增至 3.2 亿，政策违规类别从 5 个扩展至 8 个——如今在高峰时段可处理每秒 10,000 次请求。

我们于2024年将底层语音安全分类器模型开源，以推动全行业语音安全水平的提升；今天，我们发布了该模型的v3版本，该版本新增了对22种语言的支持以及两类政策违规分类，与上一版本相比，召回率提高了14%，精确率提高了5%。

从 V1 到 V3 及未来

在着手构建实时语音安全系统时，我们首先聚焦于英语。我们构建了一条自动机器标注管道，以生成海量的训练数据。2024年，开源模型的v1版本使用了2,400小时的机器标注英语数据进行模型训练。在初步上线并实施通知功能后，美国每小时语音内容的滥用报告率下降了50%以上。

2025年，我们增加了更多语言，进一步优化了模型，并发布了该模型的v2版本。在2026年训练最新的v3模型时，我们使用了250,000小时的机器标注多语言数据和29,000小时的人工标注多语言数据。每个模型均使用人工标注的数据集进行评估。

该开源模型的v3版本在1%的假阳性率下，按Roblox语音聊天语言分布加权的召回率达到61%。仅以模型v2支持的语言作为对比，v3在按语言普及率加权的召回率方面实现了14%的相对提升。

语音安全至关重要，绝不能孤立解决。我们开源了语音安全分类器，并作为创始合作伙伴加入了 ROOST，因为我们相信分享安全技术的进步能够增强整个行业。自首次发布以来，该模型在 Hugging Face 上的下载量已超过 70,000 次，每次更新都基于我们在社区内大规模运行内部模型所获得的经验。我们将持续迭代安全系统，并期待未来分享更多更新。

致谢：感谢 Thomas Bui、Meghatrisa Chatterjee、Bridget Daly、Jason Golubock、Hannes Heikinheimo、Marek Kapolka、Cheryl Kwan、Markus Lang、Aashna Sharma、Hao-En Sung、Tingting Tang 和 Alex Trimm 在本项目中的辛勤工作。

通过新增22种语言和更精准的检测能力，升级我们的语音安全分类器

从 V1 到 V3 及未来

新闻

人工智能领域先驱创始人联手加速实现 Roblox 的现实愿景

工程

CubePart：一款支持开放词汇表且可控部件的3D生成器

工程

介绍 Roblox 混合架构：让逼真的多人游戏触手可及