本网站内容使用人工智能(AI)或机器翻译技术翻译,可能存在错误。

Skip to content

通过新增22种语言和更精准的检测能力,升级我们的语音安全分类器

新增语言、2个违规类别,以及召回率提升14%

Roblox 每天处理 30 种语言的数百万分钟语音数据,这对大规模实时安全构成了巨大挑战。过去两年间,我们的内部系统已实现显著演进——参数数量从 9460 万增至 3.2 亿,政策违规类别从 5 个扩展至 8 个——如今在高峰时段可处理每秒 10,000 次请求。 

我们于2024年将底层语音安全分类器模型开源,以推动全行业语音安全水平的提升;今天,我们发布了该模型的v3版本,该版本新增了对22种语言的支持以及两类政策违规分类,与上一版本相比,召回率提高了14%,精确率提高了5%。

从 V1 到 V3 及未来 

在着手构建实时语音安全系统时,我们首先聚焦于英语。我们构建了一条自动机器标注管道,以生成海量的训练数据。2024年,开源模型的v1版本使用了2,400小时的机器标注英语数据进行模型训练。在初步上线并实施通知功能后,美国每小时语音内容的滥用报告率下降了50%以上。 

2025年,我们增加了更多语言,进一步优化了模型,并发布了该模型的v2版本。在2026年训练最新的v3模型时,我们使用了250,000小时的机器标注多语言数据和29,000小时的人工标注多语言数据。每个模型均使用人工标注的数据集进行评估。

该开源模型的v3版本在1%的假阳性率下,按Roblox语音聊天语言分布加权的召回率达到61%。仅以模型v2支持的语言作为对比,v3在按语言普及率加权的召回率方面实现了14%的相对提升。

语音安全至关重要,绝不能孤立解决。我们开源了语音安全分类器,并作为创始合作伙伴加入了 ROOST,因为我们相信分享安全技术的进步能够增强整个行业。自首次发布以来,该模型在 Hugging Face 上的下载量已超过 70,000 次,每次更新都基于我们在社区内大规模运行内部模型所获得的经验。 我们将持续迭代安全系统,并期待未来分享更多更新。 

致谢:感谢 Thomas Bui、Meghatrisa Chatterjee、Bridget Daly、Jason Golubock、Hannes Heikinheimo、Marek Kapolka、Cheryl Kwan、Markus Lang、Aashna Sharma、Hao-En Sung、Tingting Tang 和 Alex Trimm 在本项目中的辛勤工作。