本网站内容使用人工智能(AI)或机器翻译技术翻译,可能存在错误。

Skip to content

我们的先进工程工具如何塑造沉浸式世界

  • 作为服务于 8530 万日活跃用户*的大型平台,Roblox 提供种类丰富、高可靠性且低延迟的体验。要实现这一级别的性能,必须依赖前沿的工程工具和流程——这些工具和流程不仅顺畅高效,而且不断推动创新的边界。
  • 超过 1,000 名 Roblox 工程师使用三大核心产品:微服务生命周期平台、代码中心以及高级可观测性平台。
  • 我们已大幅减少系统停机时间,并在连续两年内将平均故障修复时间(MTTR)持续降低50%。
  • 我们新开发的工程生产力指数(EPI)全面反映了工程团队的工作成效,2024 年第四季度,整体 EPI 同比提升了 12.9%。

在 Roblox,我们正在重新构想人们在沉浸式世界中连接与交流的方式。这是一项雄心勃勃的壮举,要将其付诸实践,需要广泛创新且行业领先的基础设施。 

Roblox 是一个全球性平台,我们的 8530 万日活跃用户* 能够跨越多种语言、平台和设备(从低端安卓手机到高端游戏主机)进行实时交流。我们支持多种内容形式——包括文本、语音、3D 数据等——且均具备极高的可靠性和低延迟特性。

为了满足这些特殊需求,我们的工程师依赖于无缝、高效且可靠的工具和流程,其中大部分都是我们自主开发的。今天,我们很高兴向大家展示一些正在用于构建 Roblox 未来的创新工具和策略,并预览部分计划近期开发的工具。凭借这些快速高效的工具和实践,我们的目标是让 Roblox 成为对人才极具吸引力的目的地。

借助尖端工程工具实现创新

我们工程生产力战略的核心是三大工具:微服务生命周期平台、代码中心(一种内部开发工具)以及先进的可观测性平台这些工具共同助力 Roblox 超过一千名工程师攻克各类难题。

应用程序生命周期管理平台

我们的应用程序生命周期管理平台是一个自主研发的微服务,工程师可以通过它在一个简洁统一的界面中轻松创建、部署、监控和调试数千个微服务。在此平台推出之前,Roblox 管理微服务面临着陡峭的学习曲线、低效的手动流程,以及在内部工具之间频繁切换上下文的困扰。 

应用生命周期管理平台的推出彻底改变了这一状况,使我们的工程师能够减少在工具和流程管理上的时间投入,从而将更多精力用于解决复杂的技术难题、优化系统,并为用户交付具有重大影响的功能。

代码中心

该代码中心由 Roblox 内部设计,旨在优化我们的内部流程,有效减少了工程师在代码审查过程中耗时且繁琐的环节。该工具通过实时 Slack 通知和定时汇总报告,加速了审查流程并增强了沟通效率。由此,该工具确保了及时的反馈,从而提升了代码审查质量加快了迭代速度。 

代码中心已迅速成为 Roblox 工程师优化编码工作的关键工具,在将更改合并所需的 P75 时间方面,拉取请求的效率已提升了 20%。

高级可观测性平台

我们的高级可观测性平台无缝集成了自研、开源及第三方解决方案,提供了一套高度专业化的基础设施,并高度注重可靠性和可扩展性。 该基础设施每天收集数十亿条时间序列数据和数十太字节的结构化运行时信息——包括日志、追踪、系统事件、性能分析数据等——这些数据帮助我们的工程师高效且有信心地进行监控、调试和测试。

与此同时,我们还致力于探索如何通过自动化和人工智能进一步优化我们的流程。 例如,我们利用通用微服务框架,在无需编写任何代码的情况下,整合了一套覆盖 1,500 多个微服务的全面默认警报,涵盖延迟、流量、错误和资源饱和度等指标。此外,我们通过自动化金丝雀测试分析增强了持续部署系统,仅在上线后的前六个月内,就成功阻止了数百个缺陷进入生产环境。

这些创新不仅对内部产生了重大影响,也提升了 Roblox 用户的日常体验。我们显著减少了系统停机时间,并在连续两年内将平均修复时间(MTTM)稳定降低了 50%。最终结果是,我们生态系统中的每个人都能获得更流畅、更可靠的体验。

衡量与提升工程生产力

如果无法判断工具是否有效,那么开发这些工具就毫无意义。因此,我们在努力提升 Roblox 生产力的同时,也致力于深入理解 Roblox 的生产力及其影响因素。 

为此,我们新开发的工程生产力指数(EPI)为工程工作提供了全面的视图,这类似于汽车仪表盘显示车辆性能和健康状况的概览。

在 2024 年第四季度,我们在保持相同质量标准的同时,主要得益于开发速度的提升,使整体 EPI 同比提高了 12.9%。 

虽然该指标比 DORA 或 SPACE 等框架更简单且更适用于 Roblox 的需求,但它能对我们众多团队及开发者类型(如引擎和机器学习团队)的生产力进行全面评估。我们利用 EPI 提供有针对性的反馈和建议,帮助团队持续监测并逐季提升生产力。

EPI由三个要素构成:

  1. 速度(Velocity):该维度通过综合利用周期时间和部署频率等广泛指标,衡量工程活动的执行速度,从而反映开发进度。
  2. 质量:该维度依托代码覆盖率和主干代码健康度等指标,确保我们明确如何在保持高效的同时产出高质量产品。
  3. 自报生产力:我们持续从工程师处收集直接且有针对性的反馈。这些反馈为影响生产力和满意度的痛点提供了关键洞察。此类信息对于理解工程师面临的挑战至关重要,且无法通过其他指标捕捉。该要素还通过直接指导我们构建代码中心和应用生命周期管理平台等解决方案的决策,帮助塑造我们的路线图。

这些指标在 Roblox 的整体生产力中均发挥着关键作用。例如,我们不希望出现“高速度评分但低质量评分”或“高质量评分但低速度评分”的情况。通过提升 EPI,我们能够优化这三项指标。

人工智能与工程领域的下一个前沿

在 Roblox,我们专注于工程工艺。 我们还通过开创由人工智能驱动的工具,重塑工程的未来,这些工具正在改变工程师的创作、协作和创新方式。凭借对卓越的不懈追求,我们将人工智能融入开发流程的每个环节,将其整合到应用程序生命周期管理平台和代码中心等现有工具中,利用人工智能驱动的编码助手来加速代码编写和审查,重新定义协作,并彻底改变我们部署和维护服务的方式。

我们的愿景不仅限于自动化;我们正在打造一种工程体验,让 AI 成为积极主动的合作伙伴,从而简化工作流程、提升代码质量并增强团队士气。通过投资于内部开发生命周期、主动质量保证以及针对 Roblox 的 AI 集成,我们正在铺就一条道路,让工程速度、创新和协作达到新的高度。 未来几年将迎来激动人心的变革,我们致力于将 Roblox 打造为世界级工程师的终极归宿,他们正热切期待构建下一代沉浸式体验。

* 截至 2024 年 12 月 31 日的三个月期间。