我們的先進工程工具如何塑造沉浸式世界

- 作為服務 8,530 萬日活躍用戶*的大型平台,Roblox 提供多種體驗,兼具高可靠性與低延遲。要達成此等效能水準,必須仰賴無縫、精簡且持續突破創新邊界的尖端工程工具與流程。
- 超過 1,000 名 Roblox 工程師使用三大核心產品:微服務生命週期平台、代碼中心以及進階可觀測性平台。
- 我們已大幅減少系統停機時間,並在連續兩年內將平均修復時間(MTTR)穩定降低 50%。
- 我們新開發的工程生產力指數(EPI)能全面呈現工程團隊的成果,2024 年第四季的整體 EPI 較去年同期提升了 12.9%。
在 Roblox,我們正重新構思人們在沉浸式世界中建立連結與溝通的方式。這是一項雄心勃勃的壯舉,要實現它需要廣泛的創新且業界領先的基礎設施。
Roblox 是一個全球性平台,我們的 8,530 萬日活躍用戶* 能夠透過多種語言、平台和裝置(從低階 Android 手機到高階遊戲主機)進行即時互動。我們支援多種內容傳輸模式——包括文字、語音、3D 數據等——且均具備極高的可靠性與低延遲。
為了滿足這些特殊需求,我們的工程師仰賴無縫、精簡且可靠的工具與流程,其中大部分皆由我們自行開發。今天,我們很興奮能展示部分用於打造 Roblox 未來的創新工具與策略,並預覽我們計劃近期開發的內容。透過這些快速高效的工具與實務,我們的目標是讓 Roblox 成為對人才極具吸引力的目的地。
運用尖端工程工具推動創新
我們工程生產力策略的核心在於三項工具:微服務生命週期平台、作為內迴圈開發工具的「程式碼中心」,以及先進的可觀察性平台。這些工具共同賦能超過一千名 Roblox 工程師,協助他們解決各種艱鉅的挑戰。
應用程式生命週期管理平台
我們的應用程式生命週期管理平台是一項自主開發的微服務,讓工程師能夠透過單一、簡化的介面,輕鬆建立、部署、監控及除錯數千個微服務。在這個平台問世之前,Roblox 管理微服務的過程不僅學習曲線陡峭,還伴隨著低效的手動流程,以及在內部工具間頻繁切換工作情境的困擾。
應用程式生命週期管理平台徹底改變了這種狀況,讓工程師能減少花在管理工具與流程上的時間,轉而將更多精力投入解決複雜的技術難題、優化系統,並為使用者推出具影響力的功能。

程式碼中心
本代碼中心由 Roblox 內部設計,旨在優化我們的內迴圈流程,成功減少了工程師在代碼審查過程中所面臨的耗時流程與阻礙。此工具透過即時 Slack 通知與排程摘要,加速審查流程並強化溝通。藉此,該工具確保能及時提供回饋,進而提升代碼審查品質並加快迭代速度。
程式碼中心已迅速成為 Roblox 工程師優化編碼流程的關鍵工具,目前拉取請求(pull requests)在「P75 時間」(即將變更合併所需的第 75 百分位時間)方面,已實現 20% 的改善。

進階可觀測性平台
我們的進階可觀測性平台無縫整合了自建、開源及廠商解決方案,提供高度專業化的基礎架構,並高度重視可靠性與可擴展性。 這套基礎架構每天收集數十億筆時間序列資料及數十 TB 的結構化執行時資訊——包含日誌、追蹤、系統事件、效能分析資料等——協助我們的工程師能自信且高效地進行監控、除錯與測試。
與此同時,我們也致力於探索如何透過自動化與人工智慧進一步優化流程。 舉例來說,我們透過共通的微服務框架,整合了一套涵蓋延遲、流量、錯誤及飽和度的全面預設警示機制,適用於超過 1,500 個微服務,且全程無需編寫任何程式碼。此外,我們透過自動化金絲雀測試分析強化了持續部署系統,在系統上線後的頭六個月內,便成功阻止了數百個錯誤進入生產環境。
這些創新不僅對內部產生重大影響,更提升了 Roblox 用戶的日常體驗。我們大幅減少了系統停機時間,並在連續兩年內將平均修復時間(MTTM)穩定降低 50%。最終成果是為我們生態系統中的每個人帶來更流暢且可靠的體驗。

衡量與提升工程生產力
若無法判斷工具是否有效,開發工具便毫無助益。因此,我們不僅致力於提升 Roblox 的生產力,同時也努力理解 Roblox 的生產力現況及其影響因素。
為此,我們新開發的工程生產力指數(EPI)能全面呈現工程團隊的運作狀況,其作用類似於汽車儀表板顯示車輛性能與狀態的概覽。
在 2024 年第四季,我們在維持相同品質標準的前提下,將整體 EPI 較去年同期提升了 12.9%,主要驅動力來自開發速度的提升。

雖然相較於 DORA 或 SPACE 等框架,此指標更為簡潔且更適用於 Roblox 的需求,但它能針對我們眾多團隊及開發者類型(如引擎與機器學習團隊)提供全面性的生產力評估。我們運用 EPI 提供針對性的回饋與建議,協助團隊追蹤並提升其每季的生產力。
EPI 由三個要素組成:
- 速度 (Velocity):此要素透過廣泛的指標(包括週期時間與部署頻率)來衡量開發進度,藉此評估工程活動的執行速度。
- 品質:此要素依賴程式碼覆蓋率與主幹健康度等指標,確保我們清楚了解該如何兼顧速度與品質,以產出優質產品。
- 自評生產力:我們持續向工程師徵求直接且具針對性的回饋。這些回饋能提供關鍵洞察,揭示影響生產力與滿意度的痛點。此類資訊對於理解工程師面臨的挑戰至關重要,且無法透過其他指標捕捉。此要素亦有助於形塑我們的發展藍圖,透過直接影響決策來建構解決方案,例如我們的程式碼中心與應用程式生命週期管理平台。
這些指標在 Roblox 的整體生產力中各司其職。舉例來說,我們不希望看到「高速度分數搭配低品質分數」,或反之亦然。透過提升 EPI,我們得以同時優化這三項指標。

人工智慧與工程學的下一片疆域
在 Roblox,我們專注於工程的工藝。 我們同時透過開創以 AI 為驅動的工具,重新定義工程的未來,這些工具將徹底改變工程師的創作、協作與創新方式。憑藉對卓越的不懈追求,我們正將 AI 融入開發流程的每個層面,包括整合至現有工具(如應用程式生命週期管理平台與程式碼中心),並運用 AI 驅動的程式碼助理來加速程式碼編寫與審查、重新定義協作模式,以及徹底革新服務的部署與維護方式。
我們的願景不僅止於自動化;我們正打造一種工程體驗,讓 AI 成為主動的夥伴,簡化工作流程、提升程式碼品質並增強團隊士氣。透過投資於內部開發生命週期、主動式品質保證以及 Roblox 專屬的 AI 整合,我們正鋪設一條道路,讓工程速度、創新與協作達到新的高度。 未來幾年將迎來令人振奮的演進,我們致力於將 Roblox 打造成世界級工程師的終極歸宿,讓他們在此打造下一代沉浸式體驗。
* 截至 2024 年 12 月 31 日止的三個月期間。


