당사의 첨단 엔지니어링 도구가 어떻게 몰입형 세계를 만들어가고 있는지

- 일일 활성 사용자 8,530만 명*을 보유한 대규모 플랫폼인 Roblox는 높은 안정성과 낮은 지연 시간을 바탕으로 폭넓은 경험을 제공합니다. 이러한 수준의 성능을 달성하기 위해서는 마찰 없이 원활하게 작동하며 혁신의 한계를 끊임없이 넓혀가는 최첨단 엔지니어링 도구와 프로세스가 필수적입니다.
- 1,000명 이상의 Roblox 엔지니어가 마이크로서비스 라이프사이클 플랫폼, 코드 센터, 고급 가시성 플랫폼이라는 세 가지 주요 제품을 사용하고 있습니다.
- 우리는 다운타임을 대폭 줄였으며, 2년 연속으로 문제 해결까지 걸리는 평균 시간(MTOM)을 50% 감소시켰습니다.
- 새로 개발된 엔지니어링 생산성 지수(EPI)는 엔지니어링 활동 전반에 대한 포괄적인 시각을 제공하며, 2024년 4분기에는 전체 EPI가 전년 동기 대비 12.9% 향상되었습니다.
Roblox는 몰입형 세계에서 사람들이 연결하고 소통하는 방식을 재구상하고 있습니다. 이는 야심 찬 도전이며, 이를 실현하기 위해서는 광범위하고 혁신적이며 업계를 선도하는 인프라가 필요합니다.
Roblox는 글로벌 플랫폼으로, 8,530만 명의 일일 활성 사용자*가 저사양 안드로이드 폰부터 고사양 콘솔에 이르기까지 다양한 언어, 플랫폼, 기기를 통해 실시간으로 소통할 수 있습니다. 우리는 텍스트, 음성, 3D 데이터 등 다양한 형태의 콘텐츠를 모두 매우 높은 안정성과 낮은 지연 시간으로 지원합니다.
엔지니어들이 이러한 특수한 요구 사항을 지원하기 위해, 그들은 마찰 없이 원활하고 신뢰할 수 있는 도구와 프로세스에 의존하며, 이 중 대부분은 우리가 직접 구축했습니다. 오늘, 우리는 로블록스의 미래를 구축하기 위해 사용하고 있는 혁신적인 도구와 전략 중 일부를 소개하고, 조만간 구축할 예정인 것들에 대한 미리보기를 공유하게 되어 기쁩니다. 이와 같은 빠르고 효율적인 도구와 관행을 통해, 우리의 목표는 로블록스를 인재들에게 매우 매력적인 곳으로 만드는 것입니다.
최첨단 엔지니어링 도구를 통한 혁신
저희 엔지니어링 생산성 전략의 핵심에는 세 가지 도구가 있습니다. 바로 마이크로서비스 라이프사이클 플랫폼, 내부 루프 개발 도구인 코드 센터, 그리고 고급 가시성 플랫폼입니다. 이 도구들은 서로 연동되어 1,000명이 넘는 로블록스 엔지니어들이 까다로운 문제들을 해결할 수 있도록 지원합니다.
애플리케이션 라이프사이클 관리 플랫폼
저희 애플리케이션 라이프사이클 관리 플랫폼은 자체 개발한 마이크로서비스로, 엔지니어들이 단일하고 간소화된 인터페이스에서 수천 개의 마이크로서비스를 손쉽게 생성, 배포, 모니터링 및 디버깅할 수 있게 해줍니다. 이 플랫폼이 도입되기 전까지 로블록스에서 마이크로서비스를 관리하는 과정은 학습 곡선이 가파르고, 비효율적인 수동 프로세스가 필요하며, 내부 도구 간에 빈번한 컨텍스트 전환이 수반되었습니다.
애플리케이션 라이프사이클 관리 플랫폼은 이러한 문제를 해결함으로써, 엔지니어들이 도구와 프로세스 관리에 소요되는 시간을 줄이고, 복잡한 기술적 과제 해결, 시스템 개선, 그리고 사용자에게 의미 있는 기능을 제공하는 데 더 많은 시간을 할애할 수 있도록 지원했습니다.

코드 센터
Roblox 내에서 내부 프로세스를 개선하기 위해 설계된 코드 센터는 엔지니어들이 코드 검토 과정에서 겪던 시간 소모적인 절차와 마찰을 줄여주었습니다. 이 도구는 실시간 Slack 알림과 예약된 요약 보고서를 통해 검토 속도를 높이고 커뮤니케이션을 강화합니다. 이를 통해 도구는 시기적절한 피드백을 보장함으로써 더 높은 품질의 코드 검토와 더 빠른 반복 개발을 가능하게 합니다.
코드 센터는 코딩 활동을 최적화하려는 로블록스 엔지니어들에게 빠르게 필수적인 도구가 되었으며, 이미 풀 리퀘스트의 변경 사항 반영에 소요되는 P75 시간이 20% 단축되는 성과를 거두었습니다.

고급 가시성 플랫폼
당사의 고급 가시성 플랫폼은 자체 개발 솔루션, 오픈소스 및 벤더 솔루션을 원활하게 통합하여, 안정성과 확장성에 중점을 둔 고도로 전문화된 인프라를 제공합니다. 이 인프라는 매일 수십억 건의 시계열 데이터와 수십 테라바이트에 달하는 구조화된 런타임 정보(로그, 트레이스, 시스템 이벤트, 프로파일링 데이터 등)를 수집하여, 엔지니어들이 자신감을 가지고 효율적으로 모니터링, 디버깅 및 테스트를 수행할 수 있도록 지원합니다.
동시에, 자동화와 AI를 통해 프로세스를 더욱 개선할 수 있는 방법도 모색하고 있습니다. 예를 들어, 공통 마이크로서비스 프레임워크를 활용해 1,500개 이상의 마이크로서비스 전반에 걸쳐 지연 시간, 트래픽, 오류, 포화 상태를 포괄하는 포괄적인 기본 경보 세트를 단 한 줄의 코드도 작성하지 않고 통합했습니다. 또한 자동화된 카나리아 분석을 통해 지속적 배포 시스템을 강화했으며, 이를 통해 출시 후 불과 6개월 만에 수백 건의 버그가 프로덕션 환경에 유입되는 것을 성공적으로 방지했습니다.
이러한 혁신은 내부적으로 큰 영향을 미칠 뿐만 아니라, 로블록스 사용자의 일상적인 경험도 향상시킵니다. 우리는 다운타임을 대폭 줄였으며, 2년 연속으로 문제 해결까지 걸리는 평균 시간(MTTM)을 50% 감소시켰습니다. 그 결과, 우리 생태계의 모든 구성원에게 더욱 원활하고 안정적인 경험을 제공할 수 있게 되었습니다.

엔지니어링 생산성 측정 및 향상
도구가 제대로 작동하는지 확인할 방법이 없다면 도구를 만드는 것은 별 도움이 되지 않습니다. 그래서 저희는 Roblox의 생산성을 향상시키는 동시에, Roblox 내 생산성이 무엇이며 어떤 요인이 이에 영향을 미치는지 파악하기 위해 노력해 왔습니다.
이를 위해 새로 개발한 엔지니어링 생산성 지수(EPI)는 자동차 계기판이 차량의 성능과 상태를 한눈에 보여주는 것과 유사하게, 저희 엔지니어링 활동 전반에 대한 포괄적인 시각을 제공합니다.
2024년 4분기에는 동일한 품질 기준을 유지하면서도, 주로 개발 속도(velocity)의 향상으로 인해 전체 EPI를 전년 동기 대비 12.9% 개선했습니다.

DORA나 SPACE와 같은 프레임워크보다 더 간단하고 Roblox의 목적에 더 적합하면서도, 이 지표는 엔진(Engine) 및 머신러닝(ML)과 같은 수많은 그룹과 개발자 유형 전반에 걸친 생산성을 종합적으로 평가합니다. 우리는 EPI를 활용하여 팀이 분기별로 생산성을 모니터링하고 향상시킬 수 있도록 지원하는 맞춤형 피드백과 권장 사항을 제공합니다.
EPI는 다음 세 가지 요소로 구성됩니다:
- 속도(Velocity): 이 요소는 사이클 타임 및 배포 주기 등 광범위한 신호를 활용하여 개발 속도를 측정함으로써 엔지니어링 활동의 속도를 평가합니다.
- 품질(Quality): 이 요소는 코드 커버리지 및 트렁크 상태와 같은 지표를 활용하여, 신속하게 움직이면서도 고품질 제품을 생산하기 위해 무엇을 해야 하는지 파악할 수 있도록 합니다.
- 자가 보고 생산성: 우리는 엔지니어들에게서 직접적이고 구체적인 피드백을 지속적으로 수집합니다. 이 피드백은 생산성과 만족도에 영향을 미치는 문제점에 대한 중요한 통찰력을 제공합니다. 이러한 정보는 엔지니어들이 직면한 어려움을 이해하는 데 필수적이며, 다른 지표로는 파악할 수 없는 부분입니다. 또한 이 요소는 코드 센터나 애플리케이션 라이프사이클 관리 플랫폼과 같은 솔루션을 구축하는 결정에 직접적인 근거를 제공함으로써 로드맵 수립에도 기여합니다.
이러한 각 지표는 Roblox의 전반적인 생산성에서 중요한 역할을 합니다. 예를 들어, 우리는 높은 속도 점수와 낮은 품질 점수, 또는 그 반대의 상황을 원하지 않습니다. EPI를 개선함으로써 우리는 이 세 가지 지표를 모두 최적화할 수 있습니다.

AI와 엔지니어링의 새로운 지평
Roblox는 엔지니어링의 기술에 집중하고 있습니다. 또한 엔지니어들이 창작하고, 협업하며, 혁신하는 방식을 변화시키는 AI 기반 도구를 선도함으로써 엔지니어링의 미래를 재구상하고 있습니다. 탁월함을 향한 끊임없는 추구를 바탕으로, 애플리케이션 라이프사이클 관리 플랫폼 및 코드 센터와 같은 기존 도구에 AI를 통합하고, AI 기반 코딩 어시스턴트를 활용하여 코드 작성 및 검토를 가속화하며, 협업을 재정의하고, 서비스 배포 및 유지 관리 방식을 혁신함으로써 개발 프로세스의 모든 측면에 AI를 접목하고 있습니다.
우리의 비전은 단순한 자동화를 넘어섭니다. 우리는 AI가 능동적인 파트너로서 워크플로를 간소화하고, 코드 품질을 향상시키며, 사기를 북돋우는 엔지니어링 환경을 조성하고 있습니다. 내부 루프 개발 라이프사이클, 선제적 품질 보증, 그리고 로블록스 전용 AI 통합에 투자함으로써, 우리는 엔지니어링 속도, 혁신, 협업이 새로운 차원으로 도약할 수 있는 길을 열어가고 있습니다. 앞으로 몇 년간은 흥미진진한 진화의 시기가 될 것이며, 우리는 차세대 몰입형 경험을 구축하고자 하는 세계적 수준의 엔지니어들에게 로블록스가 최고의 선택지가 되도록 최선을 다하고 있습니다.
* 2024년 12월 31일로 종료되는 3개월 기준.


