Wie unsere fortschrittlichen Engineering-Tools immersive Welten gestalten

- Als riesige Plattform mit täglich 85,3 Millionen aktiven Nutzern* bietet Roblox ein breites Spektrum an Erlebnissen mit hoher Zuverlässigkeit und geringer Latenz. Um dieses Leistungsniveau zu erreichen, sind modernste technische Tools und Prozesse erforderlich, die reibungslos und optimiert funktionieren und die Grenzen der Innovation ständig erweitern.
- Mehr als 1.000 Roblox-Ingenieure nutzen drei Hauptprodukte: unsere Microservice-Lifecycle-Plattform, unser Code Center und unsere fortschrittliche Observability-Plattform.
- Wir haben die Ausfallzeiten deutlich reduziert und die durchschnittliche Zeit bis zur Fehlerbehebung in zwei aufeinanderfolgenden Jahren um 50 % gesenkt.
- Unser neu entwickelter Engineering Productivity Index (EPI) bietet einen umfassenden Überblick über unsere technischen Aktivitäten, und im vierten Quartal 2024 verbesserte sich der Gesamt-EPI im Vergleich zum Vorjahr um 12,9 %.
Bei Roblox gestalten wir die Art und Weise neu, wie Menschen in immersiven Welten miteinander in Verbindung treten und kommunizieren. Das ist ein ehrgeiziges Unterfangen, und um es zu verwirklichen, bedarf es einer breiten Palette innovativer und branchenführender Infrastruktur.
Roblox ist eine globale Plattform, und unsere 85,3 Millionen täglich aktiven Nutzer* können in Echtzeit über viele verschiedene Sprachen, Plattformen und Geräte hinweg miteinander kommunizieren – von einfachen Android-Smartphones bis hin zu High-End-Konsolen. Wir unterstützen zahlreiche Inhaltsformate – Text, Sprache, 3D-Daten und mehr – und das alles mit extrem hoher Zuverlässigkeit und geringer Latenz.
Damit unsere Ingenieure diese speziellen Anforderungen erfüllen können, verlassen sie sich auf reibungslose, optimierte und zuverlässige Tools und Prozesse, von denen wir die meisten selbst entwickelt haben. Wir freuen uns, Ihnen heute einige der innovativen Tools und Strategien vorzustellen, mit denen wir die Zukunft von Roblox gestalten, sowie einen Ausblick auf einige, die wir in Kürze entwickeln wollen. Mit schnellen und effizienten Tools und Vorgehensweisen wie diesen ist es unser Ziel, Roblox zu einem äußerst attraktiven Arbeitgeber für Talente zu machen.
Innovation mit modernsten Engineering-Tools
Im Mittelpunkt unserer Strategie zur Steigerung der Engineering-Produktivität stehen drei Tools: unsere Microservice-Lifecycle-Plattform, unser Code Center – ein Inner-Loop-Entwicklungstool – und unsere fortschrittliche Observability-Plattform. Zusammen ermöglichen diese Tools mehr als tausend Roblox-Ingenieuren, anspruchsvolle Probleme anzugehen.
Plattform für das Anwendungslebenszyklusmanagement
Unsere Plattform für das Anwendungslebenszyklusmanagement ist ein selbst entwickelter Microservice, der es Ingenieuren ermöglicht, Tausende von Microservices einfach zu erstellen, bereitzustellen, zu überwachen und zu debuggen – alles über eine einzige, optimierte Oberfläche. Vor der Einführung dieser Plattform war die Verwaltung von Microservices bei Roblox mit einer steilen Lernkurve, ineffizienten manuellen Prozessen und häufigen Kontextwechseln zwischen internen Tools verbunden.
Die Plattform für das Application Lifecycle Management hat diese Situation beseitigt und es unseren Ingenieuren ermöglicht, weniger Zeit mit der Verwaltung von Tools und Prozessen zu verbringen und stattdessen mehr Zeit für die Lösung komplexer technischer Herausforderungen, die Verbesserung von Systemen und die Bereitstellung wirkungsvoller Funktionen für unsere Nutzer zu nutzen.

Code Center
Unser Code Center wurde innerhalb von Roblox entwickelt, um unsere internen Prozesse zu optimieren. Es hat den zeitaufwändigen Prozess und die Reibungsverluste reduziert, mit denen Ingenieure bei Code-Reviews konfrontiert waren. Das Tool beschleunigt Reviews und verbessert die Kommunikation durch Echtzeit-Benachrichtigungen in Slack und geplante Zusammenfassungen. Auf diese Weise gewährleistet das Tool zeitnahes Feedback, was zu qualitativ hochwertigeren Code-Reviews und schnelleren Iterationen führt.
Das Code Center hat sich schnell zu einem unverzichtbaren Werkzeug für Roblox-Ingenieure entwickelt, die ihre Programmieraktivitäten optimieren möchten. Bei Pull-Anfragen wurde bereits eine 20-prozentige Verbesserung der P75-Zeit erzielt, die benötigt wird, um Änderungen zu implementieren.

Erweiterte Observability-Plattform
Unsere fortschrittliche Observability-Plattform integriert nahtlos selbst entwickelte, Open-Source- und Anbieterlösungen und bietet eine hochspezialisierte Infrastruktur mit starkem Fokus auf Zuverlässigkeit und Skalierbarkeit. Jeden Tag sammelt diese Infrastruktur Milliarden von Zeitreihen und Dutzende Terabyte strukturierter Laufzeitinformationen – Logs, Traces, Systemereignisse, Profiling-Daten und mehr –, die unseren Ingenieuren helfen, effizient und sicher zu überwachen, zu debuggen und zu testen.
Gleichzeitig widmen wir uns der Erforschung, wie Automatisierung und KI unsere Prozesse weiter verbessern können. So haben wir beispielsweise mithilfe unseres gemeinsamen Microservice-Frameworks einen umfassenden Satz von Standardwarnungen integriert, die Latenz, Datenverkehr, Fehler und Auslastung über mehr als 1.500 Microservices abdecken – und das ganz ohne eine einzige Zeile Code. Außerdem haben wir unser Continuous-Deployment-System um automatisierte Canary-Analysen erweitert, wodurch bereits in den ersten sechs Monaten nach der Einführung erfolgreich verhindert werden konnte, dass Hunderte von Fehlern in unsere Produktionsumgebung gelangten.
Diese Innovationen haben nicht nur intern große Auswirkungen, sondern verbessern auch das tägliche Erlebnis der Roblox-Nutzer. Wir haben Ausfallzeiten deutlich reduziert und die durchschnittliche Zeit bis zur Behebung (MTTM) in zwei aufeinanderfolgenden Jahren um 50 % gesenkt. Das Endergebnis ist ein nahtloseres und zuverlässigeres Erlebnis für alle in unserem Ökosystem.

Messung und Steigerung der Produktivität im Engineering
Die Entwicklung von Tools ist wenig hilfreich, wenn man nicht feststellen kann, ob sie funktionieren. Deshalb haben wir intensiv daran gearbeitet, die Produktivität bei Roblox zu verbessern und gleichzeitig zu verstehen, wie sich die Produktivität bei Roblox gestaltet und welche Faktoren sie beeinflussen.
Zu diesem Zweck bietet unser neu entwickelter Engineering Productivity Index (EPI) einen umfassenden Überblick über unsere technischen Aktivitäten, ähnlich wie das Armaturenbrett eines Autos einen Überblick über die Leistung und den Zustand des Fahrzeugs anzeigt.
Im vierten Quartal 2024 haben wir den Gesamt-EPI im Vergleich zum Vorjahr um 12,9 % verbessert, was in erster Linie auf die Geschwindigkeit zurückzuführen ist, während wir gleichzeitig das gleiche Qualitätsniveau beibehalten haben.

Obwohl diese Metrik einfacher und für Roblox-Zwecke besser geeignet ist als Frameworks wie DORA oder SPACE, bietet sie eine ganzheitliche Bewertung der Produktivität über unsere unzähligen Gruppen und Entwickler-Archetypen hinweg, wie beispielsweise Engine und ML. Wir nutzen den EPI, um gezieltes Feedback und Empfehlungen zu geben, die es den Teams ermöglichen, ihre Produktivität von Quartal zu Quartal zu überwachen und zu steigern.
Der EPI setzt sich aus drei Elementen zusammen:
- Velocity: Dieses Element misst die Geschwindigkeit der Entwicklungsaktivitäten, indem es eine breite Palette von Signalen nutzt, darunter Zykluszeit und Deployment-Rhythmus, um das Entwicklungstempo zu erfassen.
- Qualität: Dieses Element stützt sich auf Kennzahlen wie Codeabdeckung und Trunk-Zustand, um sicherzustellen, dass wir wissen, was wir tun müssen, um schnell voranzukommen und qualitativ hochwertige Produkte zu liefern.
- Selbstberichtete Produktivität: Wir holen uns ständig direktes und gezieltes Feedback von unseren Entwicklern ein. Dieses Feedback liefert entscheidende Einblicke in Schwachstellen, die sich auf Produktivität und Zufriedenheit auswirken. Diese Art von Informationen ist entscheidend für das Verständnis der Herausforderungen, denen unsere Entwickler gegenüberstehen, und lässt sich nicht über andere Kennzahlen erfassen. Dieses Element trägt auch zur Gestaltung unserer Roadmap bei, indem es unsere Entscheidungen zur Entwicklung von Lösungen wie unserem Code Center und unserer Plattform für das Application Lifecycle Management direkt beeinflusst.
Jede dieser Kennzahlen spielt eine entscheidende Rolle für die Gesamtproduktivität bei Roblox. Wir wollen beispielsweise keinen hohen Velocity-Wert bei gleichzeitig niedrigem Qualitätswert oder umgekehrt. Durch die Verbesserung des EPI können wir alle drei Kennzahlen optimieren.

KI und die nächste Grenze der Technik
Bei Roblox konzentrieren wir uns auf das Handwerk des Ingenieurwesens. Wir gestalten die Zukunft des Ingenieurwesens neu, indem wir wegweisende KI-gesteuerte Tools entwickeln, die die Art und Weise verändern, wie Ingenieure arbeiten, zusammenarbeiten und innovativ sind. Mit dem unermüdlichen Streben nach Exzellenz integrieren wir KI in jeden Aspekt des Entwicklungsprozesses, indem wir sie in unsere bestehenden Tools wie unsere Application Lifecycle Manager-Plattform und unser Code Center einbinden. Dabei nutzen wir KI-gestützte Programmierassistenten, um die Code-Erstellung und -Überprüfung zu beschleunigen, die Zusammenarbeit neu zu definieren und die Art und Weise zu revolutionieren, wie wir Dienste bereitstellen und warten.
Unsere Vision geht über die Automatisierung hinaus; wir schaffen eine Engineering-Erfahrung, in der KI als proaktiver Partner fungiert, Workflows optimiert, die Codequalität verbessert und die Arbeitsmoral steigert. Durch Investitionen in unseren Inner-Loop-Entwicklungslebenszyklus, proaktive Qualitätssicherung und Roblox-spezifische KI-Integrationen ebnen wir den Weg, auf dem Entwicklungsgeschwindigkeit, Innovation und Zusammenarbeit neue Höhen erreichen. Die nächsten Jahre werden eine spannende Entwicklung mit sich bringen, und wir sind entschlossen, Roblox zum ultimativen Ziel für erstklassige Entwickler zu machen, die darauf brennen, die nächste Generation immersiver Erlebnisse zu erschaffen.
* Stand: drei Monate bis zum 31. Dezember 2024.


