Memperkenalkan Arsitektur Hibrida Roblox: Mendemokratisasi Permainan Fotorealistik dan Multipemain
Visi kami: Roblox Reality
Hari ini kami membagikan wawasan teknis mengenai sebuah proyek internal bernama Roblox Reality yang bertujuan untuk menggabungkan permainan multipemain berskala besar dengan grafis fotorealistik. Kami percaya ini merupakan perubahan mendasar dalam cara dunia imersif multipemain diciptakan dan dinikmati. Tersedia dalam versi awal pada akhir tahun ini atau awal tahun depan, Roblox Reality adalah arsitektur hibrida yang menggabungkan simulasi terstruktur dari Mesin Game terdistribusi kami dengan Model Dunia Video berbasis edge untuk supersampling. Arsitektur ini akan memberdayakan kreator dari berbagai skala untuk membuat dan memelihara dunia interaktif yang memadukan ketepatan visual dan gerakan yang belum pernah ada sebelumnya di atas ketahanan dan struktur tradisional, tanpa meningkatkan biaya pengembangan.
Roblox Reality adalah arsitektur hibrida yang menggabungkan kemampuan Roblox Cloud dan Mesin Game, dengan fotorealistik Video World Models. Status inti dunia disimpan secara tahan lama dan efisien di server untuk memastikan konsistensi di seluruh klien dan mendukung konsistensi sepanjang waktu, sesi, dan hari menggunakan penyimpanan yang efisien dalam hal biaya dan ruang. Permainan multipemain didukung melalui otoritas server yang kuat untuk keadilan dan konsistensi, bersamaan dengan simulasi sisi klien spekulatif untuk mencapai latensi rendah. Untuk rendering, sistem tingkat detail (LOD) dan komposisi berbasis cloud menghasilkan aset beresolusi tinggi yang disalurkan melalui jaringan pengiriman konten (CDN). Model Video Roblox (Super Upsampler) memanfaatkan video yang dirender dan konteks model data yang kaya untuk menghasilkan visual stokastik dan realisme yang mencolok, beroperasi di tepi (edge) untuk setiap pemain dengan kinerja optimal yang didukung oleh infrastruktur GPU cloud-edge. Klien Roblox yang kaya kemudian akan merender umpan video ini dan, di masa depan, secara opsional menimpa avatar yang di-upsample secara lokal untuk mempertahankan latensi sangat rendah pada aksi latar depan.
Dalam demo di bawah ini, kami menampilkan empat video dari game yang berbeda. Video di kiri atas adalah konten Roblox yang direkam menggunakan mesin rendering Roblox saat ini, sedangkan video di kanan atas adalah representasi data 3D yang dapat kami gunakan untuk mengkondisikan pembangkitan video. Video di kiri bawah menunjukkan model video upscaling Roblox saat ini yang berjalan di laboratorium kami, yang belum berjalan secara real-time, sedangkan video di kanan bawah menunjukkan mockup visi produk kami dan apa yang mungkin dilakukan di masa depan dengan teknologi ini.
Model Dunia Video: Kelebihan dan Keterbatasan
Model Dunia Video unggul dalam menghasilkan perilaku yang masuk akal dan berdimensi tinggi tanpa perlu mensimulasikan setiap interaksi individu secara eksplisit.
Pengoperasian Model Dunia Video dalam ruang laten video menghadapi batasan teknis tertentu: Proses ini saat ini memakan biaya tinggi, dan mencapai kinerja real-time dengan ketelitian tinggi, seperti resolusi 2K pada 60 Hz, tetap menjadi tantangan pengembangan. Yang terpenting, dengan keadaan dunia yang direpresentasikan dalam ruang video, model-model ini saat ini tidak mendukung mode multipemain. Kendala utama adalah keseimbangan antara ketepatan simulasi dan keplausibelan visual: Melihat 500 orang bergerak dalam video tidak berarti mereka adalah agen individual atau "avatar dengan otak". Tidak diharapkan bahwa skala model video saat ini secara inheren mendukung simulasi agen individual yang kompleks yang diperlukan untuk pengalaman multipemain sejati.
Kemampuan ini sangat penting saat mengelola kerumunan hidup sebanyak 20.000 orang yang bereaksi secara real-time. Namun, Model Dunia Video saja tidak dapat secara andal mengelola interaksi antara beberapa pemain selama sesi dua jam. Model dunia kesulitan dalam penegakan aturan yang ketat dan keadaan yang persisten karena kurangnya memori jangka panjang dan logika yang konsisten. Model Dunia Video kekurangan data kontrol masukan pengguna, itulah sebabnya bermain Model Dunia Video tidak menyenangkan. Karena Model Dunia Video kesulitan dengan keadaan yang bertahan lama, logika yang konsisten, kontrol masukan pengguna, dan simulasi agen multipemain yang sesungguhnya, model saat ini lebih mirip mimpi yang dipandu.
Model video interaktif yang kita lihat saat ini memang mengesankan, tetapi pada dasarnya hanyalah mimpi yang hidup—menakjubkan untuk dilihat, tetapi singkat dan sangat sepi. Mereka kekurangan interaktivitas, tantangan, imbalan, dan ketahanan—segala hal yang membuat sebuah game menjadi game.
Model dunia neural murni saja tidak dapat memenuhi janji pengalaman multiplayer yang luas dan persisten. Meskipun model dunia neural mengesankan dalam banyak hal, mereka gagal di banyak area kritis. Beberapa di antaranya meliputi konsistensi seiring waktu dalam satu sesi, memori jangka panjang antar sesi, latensi, dan kontrol pencipta yang detail. Celah yang kurang jelas muncul saat memikirkan simulasi multiplayer yang konsisten, gameplay kompetitif yang ketat, NPC yang sangat cerdas, pengujian, dan penyempurnaan bertahap.
Kita tidak boleh meminta mesin neural untuk menjadi mesin game.
Mesin Game: Kekuatan dan Keterbatasan
Roblox Cloud dan Engine sangat melengkapi Video World Models. Dengan presisi yang dapat diulang, keadaan yang konsisten antar sesi, dan ketahanan seiring waktu. Ambil contoh seorang kreator yang membangun game Formula 1 Monaco Grand Prix. Mereka memodelkan sistem penilaian dan penalti yang presisi, jalan, kerumunan, alam, dan sinkronisasi instan antar pembalap. Namun, presisi ini datang dengan biaya implementasi dan runtime. Meningkatkan fidelitas visual memerlukan aset yang berat, pencahayaan yang kompleks, dan simulasi.
Selama dekade mendatang, hasil mesin game kelas atas akan terus meningkat dalam hal realisme, tetapi begitu pula persyaratan untuk kecanggihan pengembang dan perangkat keras konsumen.
Tantangan yang belum dapat diatasi oleh industri hingga saat ini adalah bagaimana menghadirkan hiperrealisme dalam skala besar, sekaligus membuatnya dapat diakses oleh pengembang besar maupun kecil, dan pada perangkat keras konsumen yang tersedia secara luas.
Hal ini karena dunia nyata memiliki detail yang sangat halus. Di sekitar inti permainan terdapat segala hal lainnya—elemen-elemen alami yang tidak terprogram seperti helai rumput, daun, dan dahan yang berayun lembut diterpa angin, awan debu yang membubung dan berputar di belakang mobil, bara api yang berkilau dan percikan api yang melesat dari api, serta tetesan hujan yang perlahan menyentuh genangan air berkilau berminyak. Konten ini sangat sulit untuk dibuat dan dirender. Mesin game tradisional kesulitan menghadapi kompleksitas visual ini, mencari jalan pintas untuk menangkap realisme yang lebih sederhana, karena beban memori dari tekstur dan geometri beresolusi tinggi membebani sumber daya yang tersedia. Biaya simulasi juga melonjak menjadi sangat tinggi dengan pencahayaan volumetrik, audio binaural, fisika, dan simulasi karakter yang bersama-sama membentuk fotorealistik.
Kami percaya cara terbaik bagi kreator untuk membangun, dan bagi mesin untuk merender, kompleksitas ini adalah dengan memanfaatkan arsitektur hibrida di mana Video World Model yang telah dilatih akan menghasilkan tekstur, pencahayaan, dan dinamika skala halus di atas gerakan kamera, geometri, dan status kontekstual yang mendasari mesin.
Arsitektur: Menyinkronkan Logika Game dan Piksel Video
Kami percaya bahwa pendekatan hibrida diperlukan agar para kreator dapat menghadirkan interaksi multipemain dengan kualitas tinggi dan hasil yang fotorealistik. Kami menyebut pendekatan ini sebagai Roblox Reality, yang menggabungkan Roblox Game Engine, Roblox Cloud, dan Super Upsampler Roblox Video World Model.
Arsitektur hibrida Roblox Reality membagi tanggung jawab antara Roblox Game Engine dan Roblox Video World Model.
Roblox Game Engine menangani aspek terstruktur dan logis dari dunia, menyediakan memori jangka panjang yang stabil, logika simbolik, dan simulasi yang dapat diulang. Ia juga bertanggung jawab atas operasi fisik dasar seperti tabrakan dan perilaku. Pergerakan utama objek dikelola di dalam mesin, misalnya lokasi dan kecepatan mobil, roda, peredam kejut, dan kemudi. Berdasarkan hal ini, Video World Model menambahkan komponen visual dan generatif tambahan, seperti tetesan air yang mengalir di sepanjang kaca depan dan gemerisik dedaunan saat mobil melaju kencang, menghadirkan visual yang menakjubkan. Pendekatan ini memungkinkan Game Engine untuk mempertahankan model data (status bersama dan konsisten) sementara Video World Model menghasilkan Piksel (impian visual).
|
Fitur |
Mesin Game |
Super Upsampler | |
|---|---|---|---|
|
Fungsi Utama |
Menangani semua sinkronisasi status untuk menjaga konsistensi dunia (model data, status bersama dan konsisten). |
Mengelola komponen visual dan generatif (Piksel, mimpi visual). | |
|
Tanggung Jawab Utama |
Menyediakan memori jangka panjang yang stabil, logika simbolik, dan simulasi yang dapat diulang. Bertanggung jawab atas sifat fisik dasar (material dan lokasi) serta operasi (tabrakan dan ray tracing). |
Menyajikan visual stokastik dan realisme yang memukau, gerakan sekunder, lingkungan dinamis yang alami, serta fisika fluida. Menghasilkan tekstur dengan ketelitian lebih tinggi, pencahayaan yang lebih realistis, dan dinamika skala halus. | |
|
Konsistensi Dunia |
Menyediakan presisi, keadaan yang konsisten, dan konsistensi yang terjamin. Memusatkan keadaan ke dalam satu sumber kebenaran. |
Unggul dalam menghasilkan perilaku yang masuk akal dan berdimensi tinggi tanpa simulasi eksplisit (misalnya, mengelola kerumunan yang hidup). Beroperasi di tepi untuk setiap pemain. | |
|
Data yang Ditangani |
Segala sesuatu yang konsisten di antara semua pemain (pemain, posisi, mobil, burung, bangunan, adegan 3D). |
Hal-hal sementara yang tidak perlu dilihat persis sama oleh para pemain (kaleng berkarat, kawanan burung, bentuk awan, butiran pasir, rumput). | |
|
Penyimpanan Memori |
Model data |
Laten video | |
|
Batasan Mandiri |
Menghadapi kesulitan dalam kompleksitas visual dan tuntutan komputasi tinggi untuk fotorealistik. |
Kesulitan dalam penegakan aturan yang ketat, memori jangka panjang, logika yang konsisten, dan data kontrol input pengguna. | |
|
Infrastruktur Runtime |
26+ pusat data tepi di seluruh dunia, menjalankan jutaan instance game, dekat dengan pengguna untuk latensi rendah, dengan puncak hingga 45+ juta pengguna bersamaan. |
Super Upsampler berjalan di pusat data tepi yang berdekatan, dan kinerja optimal, didukung oleh GPU kelas H200/B200 (atau akselerator setara) |
Secara bersama-sama, platform ini mendukung pembuatan konten tanpa batas dengan kontrol kreator yang mendalam.
Tujuan pengembangan kami untuk Roblox Reality mencakup pembuatan Model Video Roblox yang mampu menghasilkan resolusi 2K pada 60 Hz dengan mengambil data referensi dari Mesin Game Roblox: baik video yang telah dirender maupun data spasial 3D. Roblox Reality akan dioptimalkan untuk berjalan pada infrastruktur GPU tepi awan yang dipadukan dengan streaming video, sementara pada akhirnya akan terintegrasi dengan klien Roblox untuk mendukung kontrol avatar lokal dan simulasi.
Ringkasan
Roblox Reality mewakili langkah besar dalam mendemokratisasi proses pembuatan, memungkinkan setiap kreator untuk membangun game fotorealistik dengan memanfaatkan Roblox Game Engine dan Video Model, sehingga secara signifikan mengurangi waktu pengembangan, biaya, dan daya komputasi yang biasanya diperlukan untuk grafis beresolusi tinggi. Hal ini membuat pembuatan game fotorealistik menjadi lebih cepat serta lebih efisien dari segi biaya dan daya komputasi bagi para kreator kami. Mengingat biaya komputasi yang tinggi, kami menyadari ada tantangan yang perlu kami selesaikan sebelum dapat menskalakan arsitektur Roblox Reality. Kami sudah bekerja pada solusi untuk membantu mengoptimalkan dan meningkatkan efisiensi arsitektur ini agar dapat menskalakannya secara lebih terjangkau untuk jutaan pemain bersamaan.
Yang terpenting, kami sangat antusias untuk membangun platform yang membuka potensi game-game yang memungkinkan para kreator kami menciptakan pengalaman multiplayer fotorealistik yang luar biasa!