แนะนำสถาปัตยกรรมไฮบริดของ Roblox: การทำให้เกมมัลติเพลเยอร์ที่มีความสมจริงระดับภาพถ่ายเป็นของทุกคน
วิสัยทัศน์ของเรา: ความเป็นจริงในโลกของ Roblox

วันนี้เราจะแบ่งปันข้อมูลเชิงเทคนิคเกี่ยวกับโครงการภายในที่เรียกว่า Roblox Reality ซึ่งเป็นการผสมผสานระหว่างเกมมัลติเพลเยอร์ขนาดใหญ่พิเศษกับความสมจริงระดับสูง เราเชื่อว่านี่คือการเปลี่ยนแปลงพื้นฐานในวิธีการสร้างและสัมผัสประสบการณ์โลกเสมือนจริงแบบผู้เล่นหลายคนในอนาคต Roblox Reality ซึ่งจะมีให้ใช้งานในเวอร์ชันแรกภายในปลายปีนี้หรือต้นปีหน้า เป็นสถาปัตยกรรมแบบไฮบริดที่ผสานการจำลองแบบมีโครงสร้างของ Game Engine ที่กระจายตัวเข้ากับโมเดลโลกวิดีโอแบบ edge-based สำหรับการซูเปอร์แซมปลิง สถาปัตยกรรมนี้จะช่วยให้ผู้สร้างทุกขนาดสามารถสร้างและดูแลโลกเสมือนจริงที่มีการผสมผสานความสมจริงของภาพและการเคลื่อนไหวในระดับที่ไม่เคยมีมาก่อน บนพื้นฐานของความคงอยู่และโครงสร้างแบบดั้งเดิม โดยไม่ต้องเพิ่มต้นทุนในการพัฒนา
Roblox Reality เป็นสถาปัตยกรรมแบบไฮบริดที่ผสมผสานความสามารถของ Roblox Cloud และ Game Engine เข้ากับความสมจริงระดับภาพถ่ายของ Video World Models สถานะหลักของโลกจะถูกจัดเก็บอย่างถาวรและมีประสิทธิภาพบนเซิร์ฟเวอร์ เพื่อให้มั่นใจถึงความสอดคล้องกันระหว่างไคลเอนต์ต่างๆ และรองรับความสอดคล้องกันตลอดเวลา เซสชัน และวันต่างๆ โดยใช้การจัดเก็บที่มีประสิทธิภาพด้านต้นทุนและพื้นที่ รองรับการเล่นเกมแบบผู้เล่นหลายคนผ่านเซิร์ฟเวอร์ที่มีความน่าเชื่อถือสูงเพื่อความเป็นธรรมและความสม่ำเสมอ พร้อมด้วยการจำลองฝั่งไคลเอนต์แบบคาดการณ์ล่วงหน้าเพื่อลดความหน่วง สำหรับการเรนเดอร์ ระบบระดับรายละเอียด (LOD) และระบบคอมโพสิตที่ใช้คลาวด์จะสร้างสินทรัพย์ที่มีความละเอียดสูงและส่งผ่านเครือข่ายการส่งมอบเนื้อหา (CDN) โมเดลวิดีโอ Roblox (Super Upsampler) ใช้ประโยชน์จากวิดีโอที่เรนเดอร์แล้วและบริบทของโมเดลข้อมูลที่สมบูรณ์เพื่อสร้างภาพแบบสุ่มและความสมจริงที่น่าทึ่ง โดยทำงานบนขอบเขตสำหรับทุกผู้เล่นด้วยประสิทธิภาพที่เหมาะสมที่สุดซึ่งขับเคลื่อนโดยโครงสร้างพื้นฐาน GPU บนคลาวด์-เอดจ์ จากนั้นไคลเอนต์ Roblox ที่สมบูรณ์จะเรนเดอร์ฟีดวิดีโอนี้และในอนาคตอาจซ้อนทับอวตารที่เรนเดอร์ในเครื่องและอัปแซมเปิลเพื่อรักษาความหน่วงต่ำมากในการกระทำที่อยู่เบื้องหน้า
ในตัวอย่างด้านล่างนี้ เราจะแสดงวิดีโอสี่รายการของเกมต่างๆ รวมถึง Grow a Garden และ Summon Heroes วิดีโอด้านบนซ้ายเป็นเนื้อหาของ Roblox ที่บันทึกโดยใช้เอนจินการเรนเดอร์ของ Roblox ในปัจจุบัน ส่วนวิดีโอด้านบนขวาเป็นการแสดงข้อมูล 3 มิติที่เราสามารถใช้เพื่อปรับแต่งการสร้างวิดีโอ วิดีโอที่มุมล่างซ้ายแสดงโมเดลวิดีโออัพแซมเปิลของ Roblox ที่กำลังทำงานในห้องปฏิบัติการของเรา ซึ่งยังไม่สามารถทำงานแบบเรียลไทม์ได้ ส่วนวิดีโอที่มุมล่างขวาแสดงภาพจำลองของวิสัยทัศน์ผลิตภัณฑ์ของเราและสิ่งที่สามารถทำได้ในอนาคตด้วยเทคโนโลยีนี้
วิดีโอ เวิลด์ โมเดลส์: จุดแข็งและข้อจำกัด
โมเดลวิดีโอเวิลด์มีความเชี่ยวชาญในการสร้างพฤติกรรมที่น่าเชื่อถือและมีมิติสูงโดยไม่จำเป็นต้องจำลองปฏิสัมพันธ์ของแต่ละบุคคลอย่างชัดเจน
การดำเนินงานแบบจำลองโลกวิดีโอภายในพื้นที่แฝงของวิดีโอเผชิญกับข้อจำกัดทางเทคนิคเฉพาะ: กระบวนการนี้ในปัจจุบันมีค่าใช้จ่ายสูง และการบรรลุประสิทธิภาพที่มีความเที่ยงตรงสูงและเรียลไทม์ เช่น ความละเอียด 2K ที่ 60 Hz ยังคงเป็นความท้าทายในการพัฒนา ที่สำคัญคือ เมื่อรัฐโลกถูกนำเสนอในพื้นที่วิดีโอ โมเดลเหล่านี้จึงยังไม่สามารถรองรับผู้เล่นหลายคนได้ ข้อจำกัดหลักคือความสมจริงของการจำลองเทียบกับความสมเหตุสมผลทางภาพ: การเห็นคน 500 คนเคลื่อนไหวในวิดีโอเพียงอย่างเดียว ไม่ได้หมายความว่าพวกเขาเป็นตัวแทนบุคคลที่มีเอกลักษณ์หรือ "อวตารที่มีสมอง" ตามที่คาดหวังไว้ โมเดลวิดีโอในปัจจุบันจึงยังไม่รองรับการจำลองตัวแทนบุคคลที่มีความซับซ้อนและแยกจากกัน ซึ่งจำเป็นสำหรับประสบการณ์ผู้เล่นหลายคนอย่างแท้จริง
ความสามารถนี้มีความสำคัญอย่างยิ่งเมื่อต้องจัดการกับฝูงชนที่มีชีวิตชีวาจำนวน 20,000 คนที่ตอบสนองแบบเรียลไทม์ แต่เพียงตัวแบบโลกวิดีโอเพียงอย่างเดียวไม่สามารถจัดการปฏิสัมพันธ์ระหว่างผู้เล่นหลายคนตลอดระยะเวลาสองชั่วโมงได้อย่างน่าเชื่อถือ ตัวแบบโลกประสบปัญหาในการบังคับใช้กฎที่เข้มงวดและการคงสถานะอย่างต่อเนื่องเนื่องจากขาดความจำระยะยาวและตรรกะที่สอดคล้องกัน โมเดลวิดีโอเวิลด์ขาดข้อมูลการควบคุมจากผู้ใช้ ซึ่งเป็นเหตุผลว่าทำไมการเล่นโมเดลวิดีโอเวิลด์จึงไม่สนุก เนื่องจากโมเดลวิดีโอเวิลด์มีปัญหาเกี่ยวกับสถานะที่คงอยู่, ตรรกะที่สม่ำเสมอ, การควบคุมการป้อนข้อมูลจากผู้ใช้, และการจำลองตัวแทนผู้เล่นหลายคนอย่างแท้จริง โมเดลปัจจุบันจึงเหมือนกับความฝันที่มีการนำทางมากกว่า
วิดีโอแบบโต้ตอบที่เราเห็นในปัจจุบันนี้น่าทึ่งมาก แต่โดยพื้นฐานแล้วมันก็เหมือนกับความฝันที่ชัดเจน—สวยงามตระการตาแต่ก็ผ่านไปอย่างรวดเร็วและโดดเดี่ยวอย่างยิ่ง พวกมันขาดปฏิสัมพันธ์ ความท้าทาย รางวัล และความต่อเนื่อง—ทุกสิ่งที่ทำให้เกมเป็นเกม
แบบจำลองโลกประสาทล้วนไม่สามารถส่งมอบประสบการณ์ผู้เล่นหลายคนที่ยิ่งใหญ่และคงอยู่ได้ แม้ว่าแบบจำลองโลกประสาทจะน่าประทับใจในหลายๆ ด้าน แต่พวกมันล้มเหลวในหลายๆ ด้านที่สำคัญ บางส่วนของปัญหาเหล่านี้ได้แก่ ความสอดคล้องกันตลอดเวลาในเซสชั่นเดียว ความจำระยะยาวข้ามเซสชั่น ความหน่วงเวลา และการควบคุมอย่างละเอียดจากผู้สร้าง ช่องว่างที่ไม่ชัดเจนปรากฏขึ้นเมื่อคุณคิดถึงการจำลองผู้เล่นหลายคนอย่างสม่ำเสมอ การแข่งขันที่แม่นยำ NPC ที่ฉลาดมาก การทดสอบ และการปรับปรุงอย่างต่อเนื่อง เราไม่ควรขอให้เอ็นจิ้นประสาทกลายเป็นเอ็นจิ้นเกม
เอนจินเกม: จุดแข็งและข้อจำกัด
ระบบคลาวด์และเอนจินของ Roblox เป็นส่วนเสริมที่แข็งแกร่งสำหรับโมเดลโลกเสมือนจริง ด้วยความสามารถในการเล่นซ้ำได้อย่างแม่นยำ สภาพแวดล้อมที่คงที่ในทุกเซสชัน และความต่อเนื่องของข้อมูลข้ามช่วงเวลา ยกตัวอย่างเช่น ผู้สร้างเกมที่กำลังพัฒนาเกม Formula 1 Monaco Grand Prix พวกเขาต้องจำลองระบบคะแนนและบทลงโทษที่แม่นยำ ถนน ผู้ชม ธรรมชาติ และการซิงโครไนซ์แบบเรียลไทม์ระหว่างผู้เล่นหลายคน อย่างไรก็ตาม ความแม่นยำนี้มาพร้อมกับต้นทุนในการพัฒนาและค่าใช้จ่ายในการรันเกม การเพิ่มความสมจริงของภาพต้องใช้ทรัพยากรหนัก แสงที่ซับซ้อน และการจำลองสถานการณ์
ในทศวรรษหน้า ผลลัพธ์ของเอนจินเกมระดับสูงจะยังคงพัฒนาในด้านความสมจริงต่อไป แต่ความต้องการในด้านความเชี่ยวชาญของนักพัฒนาและฮาร์ดแวร์ของผู้บริโภคก็จะเพิ่มขึ้นเช่นกัน
ความท้าทายที่อุตสาหกรรมยังไม่สามารถแก้ไขได้จนถึงปัจจุบัน คือการนำเสนอความสมจริงในระดับสูงสุดในวงกว้าง พร้อมทั้งทำให้สามารถเข้าถึงได้สำหรับนักพัฒนาทั้งรายใหญ่และรายย่อย และบนอุปกรณ์สำหรับผู้บริโภคที่มีจำหน่ายอย่างแพร่หลาย
นี่เป็นเพราะโลกแห่งความเป็นจริงมีรายละเอียดที่ประณีตงดงาม รอบๆ แก่นของเกมคือทุกสิ่งทุกอย่าง—องค์ประกอบที่ไม่ถูกเขียนบทและเป็นธรรมชาติ เช่น ใบหญ้า ใบไม้ และกิ่งไม้ที่ปลิวไสวในสายลม กลุ่มฝุ่นที่พัดกระจายและหมุนวนอยู่เบื้องหลังรถยนต์ เปลวไฟและประกายไฟที่ลุกโชติช่วงจากกองไฟ และหยดน้ำฝนที่กระเด็นเบาๆ ในแอ่งน้ำมันที่มีประกายสีรุ้ง เนื้อหาเหล่านี้ยากมากที่จะสร้างและแสดงผล เอนจินเกมแบบดั้งเดิมประสบปัญหาความซับซ้อนทางภาพนี้ โดยมักมองหาทางลัดเพื่อถ่ายทอดความสมจริงที่เรียบง่ายกว่า เนื่องจากภาระหน่วยความจำสำหรับพื้นผิวความละเอียดสูงและรูปทรงเรขาคณิตที่เพิ่มมากขึ้น ก่อให้เกิดข้อจำกัดต่อทรัพยากรที่มีอยู่ ต้นทุนในการจำลองยังพุ่งสูงขึ้นอย่างมหาศาลจากการใช้แสงแบบปริมาตร ระบบเสียงรอบทิศทางแบบ binaural ฟิสิกส์ และการจำลองตัวละคร ซึ่งทั้งหมดนี้รวมกันเป็นความสมจริงระดับภาพถ่าย
เราเชื่อว่าวิธีที่ดีที่สุดสำหรับผู้สร้างในการสร้าง และสำหรับเครื่องมือในการแสดงผลความซับซ้อนนี้ คือการใช้สถาปัตยกรรมแบบไฮบริด ซึ่งโมเดลโลกวิดีโอที่ได้รับการฝึกฝนหลังการฝึก (Post-trained Video World Model) จะสร้างพื้นผิว แสง และพลวัตในระดับละเอียดบนพื้นฐานของการเคลื่อนไหวของกล้อง รูปทรงเรขาคณิต และสถานะตามบริบทของเครื่องมือ
สถาปัตยกรรม: การประสานตรรกะเกมและพิกเซลวิดีโอ
เราเชื่อว่าจำเป็นต้องใช้วิธีการแบบผสมผสานเพื่อให้ผู้สร้างสามารถมอบประสบการณ์การโต้ตอบแบบผู้เล่นหลายคนที่มีความสมจริงสูงพร้อมผลลัพธ์ที่เหมือนจริงราวกับภาพถ่าย เราเรียกวิธีการนี้ว่า Roblox Reality ซึ่งผสานรวม Roblox Game Engine, Roblox Cloud และโมเดลโลกวิดีโอ Roblox ที่อัปสเกลด้วย Super Upsampler เข้าด้วยกัน
สถาปัตยกรรมไฮบริด Roblox Reality แบ่งความรับผิดชอบระหว่าง Roblox Game Engine และ Roblox Video World Model
Roblox Game Engine จัดการกับแง่มุมที่มีโครงสร้างและตรรกะของโลก โดยให้หน่วยความจำระยะยาวที่เสถียร ตรรกะเชิงสัญลักษณ์ และการจำลองที่สามารถทำซ้ำได้ นอกจากนี้ยังรับผิดชอบการดำเนินการทางกายภาพพื้นฐาน เช่น การชนและพฤติกรรมต่างๆ การเคลื่อนไหวหลักของวัตถุถูกจัดการในเอนจิน เช่น ตำแหน่งและความเร็วของรถยนต์ ล้อ โช้ค และพวงมาลัย ต่อยอดจากสิ่งนี้ โมเดลโลกวิดีโอจะเพิ่มองค์ประกอบภาพและองค์ประกอบเชิงสร้างสรรค์เพิ่มเติม เช่น หยดน้ำที่ไหลไปตามกระจกหน้ารถและใบไม้ที่พลิ้วไหวขณะที่รถแล่นผ่านไป มอบภาพที่น่าตื่นตาตื่นใจ วิธีการนี้ช่วยให้เกมเอนจินสามารถรักษาโมเดลข้อมูล (สถานะที่แชร์และสอดคล้องกัน) ในขณะที่โมเดลโลกวิดีโอสร้างพิกเซล (ความฝันทางภาพ)
ความสามารถ | เอนจิน | ซูเปอร์อัพแซมเพลอร์ | |
|---|---|---|---|
หน้าที่หลัก | จัดการการซิงโครไนซ์ทั้งหมดของสถานะเพื่อให้โลกมีความสอดคล้องกัน (แบบจำลองข้อมูล, สถานะที่แชร์และสอดคล้องกัน) | จัดการส่วนประกอบด้านภาพและการสร้าง (พิกเซล ความฝันทางภาพ) | |
ความรับผิดชอบหลัก | ให้หน่วยความจำระยะยาวที่มั่นคง, ตรรกะเชิงสัญลักษณ์, และการจำลองที่สามารถทำซ้ำได้. รับผิดชอบต่อสมบัติทางกายภาพพื้นฐาน (วัสดุและตำแหน่ง) และการดำเนินการ (การชนและการติดตามรังสี). | มอบภาพที่สุ่มและสมจริงอย่างน่าทึ่ง การเคลื่อนไหวรอง สภาพแวดล้อมที่มีพลวัตตามธรรมชาติ และฟิสิกส์ที่ลื่นไหล สร้างพื้นผิวที่มีความละเอียดสูงขึ้น แสงที่สมจริงยิ่งขึ้น และพลวัตในระดับที่ละเอียด | |
ความสม่ำเสมอของโลก | ให้ความแม่นยำ สภาพที่สม่ำเสมอ และความสม่ำเสมอที่รับประกันได้ รวมศูนย์สถานะไว้ในแหล่งข้อมูลเดียวที่เป็นแหล่งความจริง | เชี่ยวชาญในการสร้างพฤติกรรมที่น่าเชื่อถือและมีมิติสูงโดยไม่ต้องมีการจำลองอย่างชัดเจน (เช่น การจัดการฝูงชนที่มีชีวิต) ทำงานได้อย่างยอดเยี่ยมสำหรับผู้เล่นทุกคน | |
ข้อมูลที่จัดการ | ทุกสิ่งที่สอดคล้องกันระหว่างผู้เล่นทุกคน (ผู้เล่น, ตำแหน่ง, รถ, นก, อาคาร, ฉาก 3 มิติ) | สิ่งชั่วคราวที่ผู้เล่นไม่จำเป็นต้องเห็นเหมือนกันทุกประการ (กระป๋องสนิม, ฝูงนก, รูปร่างของเมฆ, อนุภาคของทราย, หญ้า) | |
หน่วยความจำสำหรับเก็บข้อมูล | แบบจำลองข้อมูล | วิดีโอแฝง | |
ข้อจำกัดแบบแยกเดี่ยว | การต่อสู้กับความซับซ้อนทางภาพและความต้องการการคำนวณสูงเพื่อความสมจริงเหมือนภาพถ่าย | การต่อสู้กับการบังคับใช้กฎที่เข้มงวด, ความจำระยะยาว, ตรรกะที่สม่ำเสมอ, และข้อมูลการควบคุมการป้อนข้อมูลจากผู้ใช้ | |
โครงสร้างพื้นฐานของระบบปฏิบัติการ | ศูนย์ข้อมูลเอดจ์กว่า 26 แห่งทั่วโลก ดำเนินการเกมหลายล้านอินสแตนซ์ ใกล้ผู้ใช้เพื่อความหน่วงต่ำ สูงสุดถึง 45+ ล้านคนพร้อมกัน | Super Upsampler ทำงานในดาต้าเซ็นเตอร์ที่อยู่ติดกันที่ขอบเครือข่าย และประสิทธิภาพที่ดีที่สุด ได้รับการขับเคลื่อนโดย GPU คลาส H200/B200 (หรือตัวเร่งความเร็วที่เทียบเท่า) |
แพลตฟอร์มนี้ร่วมกันสนับสนุนการสร้างเนื้อหาที่ไม่มีที่สิ้นสุดพร้อมการควบคุมอย่างลึกซึ้งสำหรับผู้สร้าง

เป้าหมายการพัฒนาของเราสำหรับ Roblox Reality คือการสร้างโมเดลวิดีโอของ Roblox ที่สามารถแสดงผลความละเอียด 2K ที่ 60 Hz โดยดึงข้อมูลต้นทางจาก Roblox Game Engine ทั้งในรูปแบบวิดีโอที่เรนเดอร์แล้วและข้อมูลเชิงพื้นที่ 3 มิติ Roblox Reality จะได้รับการปรับแต่งให้ทำงานบนโครงสร้างพื้นฐาน GPU ที่อยู่บนคลาวด์ร่วมกับวิดีโอสตรีมมิ่ง และในอนาคตจะผสานรวมกับไคลเอนต์ของ Roblox เพื่อรองรับการควบคุมอวตารและการจำลองแบบในเครื่อง
สรุป
Roblox Reality เป็นก้าวสำคัญในการทำให้การสร้างเป็นประชาธิปไตย โดยอนุญาตให้ผู้สร้างทุกคนสร้างเกมที่มีความสมจริงระดับภาพถ่ายได้ โดยใช้ประโยชน์จาก Roblox Game Engine และ Video Model ซึ่งช่วยลดเวลาในการพัฒนา ต้นทุน และการประมวลผลที่จำเป็นสำหรับการสร้างกราฟิกที่มีความสมจริงสูงได้อย่างมาก สิ่งนี้ทำให้การสร้างเกมที่มีความสมจริงระดับภาพถ่ายเป็นไปได้อย่างรวดเร็วและคุ้มค่ามากขึ้นสำหรับผู้สร้างของเรา เนื่องจากต้นทุนการคำนวณที่สูง เราตระหนักดีว่ามีความท้าทายที่เราต้องแก้ไขก่อนที่จะสามารถขยายสถาปัตยกรรม Roblox Reality ได้ เรากำลังทำงานเพื่อหาวิธีแก้ไขที่จะช่วยให้เราเพิ่มประสิทธิภาพและเพิ่มประสิทธิภาพสำหรับสถาปัตยกรรมนี้ เพื่อที่เราจะสามารถขยายไปยังผู้เล่นหลายล้านคนพร้อมกันได้ในราคาที่คุ้มค่ามากขึ้น
เหนือสิ่งอื่นใด เรารู้สึกตื่นเต้นที่จะสร้างแพลตฟอร์มเพื่อปลดล็อกเกมที่ให้ผู้สร้างของเราสามารถสร้างประสบการณ์มัลติเพลเยอร์ที่สมจริงราวกับภาพถ่ายที่น่าทึ่ง!



