طريق Roblox نحو الذكاء الاصطناعي التوليدي رباعي الأبعاد

- تعمل Roblox على تطوير الذكاء الاصطناعي التوليدي رباعي الأبعاد (4D)، متجاوزةً الكائنات ثلاثية الأبعاد الفردية لتصل إلى التفاعلات الديناميكية.
- سيتطلب حل التحدي الذي يمثله نظام 4D فهمًا متعدد الوسائط يشمل المظهر والشكل والفيزياء والنصوص البرمجية.
- الأدوات المبكرة التي تشكل أساس نظامنا رباعي الأبعاد تعمل بالفعل على تسريع عملية الإنشاء على المنصة.
تُمكّن Roblox المبدعين من بناء تجارب ثلاثية الأبعاد غامرة وأفاتار وإكسسوارات من خلال توفير الأدوات والخدمات والدعم الذي يحتاجونه لتجسيد أفكارهم. هؤلاء المبدعون هم من يصنعون المحتوى النابض بالحياة على منصتنا، والذي يجذب أكثر من 77 مليون مستخدم نشط يوميًا (اعتبارًا من الربع الأول من عام 2024). من خلال تطبيق Roblox Studio المجاني، أطلقنا مجموعة من أدوات الذكاء الاصطناعي التوليدي المصممة خصيصًا لسير عمل Roblox والمدربة على محتوى خاص بـ Roblox.
تجعل هذه الأدوات عملية الإنشاء أسهل وأكثر كفاءة ومتعة للخبراء والمبتدئين على حد سواء. يتيح Assistant تحرير مساحة العمل ثلاثية الأبعاد، ويتيح Animation Capture حركة الوجه والجسم، ويساعد Code Assist في تحرير البرامج النصية وإنشائها، ويتيح Material Generator مظهر المواد المتجاورة، ويتيح Texture Generator تعيين نسيج خاص بالأصول. تعزز كل أداة من أدوات الذكاء الاصطناعي التوليدي هذه جزءًا واحدًا من عملية الإبداع ثلاثية الأبعاد.
وتعمل هذه الأدوات مجتمعة على تعزيز مهارات المبدع وتقليل الوقت المستغرق من الفكرة إلى الإنجاز. لقد قمنا بتطوير هذه الأدوات باستخدام إنجازاتنا البحثية المبتكرة بالإضافة إلى أفضل الحلول المتاحة من النظام البيئي الأكبر للذكاء الاصطناعي. وهي تتناول إنشاء الأصول الفردية في الأبعاد الأحادية (البرامج النصية) والثنائية (الأسطح) والثلاثية (المساحات). نعرض بعض النتائج من مختبرنا لتوليد وتحرير الهندسة ثلاثية الأبعاد في مؤتمرات بحثية دولية متنوعة، بما في ذلك مؤتمر مطوري Roblox الخاص بنا.
في جميع أنحاء الصناعة، يعد الأبعاد الأحادية والثنائية من أحدث ما توصلت إليه التكنولوجيا، بينما يمثل الأبعاد الثلاثي أحدث ما توصلت إليه الذكاء الاصطناعي التوليدي. يمثل كل منها تحديًا متزايد الأهمية يدفع باستمرار إلى تحقيق تقدم تقني مثير. نظرًا لأننا نعيش في فضاء ثلاثي الأبعاد، قد يبدو أن هذا هو التحدي النهائي للذكاء الاصطناعي التوليدي. ومع ذلك، استنادًا إلى احتياجات مجتمعنا، تمتد رؤيتنا لهذا العمل إلى أبعد من ذلك.
أين نحن اليوم
نحن نعمل على تطوير الذكاء الاصطناعي التوليدي رباعي الأبعاد (4D)، حيث يمثل البعد الرابع التفاعل. تكمن قوة منصة Roblox عبر الإنترنت في التفاعل — بين الأشخاص والأشياء والبيئات. على عكس ألعاب الفيديو التقليدية عبر الإنترنت، يستفيد محرك التشغيل القوي لـ Roblox من نموذج برمجة ومحاكاة فريد يركز على التفاعل. هذا النموذج مستوحى من مفهوم الميتافيرس، حيث تلتقي العناصر بطرق معقدة ومتعددة الأطراف وعفوية، بدلاً من الطرق المحددة والمقيدة.
تنتج أدوات الذكاء الاصطناعي التوليدي أحادي الأبعاد وثنائي الأبعاد وثلاثي الأبعاد أصولًا فردية. يكمن التحدي الذي نواجهه مع الذكاء الاصطناعي التوليدي رباعي الأبعاد في إحياء تلك الأصول بطرق تتيح تفاعلات غير مقيدة ومناسبة لمنصتنا. وهذا يعني، على سبيل المثال، أن الصورة الرمزية ليست مجرد شكل ولون — بل هي أيضًا هيكل عظمي ورسوم متحركة وقدرة على الإمساك بالأدوات والحفاظ على التوازن. يمكن لهذا الأفتار ارتداء ملابس لم تُصمم خصيصًا له، وتقوم هذه الملابس بالتكيف تلقائيًا لتناسبه تمامًا وتتبع كل حركاته. تعد أداة Avatar AutoSetup الجديدة الخاصة بنا مثالًا مبكرًا على كيفية مساعدة الذكاء الاصطناعي التوليدي في أتمتة هذا النوع من الإنشاء. يمكن للمطورين الآن إكمال هذه العملية في دقائق بدلاً من ساعات أو أيام.
السيارة الرياضية ليست مجرد شكل أنيق وطلاء سطحي — بل هي أيضًا المحرك والأجزاء المتحركة ونظام الفيزياء الذي يمكّنها من الانطلاق بسرعة في الشوارع الافتراضية بدقة وتحكم. في كل حالة، يتم توسيع الكائن من ثلاثي الأبعاد للتفاعل مع جميع أجزائه من خلال الفيزياء ومع المستخدم من خلال شخصيته الرقمية.
يمكن إضافة كل عنصر من هذه العناصر رباعية الأبعاد الغنية بالتفاعل إلى بيئة أكبر حيث يعمل الذكاء الاصطناعي التوليدي على تنسيق أسلوب كل عنصر وإدخال دعم تفاعلي بين الكائنات ومع البيئة. الآن يمكن للمستخدم، من خلال شخصيته الرقمية، القيادة في سباق شوارع مع مُعدِّلات الضرر والنتائج العالية، والانزلاق حتى التوقف عند متجر أزياء ذي علامة تجارية، حيث يتسوق لشراء ملابس جديدة للاحتفال بفوزه.
اليوم، يتطلب إنشاء مثل هذه التجارب إنشاءً يدويًا لشفرة مصدر البرنامج النصي، ومساحة العمل، وهيكل نموذج البيانات، والهندسة ثلاثية الأبعاد، والرسوم المتحركة، والمواد. تساعد أدوات الذكاء الاصطناعي التوليدي الحالية لدينا في كل جزء من خط الإنتاج. نحن نعمل على بناء نظام يربط بين جميع هذه العناصر ويقوم بإنشائها في وقت واحد. لتحقيق ذلك، يجب أن ندرب نظام الذكاء الاصطناعي التوليدي رباعي الأبعاد (4D) بطريقة متعددة الوسائط، أي عبر أنواع متعددة من البيانات معًا. وقد تم ذلك بالفعل بالنسبة للصور والنصوص، التي تشغل "مولد المواد" (Material Generator). إن تمكين التفاعل وإضافة مُحسّنات مصممة خصيصًا للفيزياء هو السبيل الذي سنصل من خلاله إلى المستوى التالي من القدرات رباعية الأبعاد.
في العام الماضي فقط، شهدنا تغييرات هائلة في كيفية إنشاء المحتوى على Roblox. وبالنظر إلى المستقبل، نرى مستقبلاً يمكن لأي شخص، في أي مكان، أن يحول فكرة إلى واقع بمجرد كتابة أو نطق أمر. للوصول إلى ذلك، نحتاج إلى البدء في حل بعض التحديات التي سنواجهها على الطريق.
التحديات التي تنتظرنا
ستتوفر التجارب التي شاركناها أعلاه في المستقبل القريب. وفي المستقبل البعيد، نواجه ثلاثة تحديات واضحة سنحتاج إلى التغلب عليها:
1. الوظيفية: يجب أن تكون الكائنات التي تنشئها أداة الذكاء الاصطناعي التوليدية المستقبلية هذه وظيفية. يتعلق الأمر بأن ينظر النظام إلى شاحنة أو طائرة حيث يكون لديك الشكل ثلاثي الأبعاد — ولا يعاملها ككائن غير شفاف مغلق. وبدون تدخل من المبدع، يمكنه التعرف تلقائيًا على الأجزاء التي تحتاج إلى مفاصل، أو المكان الذي يجب أن تفتح فيه الشبكة.
هذه مشكلة ذكاء اصطناعي على مستوى الإنسان تحتاج هذه الأنظمة إلى حلها — للبحث عن الموضع الصحيح للعجلات، على سبيل المثال، ثم إضافة محور للعجلات بحيث تعمل بنفس الطريقة التي تعمل بها في العالم المادي. والبحث عن مكان الباب ثم قطع فتحة وإضافة مفصلات حتى يمكن فتح الباب وإغلاقه.
2. التفاعلية: يجب أن تكون العناصر التي تم إنشاؤها باستخدام الذكاء الاصطناعي التوليدي المستقبلي قادرة ليس فقط على العمل بشكل مستقل، بل أيضًا على التفاعل مع الكائنات الأخرى في البيئة. لذا، الآن بعد أن أنشأ النظام لنا سيارة بباب يفتح وعجلات تدور، فإنه يحتاج إلى فهم فيزياء العالم الذي توضع فيه السيارة. كيف تتحرك السيارة على التضاريس؟ إذا اصطدمت بصخرة، فأين وكيف تنهار، بناءً على حجم الصخرة وسرعة السيارة؟
يتطلب هذا التحدي المعقد أن يفهم كل من الكائن الذي تم إنشاؤه والبيئة أو الكائنات التي يتفاعل معها فيزياء بعضهما البعض. لحسن الحظ، تتمتع Roblox بميزة في هذا الجانب، حيث تم بناء المنصة كمحرك فيزيائي، مما يعني أن جميع الكائنات في التجارب يمكن أن تكون مادية. عندما يصنع الذكاء الاصطناعي التوليدي كائنًا رباعي الأبعاد، ستُضاف أيضًا خصائص فيزيائية مثل المادة والكتلة والقوة لإعداده للتفاعل مع الكائنات الأخرى القائمة على الفيزياء في العالم.
3. قابلية التحكم: اليوم، نتفاعل مع الذكاء الاصطناعي التوليدي باستخدام المطالبات. هذه علم غير كامل، يشبه لعبة البحث عن الكنز. قد يتلقى شخص يطلب صورة لأرنب مجموعة متنوعة ضخمة من النتائج: أرنب حقيقي، أرنب عيد الفصح من الشوكولاتة، أرنب كرتوني، لوحة لأرنب، أو رسم توضيحي لأرنب يرتدي معطفًا. لذلك نقوم بتحسين المطالبات، وطلب صور واقعية أو صور "بأسلوب" معين بينما نحدد الرؤية الموجودة في أذهاننا. يستغرق هذا وقتًا ومحاولات متكررة للاقتراب مما نبحث عنه.
تخيل محاولة اتباع هذه العملية لكائن ثلاثي الأبعاد يعمل ويتفاعل مع كائنات أخرى، مثل الشاحنة في المثال أعلاه. ستكون هندسة المطالبات على هذا المستوى معقدة بشكل كبير — وليست شيئًا يمكن لأي شخص استخدامه بسهولة. لإحياء فكرة المبدع، نحتاج إلى طريقة أسرع وأسهل للتواصل والتحسين، والتعاون بشكل أساسي مع مساعد ذكاء اصطناعي يكون شريكًا أكثر منه لعبة البحث عن الكنز.
هذا تحدٍ على مستوى الصناعة، وتعمل العديد من الشركات على تحقيق قدر أكبر من التحكم في الذكاء الاصطناعي التوليدي. لقد أحرزنا بعض التقدم في هذا المجال باستخدام أدوات مثل ControlNet، التي تزيد من التحكم من خلال السماح للمبدع بتوفير شروط إدخال إضافية تتجاوز مجرد المطالبات النصية. نحن نستكشف حاليًا طرقًا أخرى واعدة لتحقيق سير عمل مرضٍ، مثل جعل الذكاء الاصطناعي يتوقف مؤقتًا بعد الخطوات الحاسمة لانتظار إدخال المستخدم. لكن لا يزال أمامنا طريق طويل لنقطعه لتحقيق تجربة سلسة.
نحن متحمسون للتأثير الذي رأيناه حتى الآن، ونحن أكثر حماسًا لما ينتظرنا في المستقبل. مقارنةً بالمبدعين الذين لا يستخدمون الإصدار التجريبي من Material Generator، زاد أولئك الذين يستخدمونه من استخدامهم لتنوعات المواد القائمة على العرض الفيزيائي (PBR) بأكثر من 100 في المائة، حيث ارتفع العدد من ما يزيد قليلاً عن ألف في مارس 2023 إلى أكثر من ألفي في يونيو 2024. اعتبارًا من 2 يونيو 2024، اعتمد المبدعون ما يقرب من 535 مليون حرف من الكود المقترح بواسطة Code Assist.
مع بدء حل التحديات على هذا الطريق نحو 4D، سيتمكن المبدعون لدينا من إنشاء المزيد بسرعة أكبر. نتوقع أيضًا رؤية تنوع أكبر في التجارب على Roblox مع تمكين المزيد من الأشخاص من أن يصبحوا مبدعين. ما يبنونه وكيف يبنونه سيُظهر لنا أين نستثمر في أدوات جديدة وخوارزميات الذكاء الاصطناعي لتمكين هؤلاء المبدعين الجدد، جنبًا إلى جنب مع مجتمعنا الحالي.
بفضل الذكاء الاصطناعي التوليدي رباعي الأبعاد، فتحت Roblox آفاقًا جديدة لإنشاء التجارب والأصول. ورغم أن التحديات جديدة، فإن عملية الابتكار لدينا محكمة الصنع. فنحن نجمع بين فرق البحث والتطوير الداخلية المتميزة لدينا، والتعاون مع الجامعات، والتكرار السريع للنماذج الأولية بالشراكة مع مجتمعنا.



