रॉब्लॉक्स की 4D जेनरेटिव एआई की ओर यात्रा

- Roblox 4D जेनरेटिव एआई की ओर बढ़ रहा है, जो एकल 3D वस्तुओं से परे गतिशील इंटरैक्शन तक जाता है।
- 4D की चुनौती को हल करने के लिए रूप, आकार, भौतिकी और स्क्रिप्ट्स में बहु-मोडल समझ की आवश्यकता होगी।
- हमारी 4D प्रणाली के लिए आधारभूत प्रारंभिक उपकरण पहले से ही प्लेटफ़ॉर्म पर रचना को गति दे रहे हैं।
रॉब्लॉक्स रचनाकारों को उनके विचारों को साकार करने के लिए आवश्यक उपकरण, सेवाएँ और सहायता प्रदान करके इमर्सिव 3D अनुभव, अवतार और एक्सेसरीज़ बनाने के लिए सशक्त बनाता है। ये वही निर्माता हैं जो हमारे प्लेटफ़ॉर्म पर जीवंत सामग्री बनाते हैं, जो 77 मिलियन से अधिक दैनिक सक्रिय उपयोगकर्ताओं (Q1 2024 तक) को आकर्षित करती है। हमारी मुफ़्त Roblox Studio ऐप के माध्यम से, हमने जनरेटिव AI टूल्स का एक सुइट जारी किया है जो विशेष रूप से Roblox वर्कफ़्लो के लिए डिज़ाइन किया गया है और Roblox-विशिष्ट सामग्री पर प्रशिक्षित है।
ये उपकरण विशेषज्ञों और नए सीखने वालों, दोनों के लिए रचना को आसान, अधिक कुशल और अधिक मजेदार बनाते हैं। असिस्टेंट 3D वर्कस्पेस एडिटिंग को सक्षम करता है, एनिमेशन कैप्चर चेहरे और शरीर की गति को सक्षम करता है, कोड असिस्ट स्क्रिप्ट एडिटिंग और निर्माण में मदद करता है, मटेरियल जनरेटर टाइलिंग मटेरियल अपीयरेंस को सक्षम करता है, और टेक्सचर जनरेटर एसेट-विशिष्ट टेक्सचर मैपिंग को सक्षम करता है। इनमें से प्रत्येक जेनरेटिव एआई उपकरण 3डी रचनात्मक प्रक्रिया के एक हिस्से को बेहतर बनाता है।
एक साथ, ये उपकरण एक निर्माता के कौशल को बढ़ाते हैं और अवधारणा से पूर्णता तक लगने वाले समय को कम करते हैं। हमने इन्हें अपनी नवीनतम अनुसंधान सफलताओं के साथ-साथ बड़े एआई इकोसिस्टम से बेहतरीन समाधानों का उपयोग करके बनाया है। ये 1D (स्क्रिप्ट), 2D (सतहें), और 3D (स्थान) में व्यक्तिगत एसेट्स के निर्माण को संबोधित करते हैं। हम अपनी 3D ज्यामिति जनरेशन और एडिटिंग लैब के कुछ परिणामों का पूर्वावलोकन विभिन्न अंतरराष्ट्रीय अनुसंधान सम्मेलनों में करते हैं, जिसमें हमारा अपना रॉब्लॉक्स डेवलपर्स कॉन्फ्रेंस भी शामिल है।
पूरी इंडस्ट्री में, 1D और 2D अत्याधुनिक हैं, और 3D जेनेरेटिव एआई के क्षेत्र में सबसे आगे है। प्रत्येक एक लगातार बढ़ती हुई महत्वपूर्ण चुनौती है जो लगातार रोमांचक तकनीकी प्रगति को बढ़ावा देती है। चूँकि हम 3D स्पेस में रहते हैं, इसलिए ऐसा लग सकता है कि यह जेनेरेटिव एआई की अंतिम चुनौती है। हालाँकि, हमारे समुदाय की ज़रूरतों के आधार पर, इस काम के लिए हमारी दृष्टि और भी आगे तक जाती है।
आज हम कहाँ हैं
हम 4D जेनरेटिव एआई की ओर काम कर रहे हैं, जहाँ चौथा आयाम इंटरैक्शन है। रॉब्लॉक्स के ऑनलाइन प्लेटफ़ॉर्म की शक्ति इंटरैक्शन है—लोगों, वस्तुओं और वातावरणों के बीच। पारंपरिक ऑनलाइन वीडियो गेम के विपरीत, रॉब्लॉक्स का शक्तिशाली रनटाइम इंजन इंटरैक्शन पर केंद्रित एक अनूठे प्रोग्रामिंग और सिमुलेशन मॉडल का लाभ उठाता है। यह मॉडल मेटावर्स की अवधारणा से प्रेरित है, जहाँ तत्व निर्धारित और सीमित तरीकों के बजाय जटिल, कई-से-कई और सहज तरीकों से मिलते हैं।
1D, 2D, और 3D जेनरेटिव एआई टूल व्यक्तिगत एसेट्स बनाते हैं। 4D जेनरेटिव एआई के साथ हमारे सामने जो चुनौती है, वह उन एसेट्स को ऐसे तरीकों से जीवंत करना है जो हमारे प्लेटफ़ॉर्म के लिए उपयुक्त असीमित इंटरैक्शन को सक्षम बनाएं। इसका मतलब यह है, उदाहरण के लिए, कि एक अवतार सिर्फ आकार और रंग नहीं है—यह एक कंकाल, एनिमेशन, और उपकरणों को पकड़ने और संतुलन बनाने की क्षमता भी है। वह अवतार ऐसे कपड़े पहन सकता है जो विशेष रूप से उसके लिए डिज़ाइन नहीं किए गए हैं और जो स्वचालित रूप से पूरी तरह से फिट हो जाते हैं और सभी गतिविधियों को ट्रैक करते हैं। हमारा नया अवतार ऑटोसेटअप टूल इस बात का एक शुरुआती उदाहरण है कि जेनरेटिव एआई इस प्रकार की रचना को स्वचालित करने में कैसे मदद कर सकता है। डेवलपर्स अब इस प्रक्रिया को घंटों या दिनों के बजाय मिनटों में पूरा कर सकते हैं।
एक स्पोर्ट्स कार सिर्फ एक आकर्षक आकार और सतह का रंग नहीं है—यह इंजन, चलने वाले हिस्से और फिजिक्स रिग भी है जो इसे सटीकता और नियंत्रण के साथ वर्चुअल सड़कों पर तेज़ी से दौड़ने में सक्षम बनाता है। प्रत्येक मामले में, वस्तु को 3D से विस्तारित किया जाता है ताकि वह अपने सभी हिस्सों के साथ फिजिक्स के माध्यम से और एक उपयोगकर्ता के साथ उनके अवतार के माध्यम से इंटरैक्ट कर सके।
इनमें से प्रत्येक समृद्ध रूप से इंटरैक्टिव 4D तत्व को एक बड़े वातावरण में जोड़ा जा सकता है, जहाँ जेनरेटिव एआई प्रत्येक तत्व की शैली को सामंजस्यपूर्ण बनाता है और वस्तुओं के बीच और वातावरण के साथ इंटरैक्टिव समर्थन प्रदान करता है। अब एक उपयोगकर्ता, अपने अवतार के माध्यम से, क्षति संशोधकों और उच्च स्कोर के साथ एक स्ट्रीट रेस में ड्राइव कर सकता है, और एक ब्रांडेड फैशन स्टोर पर फिसलकर रुक सकता है, जहाँ वे अपनी जीत का जश्न मनाने के लिए नए कपड़े खरीदते हैं।
आज, ऐसे अनुभव बनाने के लिए स्क्रिप्ट स्रोत कोड, वर्कस्पेस और डेटा मॉडल संरचना, 3D ज्यामिति, एनिमेशन और सामग्रियों का मैन्युअल रूप से निर्माण करना आवश्यक है। हमारे मौजूदा जेनेरेटिव एआई उपकरण पाइपलाइन के प्रत्येक भाग में मदद करते हैं। हम एक ऐसी प्रणाली बना रहे हैं जो इन सभी तत्वों को जोड़कर एक साथ उत्पन्न करेगी। इसे प्राप्त करने के लिए, हमें अपनी 4D जेनरेटिव एआई प्रणाली को मल्टीमोडल तरीके से प्रशिक्षित करना होगा, जिसका अर्थ है विभिन्न प्रकार के डेटा को एक साथ उपयोग करके। यह पहले से ही इमेज और टेक्स्ट के लिए किया जा चुका है, जो मैटेरियल जनरेटर को शक्ति प्रदान करते हैं। इंटरैक्शन को सक्षम करना और फिजिक्स के लिए विशेष रूप से बनाए गए ऑप्टिमाइज़र जोड़ना ही वह तरीका है जिससे हम 4D क्षमता के अगले स्तर तक पहुंचेंगे।
पिछले साल भर में ही, हमने Roblox पर सामग्री बनाने के तरीके में जबरदस्त बदलाव देखे हैं। आगे देखते हुए, हम एक ऐसा भविष्य देखते हैं जहाँ कोई भी, कहीं भी, बस एक कमांड टाइप या बोलकर किसी विचार को साकार कर सकता है। वहाँ तक पहुँचने के लिए, हमें रास्ते में आने वाली कुछ चुनौतियों को हल करना शुरू करना होगा।
हमारे सामने की चुनौतियाँ
हमारे द्वारा ऊपर साझा किए गए प्रयोग निकट भविष्य में उपलब्ध होंगे। आगे चलकर, हमें तीन स्पष्ट चुनौतियों का सामना करना होगा जिन्हें हमें सुलझाना होगा:
1. कार्यात्मक: इस भविष्य के जेनरेटिव एआई टूल द्वारा बनाई गई वस्तुओं को कार्यात्मक होने की आवश्यकता है। यह इस बारे में है कि सिस्टम एक ट्रक या एक विमान को देखे जहाँ 3D आकार मौजूद है — और इसे एक सीलबंद अपारदर्शी वस्तु के रूप में न माने। और निर्माता को हस्तक्षेप किए बिना, यह स्वचालित रूप से पहचान सके कि, ये वे हिस्से हैं जिनमें जोड़ों की आवश्यकता है, या यहाँ मेष खुलने की आवश्यकता है।
यह एक मानवीय-स्तर की एआई समस्या है जिसे इन प्रणालियों को हल करने की आवश्यकता है—उदाहरण के लिए, सही पहिये की जगह खोजने के लिए, और फिर पहियों के लिए एक एक्सल जोड़ने के लिए ताकि वे उसी तरह काम करें जैसे वे भौतिक दुनिया में करते हैं। और यह खोजने के लिए कि दरवाज़ा कहाँ है और फिर एक उद्घाटन बनाने और कब्ज़े जोड़ने के लिए ताकि दरवाज़ा खुल और बंद हो सके।
2. इंटरैक्टिव: इस भविष्य के जनरेटिव एआई से बनाई गई वस्तुओं को न केवल स्वतंत्र रूप से काम करने में सक्षम होना चाहिए, बल्कि पर्यावरण में अन्य वस्तुओं के साथ बातचीत भी करनी चाहिए। तो अब जब सिस्टम ने हमारे लिए एक दरवाज़ा खोलने वाली कार और घूमने वाले पहियों वाली कार बनाई है, तो उसे उस दुनिया के भौतिकी को समझने की ज़रूरत है जिसमें कार को रखा गया है। वाहन ज़मीन पर कैसे चलता है? अगर यह किसी चट्टान से टकराता है, तो चट्टान के आकार और वाहन की गति के आधार पर यह कहाँ और कैसे चकनाचूर होता है?
इस जटिल चुनौती के लिए यह आवश्यक है कि बनाई गई वस्तु और वह वातावरण या वस्तुएँ जिनके साथ यह संपर्क में आती है, दोनों ही एक-दूसरे के भौतिकी को समझें। सौभाग्य से, रोब्लॉक्स को इस मामले में बढ़त हासिल है, क्योंकि यह प्लेटफ़ॉर्म एक फ़िज़िक्स इंजन के रूप में बनाया गया था, जिसका मतलब है कि अनुभवों में सभी वस्तुएँ भौतिक हो सकती हैं। जब जेनरेटिव एआई एक 4D वस्तु बनाता है, तो उसे दुनिया में अन्य भौतिक रूप से आधारित वस्तुओं के साथ बातचीत करने के लिए तैयार करने हेतु उसमें सामग्री, द्रव्यमान और मजबूती जैसे भौतिक गुण भी जोड़े जाते हैं।
3. नियंत्रित करने योग्य: आज, हम प्रॉम्प्ट का उपयोग करके जेनेरेटिव एआई के साथ बातचीत करते हैं। यह एक अधूरा विज्ञान है, जो एक खजाने की खोज के समान है। खरगोश की तस्वीर मांगने वाले किसी व्यक्ति को परिणामों की एक बड़ी विविधता मिल सकती है: एक असली खरगोश, एक चॉकलेट ईस्टर बनी, एक कार्टून बनी, खरगोश की एक पेंटिंग, या कोट पहने खरगोश का एक चित्र। इसलिए हम प्रॉम्प्ट को परिष्कृत करते हैं, फोटोरियलिस्टिक छवियों या "की शैली में" छवियों के लिए पूछते हैं, ताकि हम अपने मन में जो कल्पना है, उसे साकार कर सकें। यह हमारे द्वारा चाही जा रही चीज़ के करीब पहुँचने के लिए समय और बार-बार प्रयास लेता है।
कल्पना कीजिए कि आप एक 3D वस्तु के लिए इस प्रक्रिया का पालन करने की कोशिश कर रहे हैं जो काम करती है और अन्य वस्तुओं के साथ बातचीत करती है, जैसे कि हमारे ऊपर दिए गए उदाहरण में ट्रक। इस स्तर पर प्रॉम्प्ट इंजीनियरिंग घातीय रूप से जटिल होगी—ऐसी कोई चीज़ नहीं जिसे कोई भी आसानी से उपयोग कर सके। किसी निर्माता के विचार को साकार करने के लिए, हमें संवाद करने और परिष्कृत करने का एक तेज़, आसान तरीका चाहिए, जो मूल रूप से एक एआई सहायक के साथ सहयोग करना है जो एक साथी अधिक हो और खोज-खोजकर काम करवाने वाला कम।
यह एक उद्योग-व्यापी चुनौती है, और कई कंपनियाँ जेनेरेटिव एआई में बेहतर नियंत्रण लाने के लिए काम कर रही हैं। हमने यहाँ ControlNet जैसे टूल के साथ कुछ प्रगति की है, जो रचनाकार को केवल टेक्स्ट प्रॉम्प्ट से परे अतिरिक्त इनपुट स्थितियाँ प्रदान करने की अनुमति देकर नियंत्रण बढ़ाता है। हम वर्तमान में अन्य तरीकों का पता लगा रहे हैं जो एक संतोषजनक वर्कफ़्लो के लिए आशाजनक हैं, जैसे कि महत्वपूर्ण चरणों के बाद एआई को उपयोगकर्ता के इनपुट की प्रतीक्षा के लिए रोकना। लेकिन एक सहज अनुभव प्राप्त करने के लिए हमें अभी लंबा रास्ता तय करना है।
हम अब तक देखे गए प्रभाव से उत्साहित हैं और आने वाले समय को लेकर और भी अधिक उत्साहित हैं। मटेरियल जनरेटर के लिए बीटा का उपयोग नहीं करने वाले रचनाकारों की तुलना में, जो इसका उपयोग कर रहे हैं, उन्होंने फिजिक्स-बेस्ड रेंडरिंग (PBR) मटेरियल वेरिएशन्स का उपयोग 100 प्रतिशत से अधिक बढ़ा दिया है—मार्च 2023 में सिर्फ एक हजार से थोड़ा अधिक से बढ़कर जून 2024 में दो हजार से अधिक हो गया है। 2 जून, 2024 तक, क्रिएटर्स ने कोड असिस्ट द्वारा सुझाए गए लगभग 535 मिलियन कोड कैरेक्टर्स को अपनाया है।
जैसे-जैसे हम 4D की इस राह पर आने वाली चुनौतियों को हल करना शुरू करते हैं, हमारे क्रिएटर अधिक, तेज़ी से बना पाएंगे। हम यह भी उम्मीद करते हैं कि रोब्लॉक्स पर अनुभवों में अधिक विविधता देखने को मिलेगी क्योंकि हम अधिक लोगों के लिए क्रिएटर बनने को संभव बना रहे हैं। वे क्या बनाते हैं और कैसे बनाते हैं, यह हमें बताएगा कि इन नए क्रिएटरों को, हमारे मौजूदा समुदाय के साथ-साथ, सशक्त बनाने के लिए नए टूल्स और AI एल्गोरिदम में कहाँ निवेश करना है।
4D जेनरेटिव एआई के साथ, रॉब्लॉक्स ने अनुभव और एसेट निर्माण के लिए एक नया क्षेत्र खोल दिया है। हालांकि चुनौतियां नई हैं, लेकिन नवाचार की हमारी प्रक्रिया अच्छी तरह से निखरी हुई है। हम अपनी शीर्ष-स्तरीय आंतरिक अनुसंधान और विकास टीमों, विश्वविद्यालय सहयोग, और हमारे समुदाय के साथ साझेदारी में प्रोटोटाइप पर त्वरित पुनरावृत्ति को जोड़ते हैं।



