या साइटवरील सामग्री कृत्रिम बुद्धिमत्ता (AI) किंवा मशीन भाषांतर तंत्रज्ञानाचा वापर करून भाषांतरित केली आहे आणि त्यात त्रुटी असू शकतात.

Skip to content

रॉब्लॉक्सचा 4D जनरेटिव्ह एआयकडे प्रवास

  • Roblox 4D जनरेटिव्ह AI कडे वाटचाल करत आहे, एकल 3D वस्तूंपलीकडे गतिशील परस्परसंवादांकडे जात आहे. 
  • 4D चे आव्हान सोडवण्यासाठी देखावा, आकार, भौतिकशास्त्र आणि पटकथा या सर्वांमधील बहुमोडल समज आवश्यक आहे.
  • आमच्या 4D प्रणालीसाठी पायाभूत असलेली प्रारंभिक साधने प्लॅटफॉर्मवर निर्मितीला आधीच गती देत आहेत.

रॉब्लॉक्स निर्मात्यांना त्यांच्या कल्पनांना जीवंत करण्यासाठी आवश्यक असलेली साधने, सेवा आणि समर्थन प्रदान करून त्यांना इमर्सिव्ह 3D अनुभव, अवतार आणि अॅक्सेसरी तयार करण्यास सक्षम करते. हेच निर्माते आमच्या प्लॅटफॉर्मवर आकर्षक सामग्री तयार करतात, जी 77 दशलक्षाहून अधिक दैनिक सक्रिय वापरकर्त्यांना (Q1 2024 पर्यंत) गुंतवते. आमच्या मोफत Roblox Studio अॅपद्वारे, आम्ही जनरेटिव्ह AI साधनांची एक मालिका जारी केली आहे जी खास Roblox वर्कफ्लोसाठी डिझाइन केलेली आहे आणि Roblox-विशिष्ट सामग्रीवर प्रशिक्षित आहे.

ही साधने तज्ञ आणि नवशिक्या दोघांसाठीही निर्मिती अधिक सोपी, कार्यक्षम आणि मजेदार बनवतात. असिस्टंट 3D वर्कस्पेस संपादन सक्षम करते, अ‍ॅनिमेशन कॅप्चर चेहरा आणि शरीराच्या हालचालींना सक्षम करते, कोड असिस्ट स्क्रिप्ट संपादन आणि निर्मितीत मदत करते, मटेरियल जनरेटर टायलिंग मटेरियल देखावा सक्षम करते, आणि टेक्सचर जनरेटर अॅसेट-विशिष्ट टेक्सचर मॅपिंग सक्षम करते. या प्रत्येक जनरेटिव्ह एआय साधनाने 3D सर्जनशील प्रक्रियेच्या एका भागात सुधारणा केली आहे.

एकत्रितपणे, ही साधने निर्मात्याच्या कौशल्यांना वाढवतात आणि संकल्पनेपासून पूर्णत्वापर्यंतचा वेळ कमी करतात. आम्ही ही आमच्या स्वतःच्या नाविन्यपूर्ण संशोधनातील प्रगतीचा तसेच मोठ्या AI परिसंस्थेतून सर्वोत्तम उपायांचा वापर करून तयार केली आहेत. ही 1D (स्क्रिप्ट्स), 2D (सुपरफिसेस) आणि 3D (स्पेसेस) मधील वैयक्तिक अॅसेट्सच्या निर्मितीला हाताळतात. आम्ही आमच्या स्वतःच्या Roblox Developers Conference सह विविध आंतरराष्ट्रीय संशोधन परिषदांमध्ये आमच्या 3D जिओमेट्री जनरेशन आणि एडिटिंग लॅबमधील काही निकालांची पूर्वावलोकने सादर करतो.

उद्योगात, 1D आणि 2D हे अत्याधुनिक तंत्रज्ञान आहेत, तर 3D हे जनरेटिव्ह AI च्या अगदी कडेला आहे. प्रत्येकच एक वाढतीच महत्त्वाची आव्हान आहे जी सातत्याने रोमांचक तांत्रिक प्रगतीला चालना देते. आपण 3D अवकाशात राहत असल्यामुळे, असे वाटू शकते की तेच जनरेटिव्ह AI चे अंतिम आव्हान आहे. तथापि, आपल्या समुदायाच्या गरजा लक्षात घेऊन, या कामासाठी आमची दृष्टी आणखी पुढे जाते.

आज आपण कुठे आहोत

आम्ही 4D जनरेटिव्ह एआयकडे काम करत आहोत, जिथे चौथा आयाम म्हणजे परस्परसंवाद. रॉब्लॉक्सच्या ऑनलाइन प्लॅटफॉर्मची ताकद म्हणजे परस्परसंवाद—माणसे, वस्तू आणि पर्यावरणांमधील. पारंपारिक ऑनलाइन व्हिडिओ गेम्सच्या विपरीत, रॉब्लॉक्सचे शक्तिशाली रनटाइम इंजिन परस्परसंवादावर लक्ष केंद्रित करणाऱ्या अद्वितीय प्रोग्रामिंग आणि सिम्युलेशन मॉडेलचा वापर करते. हे मॉडेल मेटाव्हर्सच्या संकल्पनेतून प्रेरित आहे, जिथे घटक पूर्वनिर्धारित आणि मर्यादित मार्गांनी नव्हे, तर जटिल, अनेक-ते-अनेक आणि सहज मार्गांनी एकमेकांना भेटतात. 

1D, 2D आणि 3D जनरेटिव्ह AI साधने वैयक्तिक अॅसेट्स तयार करतात. 4D जनरेटिव्ह AI सोबत आम्हाला ज्या आव्हानाचा सामना करावा लागतो ते म्हणजे त्या अॅसेट्सना अशा प्रकारे जिवंत करणे ज्यामुळे आमच्या प्लॅटफॉर्मसाठी योग्य असलेल्या अनियंत्रित संवादांना चालना मिळेल. याचा अर्थ असा की, उदाहरणार्थ, एक अवतार फक्त आकार आणि रंग नसून त्यात कंकाल, अॅनिमेशन, साधने पकडण्याची क्षमता आणि संतुलन राखण्याची क्षमता देखील असते. तो अवतार अशा कपड्यांचा वापर करू शकतो जे विशेषतः त्याच्यासाठी डिझाइन केलेले नसतात, आणि जे आपोआप परिपूर्ण बसतात व सर्व हालचालींचा मागोवा घेतात. आमचे नवीन Avatar AutoSetup साधन हे जनरेटिव्ह एआय कसे या प्रकारच्या निर्मितीचे स्वयंचलन करण्यात मदत करू शकते याचे एक प्रारंभिक उदाहरण आहे. आता विकासक ही प्रक्रिया तासां किंवा दिवसांऐवजी काही मिनिटांत पूर्ण करू शकतात.

एक स्पोर्ट्स कार ही फक्त एक आकर्षक आकार आणि पृष्ठभागावरील रंग नाही—तर ती इंजिन, हलणाऱ्या भागांचा संच आणि भौतिकशास्त्र रिग देखील आहे, जे तिला अचूकता आणि नियंत्रणासह आभासी रस्त्यांवर दमदार गतीने धावण्याची क्षमता देतात. प्रत्येक बाबतीत, वस्तूला 3D मधून भौतिकशास्त्राद्वारे त्याच्या सर्व भागांशी आणि अवतारद्वारे वापरकर्त्याशी संवाद साधण्यासाठी विस्तारित केले जाते.

या प्रत्येक समृद्ध परस्परसंवादी 4D घटकांना एका मोठ्या वातावरणात जोडता येते, जिथे जनरेटिव्ह एआय प्रत्येक घटकाची शैली समन्वयित करते आणि वस्तूंमध्ये तसेच वातावरणाबरोबर परस्परसंवादी समर्थन निर्माण करते. आता एक वापरकर्ता त्यांच्या अवतारद्वारे, नुकसान बदलणाऱ्या घटकांसह आणि उच्च गुणांसह रस्त्यावरील शर्यतीत गाडी चालवू शकतो, आणि एखाद्या ब्रँडेड फॅशन स्टोअरजवळ घसरून थांबू शकतो, जिथे ते त्यांच्या विजयाचा उत्सव साजरा करण्यासाठी नवीन कपडे खरेदी करतात.

आज अशा अनुभवांची निर्मिती करण्यासाठी स्क्रिप्ट स्रोत कोड, वर्कस्पेस आणि डेटा मॉडेलची रचना, 3D भूमिती, अ‍ॅनिमेशन आणि साहित्य यांचे सर्वकाही हाताने तयार करावे लागते. आमची विद्यमान जनरेटिव्ह AI साधने पाइपलाइनच्या प्रत्येक टप्प्यावर मदत करतात. आम्ही अशी एक प्रणाली तयार करत आहोत जी या सर्व घटकांना एकत्र जोडून त्यांची एकाच वेळी निर्मिती करेल. हे साध्य करण्यासाठी, आम्हाला आमच्या 4D जनरेटिव्ह AI प्रणालीचे मल्टीमोडल पद्धतीने प्रशिक्षण द्यावे लागेल, म्हणजेच विविध प्रकारच्या डेटावर एकत्रितपणे. हे काम प्रतिमा आणि मजकूरासाठी आधीच केले गेले आहे, जे Material Generator ला चालना देतात. परस्परसंवाद सक्षम करणे आणि भौतिकशास्त्रासाठी विशेष-उद्देशीय ऑप्टिमायझर्स जोडणे, हीच 4D क्षमतेच्या पुढील स्तरावर पोहोचण्याची आमची पद्धत आहे.

गेल्या वर्षभरातच, Roblox वर सामग्री कशी तयार केली जाते यामध्ये आपण प्रचंड बदल पाहिले आहेत. पुढे पाहता, आम्हाला असे भविष्य दिसते जिथे कोणीही, कुठेही, फक्त एक कमांड टाइप करून किंवा बोलून एखादी कल्पना जिवंत करू शकेल. तिथे पोहोचण्यासाठी, आपल्याला या प्रवासात येणाऱ्या काही आव्हानांवर उपाय शोधायला सुरुवात करावी लागेल.

आमच्यासमोर असलेल्या आव्हानांना

वरील प्रयोग लवकरच उपलब्ध होतील. पुढे, आपल्याला तीन स्पष्ट आव्हानांना सामोरे जावे लागेल: 

१. कार्यात्मक: या भविष्यातील जनरेटिव्ह एआय साधनाद्वारे तयार केलेल्या वस्तू कार्यात्मक असणे आवश्यक आहे. याचा अर्थ असा की, प्रणालीने ट्रक किंवा विमानाकडे पाहताना, ज्यामध्ये 3D आकार असतो, त्याला एक सीलबंद अपारदर्शक वस्तू म्हणून न पाहता त्याचा विचार करणे आवश्यक आहे. आणि निर्मात्याला हस्तक्षेप करावा लागल्याशिवाय, प्रणाली स्वयंचलितपणे ओळखू शकेल की, 'या भागांना सांधे (joints) असणे आवश्यक आहे', किंवा 'येथे मेश (mesh) उघडणे आवश्यक आहे'.

या प्रणालींना मानवी-स्तरीय एआय समस्या सोडावा लागतात—उदाहरणार्थ, चाकांचे योग्य स्थान शोधणे, आणि नंतर चाकांसाठी एक अक्ष (axle) जोडणे जेणेकरून ते जसे भौतिक जगात कार्य करतात तसेच कार्य करतील. आणि दरवाजा कुठे आहे ते शोधणे, नंतर एक उघडा भाग तयार करणे आणि शिकारे (hinges) जोडणे जेणेकरून दरवाजा उघडू आणि बंद होऊ शकेल.

२. परस्परसंवादी: या भविष्यातील जनरेटिव्ह एआयसह तयार केलेल्या वस्तूंना स्वतंत्रपणे कार्य करण्यास सक्षम असण्याबरोबरच पर्यावरणातील इतर वस्तूंशी परस्परसंवाद साधण्याचीही क्षमता असणे आवश्यक आहे. त्यामुळे आता प्रणालीने आपल्यासाठी उघडणारे दरवाजे आणि फिरणारी चाके असलेली कार तयार केली आहे, तिला कार ठेवलेल्या जगातील भौतिकशास्त्र समजून घ्यावे लागेल. वाहन त्या भूभागावर कसे चालते? जर ते एखाद्या खडकाला धडकले, तर खडकाच्या आकारावर आणि वाहनाच्या वेगावर आधारित ते कुठे आणि कसे वाकते?

या गुंतागुंतीच्या आव्हानासाठी तयार केलेली वस्तू आणि ती ज्या वातावरणाशी किंवा वस्तूंशी संवाद साधते त्या दोघांनीही एकमेकांच्या भौतिकशास्त्राला समजून घेणे आवश्यक आहे. सुदैवाने, या बाबतीत Roblox ला फायदा आहे, कारण हे प्लॅटफॉर्म फिजिक्स इंजिन म्हणून तयार केले गेले आहे, ज्याचा अर्थ असा की अनुभवांमधील सर्व वस्तू भौतिक असू शकतात. जेव्हा जनरेटिव्ह एआय 4D वस्तू तयार करते, तेव्हा त्यात सामग्री, द्रव्यमान आणि ताकद यांसारख्या भौतिक गुणधर्मांचा देखील समावेश केला जातो, ज्यामुळे ती जगातील इतर भौतिक-आधारित वस्तूंशी संवाद साधण्यासाठी तयार होते.

३. नियंत्रित करण्यायोग्य: आज आपण प्रॉम्प्ट्स वापरून जनरेटिव्ह एआयशी संवाद साधतो. हे एक अपूर्ण शास्त्र आहे, जे खजिन्याच्या शोधासारखे आहे. कोणीतरी ससा या प्रतिमेसाठी विचारले तर त्यांना विविध प्रकारचे निकाल मिळू शकतात: एक खरा ससा, एक चॉकलेट ईस्टर बन्नी, एक कार्टून ससा, सशाचे चित्र, किंवा कोट घातलेला सशाचा आलेख. म्हणून आम्ही प्रॉम्प्ट्स सुधारतो, फोटोरियालिस्टिक प्रतिमा किंवा "च्या शैलीत" प्रतिमा मागितो, जसे की आमच्या मनातली कल्पना अचूकपणे साकारण्यासाठी. आपण शोधत असलेल्या गोष्टीजवळ पोहोचण्यासाठी याला वेळ आणि वारंवार प्रयत्न लागतात.

वरील उदाहरणातील ट्रकसारख्या, इतर वस्तूंशी कार्य करणाऱ्या आणि परस्परसंवाद साधणाऱ्या 3D वस्तूसाठी ही प्रक्रिया वापरण्याचा विचार करा. या पातळीवर प्रॉम्प्ट इंजिनिअरिंग प्रचंड गुंतागुंतीचे होईल—अशी काहीतरी जी कोणीही सहज वापरू शकणार नाही. एखाद्या निर्मात्याच्या कल्पनेला जीवंत करण्यासाठी, आपल्याला संवाद साधण्याचा आणि सुधारणा करण्याचा एक जलद, सोपा मार्ग हवा आहे, ज्यात मूलत: एखाद्या AI सहाय्यकासोबत भागीदारी करणे आणि तो शोधमोहिमेसारखा कमी वाटणे आवश्यक आहे. 

ही एक उद्योग-व्यापी आव्हान आहे, आणि अनेक कंपन्या जनरेटिव्ह एआयमध्ये अधिक नियंत्रकता आणण्यासाठी काम करत आहेत. आम्ही ControlNet सारख्या साधनांसह येथे काही प्रगती केली आहे, जे फक्त टेक्स्ट प्रॉम्प्ट्सपलीकडे निर्मात्याला अतिरिक्त इनपुट अटी प्रदान करण्याची परवानगी देऊन नियंत्रण वाढवते. आम्ही सध्या इतर पद्धतींचा शोध घेत आहोत ज्या समाधानकारक वर्कफ्लोसाठी आशादायक ठरतात, जसे की महत्त्वाच्या टप्प्यांनंतर वापरकर्त्याच्या इनपुटची प्रतीक्षा करण्यासाठी एआयला थांबवणे. परंतु एक अखंड अनुभव साध्य करण्यासाठी अजून खूप लांबचा प्रवास करायचा आहे.

आत्तापर्यंत आम्ही पाहिलेल्या परिणामांबद्दल आम्ही उत्साहित आहोत आणि पुढे काय होणार आहे याबद्दल आणखीच उत्साहित आहोत. मटेरियल जनरेटरसाठी बीटा वापरत नसलेल्या निर्मात्यांच्या तुलनेत, बीटा वापरणाऱ्या निर्मात्यांनी फिजिक्स-आधारित रेंडरिंग (PBR) मटेरियल व्हेरिएशन्सचा वापर 100 टक्क्यांहून अधिक वाढवला आहे—मार्च 2023 मध्ये हजारहून थोडेसे वरून जून 2024 मध्ये दोन हजाराहून अधिक झाला आहे. 2 जून 2024 पर्यंत, क्रिएटर्सनी Code Assist द्वारे सुचवलेले सुमारे 535 दशलक्ष कोड वर्ण स्वीकारले आहेत. 

4D कडे जाणाऱ्या या मार्गावरील आव्हानांवर आम्ही उपाय शोधू लागल्यावर, आमचे निर्माते अधिक आणि जलद गतीने तयार करू शकतील. अधिक लोकांना निर्माते होण्याची संधी देत असताना Roblox वर अनुभवांची अधिक विविधता दिसेल अशीही आम्हाला अपेक्षा आहे. ते काय तयार करतात आणि ते कसे तयार करतात, हे आमच्या विद्यमान समुदायासोबतच या नव्या निर्मात्यांना सशक्त करण्यासाठी नवीन साधने आणि AI अल्गोरिदममध्ये कुठे गुंतवणूक करायची हे दाखवेल. 

4D जनरेटिव्ह एआयसह, Roblox ने अनुभव आणि मालमत्ता निर्मितीसाठी एक नवीन क्षेत्र उघडले आहे. आव्हाने नवीन असली तरी, आमची नवकल्पना करण्याची प्रक्रिया चांगलीच परिपक्व आहे. आम्ही आमच्या उत्कृष्ट अंतर्गत संशोधन आणि विकास संघ, विद्यापीठांशी सहकार्य, आणि आमच्या समुदायाच्या भागीदारीत प्रोटोटाइपवर जलद पुनरावृत्ती यांचा संगम करतो.