షేర్ చేయండి

కంట్రోల్‌నెట్ మరియు స్టార్‌కోడర్: జెనరేటివ్ AI కోసం రోబ్లాక్స్ పరిశోధన పురోగతులు

రచయిత మోర్గాన్ మెక్‌గైర్, చీఫ్ సైంటిస్ట్, రోబ్లాక్స్

ప్రచురించబడింది 5 సెప్టెం, 2023

ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI)తో సహా అన్ని రంగాలలో, బాధ్యతాయుతమైన మరియు సమాజంతో కలిసి పనిచేసే పరిశోధనను కొనసాగించడానికి మేము తీవ్రంగా కట్టుబడి ఉన్నాము. పారదర్శకత, బాహ్య ధ్రువీకరణ, మరియు సహకారం, స్పాన్సర్‌షిప్ ద్వారా విద్యా సంస్థలకు మద్దతు ఇవ్వడం ద్వారా మేము దీనిని సాధిస్తాము. ఈ విధానం మా మూడు ప్రధాన రంగాలైన జెనరేటివ్ AI, డేటా సెంటర్ స్కేలింగ్, మరియు ఆన్‌లైన్ భద్రతలో గొప్ప పురోగతిని సాధించడాన్ని వేగవంతం చేయడానికి మాకు వీలు కల్పిస్తుంది. ఈ రోజు, మేము మా రెండు జెనరేటివ్ AI పరిశోధన ప్రాజెక్టుల నుండి అంతర్దృష్టులు మరియు ఫలితాలను పంచుకుంటున్నాము. కంట్రోల్‌నెట్ అనేది ఒక ఓపెన్-సోర్స్ న్యూరల్ నెట్‌వర్క్, ఇది మరింత కచ్చితమైన చిత్ర అవుట్‌పుట్‌ల కోసం చిత్ర జనరేషన్ మోడల్‌లకు షరతులతో కూడిన నియంత్రణను జోడిస్తుంది. స్టార్‌కోడర్ అనేది కోడ్ జనరేషన్ కోసం ఒక అత్యాధునిక ఓపెన్-సోర్స్ లార్జ్ లాంగ్వేజ్ మోడల్ (LLM).

ఈ రెండు ప్రాజెక్టులు విద్యా మరియు పరిశ్రమల సహకారాలు. ఈ రెండూ మా సృష్టికర్తలైన 3D కళాకారులు మరియు ప్రోగ్రామర్‌ల కోసం అత్యంత శక్తివంతమైన సాధనాలపై దృష్టి సారించాయి. అత్యంత ముఖ్యంగా, పరివర్తనాత్మక పరిశోధన ద్వారా దీర్ఘకాలిక దృక్పథంలో పెట్టుబడి పెట్టాలనే మా లక్ష్యానికి అనుగుణంగా, ఈ ప్రాజెక్టులు అనేక అనువర్తనాల కోసం ప్రాథమిక శాస్త్రీయ అవగాహన మరియు AI నియంత్రణలో పురోగతికి సంబంధించిన సూచనలను ప్రదర్శిస్తాయి. ఈ పని రాబ్లాక్స్ భవిష్యత్తుపై మరియు మొత్తం రంగంపై గణనీయమైన ప్రభావాన్ని చూపుతుందని మేము నమ్ముతున్నాము మరియు దీనిని బహిరంగంగా పంచుకోవడం మాకు గర్వంగా ఉంది.

కంట్రోల్‌నెట్

ఇటీవలి AI పురోగతులు — ప్రత్యేకంగా డీప్ న్యూరల్ నెట్‌వర్క్‌లను ఉపయోగించే డేటా-ఆధారిత మెషిన్ లెర్నింగ్ (ML) పద్ధతులు — సృజనాత్మక సాధనాలలో కొత్త పురోగతికి దారితీశాయి. ఈ పురోగతిలో భాగంగా, మా ఉచిత సాధనం అయిన Roblox స్టూడియోలో ప్రజలకు అందుబాటులో ఉన్న మా కోడ్ అసిస్ట్ మరియు మెటీరియల్ జనరేటర్ ఫీచర్లు ఉన్నాయి. ఆధునిక జెనరేటివ్ AI సిస్టమ్‌లు మోడల్స్ అని పిలువబడే డేటా నిర్మాణాలను కలిగి ఉంటాయి, ఇవి బిలియన్ల శిక్షణా కార్యకలాపాల ద్వారా మెరుగుపరచబడతాయి. నేటి అత్యంత శక్తివంతమైన మోడల్స్ మల్టీమోడల్, అంటే అవి టెక్స్ట్, చిత్రాలు మరియు ఆడియో వంటి విభిన్న మీడియా మిశ్రమంపై శిక్షణ పొందుతాయి. ఇది రంగు పాలెట్లు లేదా స్పెల్లింగ్ వంటి డేటా సెట్‌లోని నిర్దిష్ట అంశాలకు ఓవర్‌ఫిట్టింగ్ చేయకుండా, విభిన్న మీడియాలో ఉన్న సాధారణ అంతర్లీన అర్థాలను కనుగొనడానికి వీలు కల్పిస్తుంది.

ఈ కొత్త AI వ్యవస్థలకు గణనీయమైన వ్యక్తీకరణ శక్తి ఉంది, కానీ ఆ శక్తి ఎక్కువగా "ప్రోంప్ట్ ఇంజనీరింగ్" ద్వారా నిర్దేశించబడుతుంది. అంటే, మీరు ఆశించిన ఫలితాలు రానప్పుడు సెర్చ్ ఇంజన్ క్వెరీని మెరుగుపరచినట్లే, కేవలం ఇన్‌పుట్ టెక్స్ట్‌ను మార్చడం. ఇది ఒక నిర్దేశించబడని చాట్‌బాట్ వంటి కొత్త టెక్నాలజీతో ఆడుకోవడానికి ఆసక్తికరమైన మార్గంగా ఉండవచ్చు, కానీ కంటెంట్‌ను సృష్టించడానికి ఇది సమర్థవంతమైన లేదా ప్రభావవంతమైన మార్గం కాదు. దానికి బదులుగా సృష్టికర్తలకు, ఊహాగానాలపై ఆధారపడకుండా, చురుకైన నియంత్రణ ద్వారా సమర్థవంతంగా ఉపయోగించుకోగల శక్తివంతమైన సాధనాలు అవసరం.

ఈ సవాళ్లలో కొన్నింటిని పరిష్కరించే దిశగా కంట్రోల్‌నెట్ ప్రాజెక్ట్ ఒక అడుగు. ఇది ప్రాంప్ట్ ఇంజనీరింగ్‌పై ఆధారపడకుండా, స్టేబుల్ డిఫ్యూజన్ వంటి పెద్ద ప్రీ-ట్రైన్డ్ AI మోడళ్ల శక్తిని ఉపయోగించుకోవడానికి ఒక సమర్థవంతమైన మార్గాన్ని అందిస్తుంది. కేవలం టెక్స్ట్ ప్రాంప్ట్‌లకు మించి, కళాకారుడికి అదనపు ఇన్‌పుట్ పరిస్థితులను అందించడానికి అనుమతించడం ద్వారా కంట్రోల్‌నెట్ నియంత్రణను పెంచుతుంది. రాబ్లాక్స్ పరిశోధకుడు మరియు స్టాన్‌ఫోర్డ్ విశ్వవిద్యాలయ ప్రొఫెసర్ మనీష్ అగర్వాలా మరియు స్టాన్‌ఫోర్డ్ పరిశోధకుడు ఎల్విమ్ జాంగ్ మా ఉమ్మడి కంట్రోల్‌నెట్ ప్రాజెక్ట్ లక్ష్యాలను ఈ విధంగా రూపొందించారు:

జనరేటివ్ AI సాధనాల కోసం మెరుగైన యూజర్ ఇంటర్‌ఫేస్‌ను అభివృద్ధి చేయడం. అస్పష్టమైన ప్రాంప్ట్ మానిప్యులేషన్‌ను అధిగమించి, ఒక ఆలోచన లేదా సృజనాత్మక భావనను తెలియజేయడానికి మరింత సహజమైన మార్గాల చుట్టూ నిర్మించడం.
"ఒక చిత్రం లాగా" లేదా "ఒక చిత్ర శైలిలో..." అని చెప్పడం మాత్రమే కాకుండా, సృష్టికర్త మనసులో ఉన్న చిత్రాన్ని ఖచ్చితంగా రూపొందించడానికి వీలుగా మరింత కచ్చితమైన స్థాన నియంత్రణను అందించడం.
జెనరేటివ్ AI శిక్షణను మరింత కంప్యూట్-సమర్థవంతమైన ప్రక్రియగా మార్చడం, ఇది వేగంగా పనిచేస్తూ, తక్కువ మెమరీని మరియు తక్కువ విద్యుత్ శక్తిని వినియోగించాలి.
చిత్ర జనరేటివ్ AIని పునర్వినియోగించగల ఒక బిల్డింగ్ బ్లాక్‌గా విస్తరించండి. ఆ తర్వాత దానిని ప్రామాణిక చిత్ర ప్రాసెసింగ్ మరియు 3D రెండరింగ్ పైప్‌లైన్‌లతో ఏకీకృతం చేయవచ్చు.

స్పేషియల్ కంట్రోల్ కోసం సృష్టికర్తలకు అదనపు చిత్రాన్ని అందించడానికి అనుమతించడం ద్వారా, కంట్రోల్నెట్ తుదిగా రూపొందించబడిన చిత్రంపై ఎక్కువ నియంత్రణను అందిస్తుంది. ఉదాహరణకు, ఇప్పటికే ఉన్న టెక్స్ట్-టు-ఇమేజ్ జెనరేటర్‌పై "కొమ్ములు ఉన్న మగ జింక" అనే ప్రాంప్ట్ అనేక రకాల చిత్రాలను ఉత్పత్తి చేసింది, కింద చూపిన విధంగా:

గతంలోని AI పరిష్కారాలతో రూపొందించిన ఈ చిత్రాలు ఆకర్షణీయంగా ఉన్నాయి, కానీ దురదృష్టవశాత్తు ఇవి కేవలం యాదృచ్ఛిక ఫలితాలు—వాటిపై ఎలాంటి నియంత్రణ లేదు. టెక్స్ట్ ప్రాంప్ట్‌ను సవరించడం తప్ప, ఆ పాత చిత్రాలను రూపొందించే వ్యవస్థలలో అవుట్‌పుట్‌ను నిర్దేశించడానికి మరే మార్గం లేదు.

కంట్రోల్నెట్ తో, సృష్టికర్తకు ఇప్పుడు చాలా ఎక్కువ శక్తి ఉంది. కంట్రోల్నెట్ ను ఉపయోగించడానికి ఒక మార్గం, అనుసరించాల్సిన సాధారణ ఆకృతిని నిర్ధారించడానికి ఒక ప్రాంప్ట్ మరియు ఒక మూల చిత్రం రెండింటినీ అందించడం. ఈ సందర్భంలో, ఫలితంగా వచ్చే చిత్రాలు ఇప్పటికీ వైవిధ్యాన్ని అందిస్తాయి, కానీ, ముఖ్యంగా, నిర్దేశించిన ఆకృతిని నిలుపుకుంటాయి:

సృష్టికర్త ఎడ్జ్‌ల సమితిని, ఎలాంటి ప్రాంప్ట్ లేని చిత్రాన్ని, లేదా సిస్టమ్‌కు భావవ్యక్తీకరణతో కూడిన ఇన్‌పుట్‌ను అందించడానికి అనేక ఇతర మార్గాలను కూడా నిర్దేశించి ఉండవచ్చు.

కంట్రోల్ నెట్‌ను సృష్టించడానికి, మేము ఒక పెద్ద డిఫ్యూజన్ మోడల్ యొక్క నెట్‌వర్క్‌లోని వెయిట్‌లను రెండు వెర్షన్‌లుగా క్లోన్ చేస్తాము. ఒకటి ట్రైనేబుల్ నెట్‌వర్క్ (ఇది నియంత్రణను అందిస్తుంది; ఇది "కంట్రోల్ నెట్") మరియు రెండవది లాక్డ్ నెట్‌వర్క్. లాక్డ్ నెట్‌వర్క్ బిలియన్ల చిత్రాల నుండి నేర్చుకున్న సామర్థ్యాన్ని కాపాడుతుంది మరియు ఇది ఏదైనా మునుపటి ఇమేజ్ జెనరేటర్ కావచ్చు. ఆ తర్వాత మేము అదనపు చిత్రం నుండి కండిషనల్ కంట్రోల్‌ను నేర్చుకోవడానికి, టాస్క్-నిర్దిష్ట డేటా సెట్‌లపై ట్రైనేబుల్ నెట్‌వర్క్‌ను శిక్షణ ఇస్తాము. ట్రైనేబుల్ మరియు లాక్డ్ కాపీలు జీరో కన్వాల్యూషన్ అని మేము పిలిచే ఒక ప్రత్యేకమైన కన్వాల్యూషన్ లేయర్‌తో అనుసంధానించబడి ఉంటాయి, ఇక్కడ కన్వాల్యూషన్ వెయిట్స్ నేర్చుకున్న పద్ధతిలో సున్నా నుండి ఆప్టిమైజ్ చేయబడిన పారామితుల వరకు క్రమంగా పెరుగుతాయి, అంటే అవి ప్రారంభంలో ఎటువంటి ప్రభావాన్ని చూపవు మరియు సిస్టమ్ లాక్డ్ నెట్‌వర్క్‌పై వినియోగించాల్సిన నియంత్రణ యొక్క సరైన స్థాయిని పొందుతుంది.

లాక్ చేయబడిన నెట్‌వర్క్ ద్వారా అసలు వెయిట్‌లు భద్రపరచబడినందున, ఈ మోడల్ వివిధ పరిమాణాల ట్రైనింగ్ డేటా సెట్‌లతో బాగా పనిచేస్తుంది. మరియు జీరో కన్వల్షన్ లేయర్ ఈ ప్రక్రియను చాలా వేగంగా చేస్తుంది — ఇది మొదటి నుండి కొత్త లేయర్‌లను శిక్షణ ఇవ్వడం కంటే డిఫ్యూజన్ మోడల్‌ను ఫైన్-ట్యూనింగ్ చేయడానికి దగ్గరగా ఉంటుంది.

చిత్ర రూపకల్పన కోసం ఈ పద్ధతిని మేము విస్తృతంగా ధృవీకరించాము. కంట్రోల్నెట్ అవుట్‌పుట్ చిత్ర నాణ్యతను మెరుగుపరచడమే కాకుండా, ఒక నిర్దిష్ట పని కోసం నెట్‌వర్క్‌ను శిక్షణ చేయడాన్ని కూడా మరింత సమర్థవంతంగా చేస్తుంది, తద్వారా మా లక్షలాది మంది సృష్టికర్తల కోసం పెద్ద ఎత్తున అమలు చేయడానికి ఆచరణాత్మకంగా ఉంటుంది. ప్రయోగాలలో, మోడల్‌ను పూర్తిగా పునఃశిక్షణ చేయవలసిన ప్రత్యామ్నాయ దృశ్యాలతో పోలిస్తే కంట్రోల్నెట్ 10 రెట్లు వరకు సామర్థ్య లాభాన్ని అందిస్తుంది. సాంప్రదాయ సాఫ్ట్‌వేర్ అభివృద్ధితో పోలిస్తే కొత్త మోడల్‌లను రూపొందించే ప్రక్రియ ఎక్కువ సమయం తీసుకునేది మరియు ఎక్కువ వనరులు అవసరమయ్యేది కాబట్టి ఈ సామర్థ్యం చాలా కీలకం. శిక్షణను మరింత సమర్థవంతం చేయడం విద్యుత్తును ఆదా చేస్తుంది, ఖర్చులను తగ్గిస్తుంది మరియు కొత్త కార్యాచరణను జోడించే వేగాన్ని పెంచుతుంది.

కంట్రోల్నెట్ యొక్క ప్రత్యేక నిర్మాణం కారణంగా ఇది వివిధ పరిమాణాలలో ఉన్న శిక్షణా డేటా సెట్‌లతో మరియు అనేక రకాల మీడియాతో బాగా పనిచేస్తుంది. ఫోటోలు, చేతితో గీసిన గీతలు, మరియు ఓపెన్‌పోజ్ పోజ్ డిటెక్షన్‌తో సహా అనేక రకాల నియంత్రణ పద్ధతులతో కంట్రోల్నెట్ పనిచేయడం చూపబడింది. జెనరేటివ్ AI కంటెంట్ కోసం వివిధ రకాల మీడియాకు కంట్రోల్‌నెట్‌ను వర్తింపజేయవచ్చని మేము నమ్ముతున్నాము. ఈ పరిశోధన కమ్యూనిటీ ప్రయోగాలు చేయడానికి మరియు దీనిని మరింత అభివృద్ధి చేయడానికి బహిరంగంగా అందుబాటులో ఉంది, మరియు దీనితో మేము మరిన్ని ఆవిష్కరణలు చేసినప్పుడు మరింత సమాచారాన్ని అందిస్తూనే ఉంటాము.

స్టార్‌కోడర్

జెనరేటివ్ AIని చిత్రాలు, ఆడియో, టెక్స్ట్, ప్రోగ్రామ్ సోర్స్ కోడ్ లేదా ఏదైనా ఇతర రకమైన రిచ్ మీడియాను ఉత్పత్తి చేయడానికి ఉపయోగించవచ్చు. అయితే, వివిధ మీడియాల్లో, అత్యంత విజయవంతమైన అనువర్తనాలు సాధారణంగా అవుట్‌పుట్‌ను వ్యక్తిగతంగా అంచనా వేసేవిగా ఉంటాయి. ఉదాహరణకు, ఒక చిత్రం మానవ వీక్షకుడిని ఆకట్టుకున్నప్పుడు అది విజయవంతమైనట్లుగా పరిగణించబడుతుంది. ఒకవేళ మొత్తం చిత్రం ఆకట్టుకుంటే, అందులో అంచుల వద్ద వింత లక్షణాలు లేదా చేతికి అదనపు వేలు వంటి కొన్ని లోపాలను ఎవరూ గమనించకపోవచ్చు. అదేవిధంగా, ఒక కవిత లేదా చిన్న కథలో వ్యాకరణ దోషాలు లేదా కొన్ని తార్కిక పొరపాట్లు ఉండవచ్చు, కానీ దాని సారాంశం ఆకట్టుకుంటే, మనం వాటిని క్షమించేస్తాము.

వ్యక్తిగత ప్రమాణాలను పరిగణనలోకి తీసుకోవడానికి మరొక మార్గం ఏమిటంటే, ఫలితాల పరిధి నిరంతరంగా ఉంటుంది. ఒక ఫలితం మరొకదానికంటే మెరుగ్గా ఉండవచ్చు, కానీ ఫలితం పూర్తిగా ఆమోదయోగ్యం లేదా ఆమోదయోగ్యం కాని ఒక నిర్దిష్ట పరిమితి ఏదీ ఉండదు. ఇతర రంగాలు మరియు మీడియా రూపాలలో, అవుట్‌పుట్‌ను నిష్పక్షపాతంగా నిర్ధారిస్తారు. ఉదాహరణకు, ఒక జెనరేటివ్ AI ప్రోగ్రామింగ్ అసిస్టెంట్ ఉత్పత్తి చేసిన సోర్స్ కోడ్ సరైనది లేదా కాదు. ఆ కోడ్ ఒక పరీక్షలో ఉత్తీర్ణత సాధించలేకపోతే, అది విఫలమవుతుంది, అది ఒక చెల్లుబాటు అయ్యే పరిష్కారం కోసం అవసరమైన కోడ్‌లా ఉన్నప్పటికీ. ఇది ఒక డిస్క్రీట్ రిజల్ట్ స్పేస్. డిస్క్రీట్ స్పేస్‌లో విజయం సాధించడం కష్టం, ఎందుకంటే ప్రమాణాలు కఠినంగా ఉండటమే కాకుండా, ఒక మంచి పరిష్కారాన్ని క్రమంగా చేరువ కావడానికి వీలు లేదు—కోడ్ పనిచేయడం మొదలుపెట్టే వరకు అది పూర్తిగా విఫలమవుతూ ఉంటుంది.

చాట్‌బాట్‌ల వంటి వ్యక్తిగత, నిరంతర అప్లికేషన్‌ల కోసం టెక్స్ట్ అవుట్‌పుట్‌కు ఉపయోగించే LLMs బాగా పనిచేస్తాయి. ఇవి ఇంగ్లీష్ మరియు ఫ్రెంచ్ వంటి అనేక మానవ భాషలలో గద్య రచనకు కూడా బాగా పనిచేస్తున్నట్లు కనిపిస్తాయి. అయితే, మానవ భాషలకు పనిచేసినంత బాగా ప్రస్తుత LLMs ప్రోగ్రామింగ్ భాషలకు పనిచేయడం లేదని అనిపిస్తుంది. కోడ్ అనేది గణితశాస్త్ర రూపం, ఇది సహజ భాష కంటే అర్థాన్ని వ్యక్తీకరించడానికి చాలా భిన్నమైన, నిష్పక్షపాతమైన మార్గం. ఇది నిరంతర ఫలితాల ప్రదేశం కాకుండా విభజిత ఫలితాల ప్రదేశం. రాబ్లాక్స్ సృష్టికర్తల కోసం అత్యధిక నాణ్యత గల ప్రోగ్రామింగ్ భాషా కోడ్ జనరేషన్‌ను సాధించడానికి, ఈ విభిన్నమైన, నిష్పక్షపాతమైన ప్రదేశంలో బాగా పనిచేసే LLMలను వర్తింపజేసే పద్ధతులు మనకు అవసరం. లూవా, జావాస్క్రిప్ట్, లేదా పైథాన్ వంటి నిర్దిష్ట భాషా సింటాక్స్‌తో సంబంధం లేకుండా కోడ్ కార్యాచరణను వ్యక్తీకరించడానికి కూడా మనకు దృఢమైన పద్ధతులు అవసరం.

కోడ్ జనరేషన్ కోసం ఒక కొత్త అత్యాధునిక ఓపెన్-సోర్స్ LLM అయిన స్టార్‌కోడర్, ఈ సాంకేతిక సవాలుకు ఒక ప్రధాన పురోగతి మరియు ప్రతిఒక్కరికీ నిజంగా ఓపెన్ LLM. స్టార్‌కోడర్ అనేది బిగ్‌కోడ్ పరిశోధన కన్సార్టియం యొక్క ఒక ఫలితం, ఇందులో విద్యా మరియు పరిశ్రమ పరిశోధన ప్రయోగశాలల నుండి 600 కంటే ఎక్కువ మంది సభ్యులు ఉన్నారు. రాబ్లాక్స్ పరిశోధకుడు మరియు నార్త్ఈస్టర్న్ యూనివర్శిటీ ప్రొఫెసర్ అర్జున్ గుహా స్టార్‌కోడర్‌ను అభివృద్ధి చేయడానికి ఈ బృందానికి నాయకత్వం వహించడంలో సహాయపడ్డారు. ఈ మొదటి ప్రచురించబడిన ఫలితాలు ప్రత్యేకంగా కోడ్ అంశంపై దృష్టి పెడతాయి, సాపేక్షంగా విజయవంతమైన సబ్జెక్టివ్ పద్ధతులను పరిగణనలోకి తీసుకుంటే, ఈ రంగానికి కొత్త వృద్ధి అత్యంత అవసరమైన ప్రాంతం ఇదే.

విస్తృత AI పర్యావరణ వ్యవస్థకు మరియు Roblox కమ్యూనిటీకి మద్దతు ఇచ్చే LLMల ద్వారా జెనరేటివ్ AIని అందించడానికి, సముచితంగా లైసెన్స్ పొందిన మరియు బాధ్యతాయుతంగా సేకరించిన డేటా సెట్‌లపై ప్రత్యేకంగా శిక్షణ పొందిన మోడల్‌లు మనకు అవసరం. ఇవి ఎటువంటి ఆంక్షలు లేని లైసెన్స్‌లను కలిగి ఉండాలి, తద్వారా ఎవరైనా వాటిని ఉపయోగించగలరు, వాటిపై నిర్మించగలరు మరియు పర్యావరణ వ్యవస్థకు తిరిగి సహకరించగలరు. నేడు, అత్యంత శక్తివంతమైన LLMలు యాజమాన్య హక్కుతో ఉన్నాయి లేదా వాణిజ్య వినియోగంలో పరిమిత రూపాల కోసం లైసెన్స్ పొందాయి, ఇది పరిశోధకులు మోడల్‌తో ప్రయోగాలు చేయగల సామర్థ్యాన్ని నిరోధిస్తుంది లేదా పరిమితం చేస్తుంది. దీనికి విరుద్ధంగా, స్టార్‌కోడర్ అనేది నిజమైన ఓపెన్ మోడల్, ఇది పరిశ్రమ మరియు విద్యా పరిశోధకుల సంఘం ద్వారా సృష్టించబడింది మరియు ఏ పరిమాణంలోనైనా వాణిజ్య అనువర్తనం కోసం ఎటువంటి పరిమితి లేకుండా లైసెన్స్ పొందింది. స్టార్‌కోడర్ బాధ్యతాయుతంగా సేకరించిన, తగిన లైసెన్స్ ఉన్న కంటెంట్‌పై ప్రత్యేకంగా శిక్షణ పొందింది. ఈ మోడల్ ప్రారంభంలో పబ్లిక్ కోడ్‌పై శిక్షణ పొందింది మరియు శిక్షణ కోసం తమ కోడ్‌ను ఉపయోగించకూడదని ఇష్టపడే వారి కోసం ఒక ఆప్ట్-అవుట్ ప్రక్రియ అందుబాటులో ఉంది.

ఈ రోజు, స్టార్‌కోడర్ పైథాన్, C++, మరియు జావాతో సహా 86 విభిన్న ప్రోగ్రామింగ్ భాషలపై పనిచేస్తుంది. ఈ పత్రం ప్రచురించబడిన సమయానికి, ఇది బహుళ భాషలకు మద్దతు ఇచ్చే ప్రతి ఓపెన్ కోడ్ LLMను అధిగమించింది మరియు అనేక క్లోజ్డ్, ప్రొప్రైటరీ మోడల్‌లతో కూడా పోటీపడింది.

స్టార్‌కోడర్ LLM ఈ పర్యావరణ వ్యవస్థకు ఒక సహకారం, కానీ మా పరిశోధన లక్ష్యం చాలా లోతైనది. ఈ పరిశోధన యొక్క గొప్ప ప్రభావం ఏమిటంటే, కోడ్, టెక్స్ట్, చిత్రాలు, మాటలు, వీడియో వంటి వాటితో కూడిన వస్తునిష్ఠ మరియు విషయనిష్ఠ బహుళమాధ్యమ నమూనాల సెమాంటిక్ మోడలింగ్‌ను ముందుకు తీసుకెళ్లడం, మరియు డొమైన్-ట్రాన్స్‌ఫర్ పద్ధతుల ద్వారా శిక్షణ సామర్థ్యాన్ని పెంచడం. సోర్స్ కోడ్ జనరేషన్ వంటి వస్తునిష్ఠ పనుల కోసం జెనరేటివ్ AI యొక్క నిర్వహణ సామర్థ్యం మరియు నియంత్రణ సామర్థ్యంపై లోతైన అంతర్దృష్టులను కూడా మేము పొందాలని ఆశిస్తున్నాము. ఉద్భవిస్తున్న సాంకేతికత యొక్క ఆసక్తికరమైన ప్రదర్శనకు, మరియు దాని వినియోగదారుల సమాజానికి విలువను అందించే సురక్షితమైన, నమ్మకమైన, మరియు సమర్థవంతమైన ఉత్పత్తికి మధ్య పెద్ద తేడా ఉంది. మా ML మోడళ్ల కోసం, మేము మెమరీ ఫుట్‌ప్రింట్, విద్యుత్ పరిరక్షణ, మరియు ఎగ్జిక్యూషన్ సమయం కోసం పనితీరును ఆప్టిమైజ్ చేస్తాము. మేము ఒక పటిష్టమైన మౌలిక సదుపాయాన్ని కూడా అభివృద్ధి చేశాము, AI కోర్‌ను సిస్టమ్‌లోని మిగిలిన భాగాలకు కలపడానికి సాఫ్ట్‌వేర్‌తో చుట్టూ ఏర్పాటు చేశాము, మరియు కొత్త ఫీచర్లు జోడించబడినప్పుడు తరచుగా అప్‌డేట్‌ల కోసం ఒక అంతరాయం లేని వ్యవస్థను అభివృద్ధి చేశాము.

విప్లవాత్మక సాంకేతికతను సాధించాలనే మా ప్రయత్నంలో, రాబ్లాక్స్ శాస్త్రవేత్తలను మరియు ఇంజనీర్లను శాస్త్రీయ సమాజంలోని అత్యంత మేధావులతో కలపడం ఒక కీలకమైన భాగం. ఈ ప్రారంభ ఫలితాలను పంచుకోవడం మాకు గర్వంగా ఉంది మరియు పరిశోధన సమాజం మాతో కలిసి పనిచేయడానికి మరియు ఈ పురోగతులపై మరింతగా నిర్మించుకోవడానికి ఆహ్వానిస్తున్నాము.

తాజా

మరిన్ని ఫలితాలు

కంట్రోల్‌నెట్ మరియు స్టార్‌కోడర్: జెనరేటివ్ AI కోసం రోబ్లాక్స్ పరిశోధన పురోగతులు

కంట్రోల్‌నెట్

స్టార్‌కోడర్

కంట్రోల్‌నెట్ మరియు స్టార్‌కోడర్: జెనరేటివ్ AI కోసం రోబ్లాక్స్ పరిశోధన పురోగతులు

కంట్రోల్‌నెట్

స్టార్‌కోడర్

ఇంజనీరింగ్

రాబ్లాక్స్‌లో ఇన్-గేమ్ రిపోర్టింగ్ ఎలా పనిచేస్తుంది

ఇంజనీరింగ్

22 కొత్త భాషలు మరియు మరింత పదునైన గుర్తింపు సామర్థ్యాలతో మా వాయిస్ సేఫ్టీ క్లాసిఫైయర్‌ను అప్‌గ్రేడ్ చేయడం

వార్తలు

రాబ్లాక్స్ రియాలిటీ విజన్‌ను వేగవంతం చేయడానికి మార్గదర్శక AI వ్యవస్థాపకులు చేరారు