Üretken Yapay Zeka ile Roblox'ta Yaratıcılıkta Devrim

Bu yılın başlarında, Roblox'taki üretken yapay zeka (AI) vizyonumuzu ve her kullanıcının bir yaratıcı olmasını sağlayacak sezgisel yeni araçları paylaşmıştık. Bu araçlar sektör genelinde hızla gelişirken, kaydettiğimiz ilerlemeler, üretken AI yaratımını demokratikleştirmek için önümüzde uzanan yol ve üretken AI'nın Roblox'un geleceği için neden kritik bir unsur olduğunu düşündüğümüz konusunda bazı güncellemeler sunmak istedim.
Üretken AI ve büyük dil modellerindeki (LLM) gelişmeler, güvenliği korurken ve büyük hesaplama kaynaklarına ihtiyaç duymadan daha kolay ve hızlı içerik üretimi sağlayarak, sürükleyici deneyimlerin geleceğini ortaya çıkarmak için inanılmaz bir fırsat sunuyor. Ayrıca, çok modlu, yani görüntüler, kod, metin, 3D modeller ve ses gibi çok sayıda içerik türüyle eğitilen yapay zeka modellerindeki gelişmeler, yaratım araçlarında yeni ilerlemelerin önünü açıyor. Bu modeller, metin çıktısı oluşturabilen ve metni tamamlayan görseller üretebilen modeller gibi çok modlu çıktılar üretmeye de başlıyor. Bu AI atılımlarını, daha deneyimli içerik oluşturucular için verimliliği artırırken, daha fazla kişinin Roblox'ta harika fikirlerini hayata geçirmesini sağlamak için muazzam bir fırsat olarak görüyoruz. Bu yılki Roblox Geliştiriciler Konferansı'nda (RDC), Roblox Studio'ya ve ötesine üretken AI'yı getirecek ve Roblox'taki herkesin daha hızlı ölçeklenmesine, daha hızlı yinelemeler yapmasına ve daha iyi içerik oluşturmak için becerilerini geliştirmesine yardımcı olacak birkaç yeni araç duyurduk.
Roblox Assistant
Roblox, içerik oluşturuculara her zaman sürükleyici 3D deneyimler oluşturmak için ihtiyaç duydukları araçları, hizmetleri ve desteği sağlamıştır. Aynı zamanda, içerik oluşturucularımızın içerik oluşturmalarına yardımcı olmak için üçüncü taraf üretken ve konuşma tabanlı yapay zeka kullanmaya başladığını gördük. Yaratıcıların iş yükünü azaltmaya yardımcı olsalar da, bu hazır sürümler uçtan uca Roblox iş akışları için tasarlanmamış veya Roblox kodu, argo ve jargonuyla eğitilmemişti. Bu, yaratıcıların Roblox için içerik oluşturmak üzere bu sürümleri kullanmak için önemli ölçüde ek iş yüküyle karşı karşıya kaldıkları anlamına geliyor. Bu araçların değerini Roblox Studio'ya taşımak için çeşitli yöntemler üzerinde çalışıyoruz ve RDC'de Assistant'ın erken bir örneğini paylaştık.
Assistant, her seviyedeki yaratıcının içerik oluşturma sürecindeki sıradan ve tekrarlayan görevlere çok daha az zaman harcamasına ve hikaye, oyun ve deneyim tasarımı gibi yüksek değerli faaliyetlere daha fazla zaman ayırmasına olanak tanıyan konuşma tabanlı yapay zekamızdır. Roblox, eğitim için geniş bir kamuya açık 3D model setine erişimimiz, bir modeli platform API'lerimizle entegre etme yeteneğimiz ve büyüyen yenilikçi AI çözümleri paketimiz sayesinde, sürükleyici 3D dünyalar için bu konuşma tabanlı AI modelini oluşturmak için benzersiz bir konumdadır. Yaratıcılar, doğal dil metin komutlarını kullanarak sahneler oluşturabilir, 3D modelleri düzenleyebilir ve nesnelere etkileşimli davranışlar uygulayabilir. Assistant, yaratımın üç aşamasını destekleyecektir: öğrenme, kodlama ve oluşturma:
- Öğrenme: Yaratıcı, Roblox'ta geliştirme konusunda tamamen yeni olsun ya da deneyimli bir uzman olsun, Roblox Assistant doğal dil kullanarak çok çeşitli konulardaki soruları yanıtlamaya yardımcı olacaktır.
- Kodlama: Assistant, son zamanlarda sunduğumuz Code Assist aracını daha da genişletecek. Örneğin, geliştiriciler Assistant'tan kodlarını iyileştirmesini, kodun bir bölümünü açıklamasını veya düzgün çalışmayan kodlarda hata ayıklama ve düzeltme önerileri sunmasını isteyebilir.
- Oluşturma: Assistant, yaratıcıların yeni fikirlerin prototipini hızla oluşturmasına yardımcı olacak. Örneğin, yeni bir yaratıcı, "Bu yol boyunca birkaç sokak lambası ekle" veya "Farklı türde ağaçlardan oluşan bir orman yap. Şimdi birkaç çalı ve çiçek ekle" gibi bir komut yazarak tüm sahneleri oluşturabilir ve farklı versiyonları deneyebilir.
Assistant ile çalışma, işbirliğine dayalı, etkileşimli ve yinelemeli olacak; bu sayede içerik oluşturucular geri bildirimde bulunabilecek ve Assistant'ın doğru çözümü sunmasını sağlayabilecek. Bu, fikirlerinizi paylaşabileceğiniz ve doğru sonuca ulaşana kadar fikirlerinizi deneyebileceğiniz uzman bir içerik oluşturucuyu ortak olarak yanınızda bulundurmak gibi olacak.
Assistant'ı olabildiğince iyi bir ortak haline getirmek için RDC'de bir duyuru daha yaptık: Geliştiricileri, anonimleştirilmiş Luau komut dosyası verilerini paylaşmaya davet ettik. Bu komut dosyası verileri, Code Assist ve Assistant gibi AI araçlarımızın daha verimli kod önerilerinde bulunmasını ve oluşturmasını önemli ölçüde iyileştirerek, bunları kullanan Roblox geliştiricilerine fayda sağlayacaktır. Ayrıca, geliştiriciler Roblox dışında paylaşmayı tercih ederse, komut dosyası verileri, Luau kodunu daha iyi önermek üzere AI sohbet araçlarını eğitmek için üçüncü taraflara sunulan bir veri setine eklenecek ve bu sayede dünyanın her yerindeki Luau geliştiricilerine fayda sağlayacaktır.
Açıkça belirtmek gerekirse, kapsamlı kullanıcı araştırmaları ve önde gelen geliştiricilerle yapılan şeffaf görüşmeler sonucunda, bunu isteğe bağlı olacak şekilde tasarladık ve tüm katılımcıların programın içeriğini anladığından ve kabul ettiğinden emin olacağız. Roblox ile komut dosyası verilerini paylaşmayı seçenlere teşekkür etmek amacıyla, bu topluluk tarafından eğitilmiş model ile desteklenen daha güçlü Assistant ve Code Assist sürümlerine erişim izni vereceğiz. Katılmayı seçmeyenler, mevcut Assistant ve Code Assist sürümlerine erişmeye devam edecek.
Daha Kolay Avatar Oluşturma
Nihayetinde, günlük 65,5 milyon kullanıcımızın her birinin, kendilerini gerçekten temsil eden ve kim olduklarını ifade eden bir avatara sahip olmasını istiyoruz. Kısa süre önce, UGC Programı üyelerimizin hem avatar gövdeleri hem de bağımsız kafalar oluşturup satabilmelerini sağlayan bir özelliği kullanıma sunduk. Şu anda bu süreç, Studio veya UGC Programımıza erişim, oldukça yüksek düzeyde beceri ve yüz ifadeleri, vücut hareketleri, 3D rigging vb. özellikleri etkinleştirmek için birkaç gün süren çalışma gerektiriyor. Bu durum, avatarların oluşturulmasını zaman alıcı hale getiriyor ve bugüne kadar mevcut seçeneklerin sayısını sınırladı. Biz daha da ileri gitmek istiyoruz.
Roblox'taki herkesin kişiselleştirilmiş, ifade gücü yüksek bir avatara sahip olmasını sağlamak için, avatarların oluşturulmasını ve özelleştirilmesini çok kolay hale getirmemiz gerekiyor. RDC'de, 2024'te piyasaya süreceğimiz ve bir veya birkaç görüntüden kolayca özel avatar oluşturulmasını sağlayacak yeni bir araç duyurduk. Bu araçla, Studio veya UGC programımıza erişimi olan her içerik oluşturucu bir görüntü yükleyebilecek, kendisi için bir avatar oluşturulmasını sağlayabilecek ve ardından bunu istediği gibi değiştirebilecek. Uzun vadede, bunu Roblox'taki deneyimler içinde de doğrudan kullanılabilir hale getirmeyi planlıyoruz.
Bunu mümkün kılmak için, Roblox’un avatar şeması ve Roblox’a ait bir dizi 3D avatar modeli üzerinde AI modellerini eğitiyoruz. Bir yaklaşım, 2D görüntülerden stilize 3D avatarlar oluşturmaya yönelik araştırmalardan yararlanıyor. Ayrıca, sınırlı 3D eğitim verilerini 2D üretken tekniklerle zenginleştirmek için önceden eğitilmiş metinden görüntüye difüzyon modellerini kullanmayı ve eğitim için üretken karşıt ağ (GAN) tabanlı bir 3D üretim ağı kullanmayı da değerlendiriyoruz. Son olarak, ControlNet'i kullanarak önceden tanımlanmış pozları katmanlara ayırarak avatarların ortaya çıkan çoklu görünüm görüntülerini yönlendirmek için çalışıyoruz.
Bu süreç, avatar için bir 3D ağ üretir. Ardından, 3D avatar pozları üzerinde eğitilmiş 3D semantik segmentasyon araştırmalarından yararlanarak bu 3D ağı alıp uygun yüz özellikleri, kafes, rigging ve dokular ekleyecek şekilde ayarlıyoruz; kısacası, statik 3D ağı bir Roblox avatarına dönüştürüyoruz. Son olarak, bir ağ düzenleme aracı, kullanıcıların modeli hayal ettikleri versiyona daha çok benzemesi için değiştirip ayarlamasına olanak tanır. Ve tüm bunlar dakikalar içinde hızlı bir şekilde gerçekleşir; Roblox'a aktarılabilen ve bir deneyimde kullanılabilen yeni bir avatar oluşturulur.
Sesli İletişimin Denetlenmesi
Bizim için yapay zeka sadece yaratımla ilgili değil, aynı zamanda geniş ölçekte çeşitlilik içeren, güvenli ve medeni bir topluluk sağlamak için çok daha verimli bir sistemdir. Sesli sohbet ve Roblox Connect, avatarınızla arama yapma özelliği ve RDC'de duyurulan API'ler dahil olmak üzere yeni ses özelliklerini kullanıma sunmaya başladıkça, gerçek zamanlı olarak konuşulan dili denetlemek gibi yeni bir zorlukla karşı karşıya kalıyoruz. Bunun için mevcut endüstri standardı, Otomatik Konuşma Tanıma (ASR) olarak bilinen bir süreçtir. Bu süreç, temel olarak bir ses dosyasını alır, metne dönüştürmek için transkripsiyonunu yapar, ardından metni analiz ederek uygunsuz dil, anahtar kelimeler vb. arar.
Bu, daha küçük ölçekte kullanan şirketler için iyi sonuç veriyor, ancak sesli iletişimi denetlemek için aynı ASR sürecini kullanmayı denediğimizde, bizim ölçeğimizde bunun zor ve verimsiz olduğunu hemen fark ettik. Bu yaklaşım, konuşmacının ses seviyesi ve tonunda kodlanmış olan son derece değerli bilgilerin yanı sıra, konuşmanın daha geniş bağlamını da gözden kaçırıyor. Her gün farklı dillerde yazıya dökmemiz gereken milyonlarca dakikalık konuşma arasında, yalnızca çok küçük bir yüzde uygunsuz bir şey gibi gelebilir. Ve ölçeğimizi büyütmeye devam ettikçe, bu sistemin ayak uydurabilmesi için giderek daha fazla hesaplama gücü gerekecektir. Bu nedenle, canlı sesten doğrudan içeriğin etiketlenmesine ve politikalarımızı ihlal edip etmediğinin belirtilmesine giden bir süreç oluşturarak, bunu nasıl daha verimli bir şekilde yapabileceğimizi daha yakından inceledik.
Sonuç olarak, ASR kullanarak şirket içi ses veri kümelerimizi sınıflandırıp, bu sınıflandırılmış ses verilerini sistemi eğitmek için kullanarak şirket içi özel bir ses algılama sistemi kurmayı başardık. Daha spesifik olarak, bu yeni sistemi eğitmek için sesle başlıyor ve bir transkript oluşturuyoruz. Ardından, ses kaydını sınıflandırmak için transkripti Roblox metin filtre sistemimizden geçiriyoruz. Bu metin filtre sistemi, Roblox'a özgü argo, kısaltmalar ve jargon üzerinde yıllardır bu aynı filtre sistemini optimize ettiğimiz için, Roblox'ta politika ihlali niteliğindeki dili tespit etmede çok başarılıdır. Bu eğitim aşamalarının sonunda, politika ihlallerini ses kaydından gerçek zamanlı olarak doğrudan tespit edebilen bir modele sahip oluyoruz.
Bu sistem küfür gibi belirli anahtar kelimeleri tespit etme yeteneğine sahip olsa da, politika ihlalleri nadiren tek bir kelimeden ibarettir. Bir kelime, bir bağlamda sorunlu görünürken, farklı bir bağlamda gayet uygun olabilir. Esasen, bu tür ihlaller ne söylediğiniz, nasıl söylediğiniz ve ifadelerin yapıldığı bağlamı içerir.
Bağlamı daha iyi anlamak için, dizi özetlemede çok başarılı olan transformatör tabanlı bir mimarinin doğal gücünden yararlanıyoruz. Bu mimari, ses akışı gibi bir veri dizisini alıp sizin için özetleyebilir. Bu mimari, daha uzun bir ses dizisini korumamızı sağlar, böylece sadece kelimeleri değil, bağlamı ve tonlamaları da tespit edebiliriz. Tüm bu unsurlar bir araya geldiğinde, girişi ses ve çıkışı ise politikayı ihlal edip etmediğine dair bir sınıflandırma olan nihai bir sisteme sahip oluruz. Bu sistem, anahtar kelimeleri ve politikayı ihlal eden ifadeleri algılayabilir, aynı zamanda niyeti belirlemek için önemli olan tonu, duyguyu ve diğer bağlamları da algılayabilir. Politikayı ihlal eden konuşmaları doğrudan sesden algılayan bu yeni sistem, geleneksel ASR sisteminden önemli ölçüde daha verimlidir; bu da, insanların bir araya gelme biçimlerini yeniden tasarlamaya devam ederken ölçeklendirmeyi çok daha kolay hale getirecektir.
Ayrıca, sesli iletişim araçlarımızı kullanan kişileri bu tür dilin olası sonuçları konusunda uyarmak için yeni bir yönteme ihtiyacımız vardı. Elimizdeki bu yenilikçi algılama sistemi sayesinde, güvenli bir ortam sağlamak için çevrimiçi davranışları etkilemenin yollarını deniyoruz. Kullanıcıların bazen politikalarımızı kasıtsız olarak ihlal ettiğini biliyoruz ve ara sıra bir hatırlatmanın daha fazla ihlali önlemeye yardımcı olup olmayacağını anlamak istiyoruz. Bu konuda yardımcı olmak için, bildirimler yoluyla gerçek zamanlı kullanıcı geri bildirimi denemeleri yapıyoruz. Sistem, politikalarımızı ihlal eden bir şey söylediğinizi belirli sayıda tespit ederse, ekranınızda bir açılır bildirim göstererek dilinizin politikalarımızı ihlal ettiğini bildirir ve daha fazla bilgi için politikalarımıza yönlendirir.
Ancak ses akışı bildirimleri, moderasyon sisteminin sadece bir unsurudur. Genel moderasyon kararlarımızı şekillendirmek için platformdaki davranış kalıplarını ve Roblox'taki diğer kullanıcıların şikayetlerini de inceleriz. Bu sinyallerin toplamı, ses özelliklerine erişimin iptal edilmesi veya daha ciddi ihlallerde platformdan tamamen yasaklanma gibi daha ağır sonuçlara yol açabilir. Çok modlu AI modelleri, üretken AI ve LLM'lerdeki bu gelişmeler bir araya gelerek içerik oluşturucular için inanılmaz yeni araçlar ve yetenekler sunarken, topluluğumuzun güvenliğini ve medeni bir ortamını korumak çok önemlidir.
Yaratıcılara bu araçları sunmanın, daha az deneyimli yaratıcılar için giriş engelini azaltacağına ve daha deneyimli yaratıcıları bu sürecin daha sıkıcı görevlerinden kurtaracağına inanıyoruz. Bu, onların ince ayar ve fikir üretme gibi yaratıcı yönlere daha fazla zaman ayırmalarını sağlayacaktır. Tüm bunlarla amacımız, her yerdeki herkesin fikirlerini hayata geçirmesini sağlamak ve Roblox'ta bulunan avatar, öğe ve deneyimlerin çeşitliliğini büyük ölçüde artırmaktır. Ayrıca, yeni yaratımları korumaya yardımcı olacak bilgiler ve araçlar da paylaşıyoruz.
Şimdiden muhteşem olasılıklar hayal ediyoruz: Diyelim ki birisi bir fotoğraftan doğrudan bir avatar ikizi yaratabiliyor; o zaman avatarını özelleştirerek onu daha uzun yapabilir veya anime tarzında tasarlayabilir. Ya da Assistant'tan araba, bina ve manzara eklemesini, ışıklandırma veya rüzgar koşullarını ayarlamasını ya da araziyi değiştirmesini isteyerek bir deneyim oluşturabilir. Oradan itibaren, Assistant ile yazışarak işleri iyileştirmek için tekrarlar yapabilirler. Bu araçlar kullanıma sunulduğunda, insanların bunlarla yaratacakları şeylerin, hayal edebileceğimizin çok ötesine geçeceğini biliyoruz.




