Merevolusi Pembuatan Konten di Roblox dengan AI Generatif

Awal tahun ini, kami membagikan visi kami tentang kecerdasan buatan generatif (AI) di Roblox dan alat-alat baru yang intuitif yang akan memungkinkan setiap pengguna menjadi seorang kreator. Seiring dengan perkembangan pesat alat-alat ini di seluruh industri, saya ingin memberikan beberapa pembaruan mengenai kemajuan yang telah kami capai, jalan yang masih harus ditempuh untuk mendemokratisasi penciptaan AI generatif, dan mengapa kami berpendapat bahwa AI generatif merupakan elemen penting bagi arah masa depan Roblox.
Kemajuan dalam AI generatif dan model bahasa besar (LLM) menghadirkan peluang luar biasa untuk membuka masa depan pengalaman imersif dengan memungkinkan pembuatan yang lebih mudah dan lebih cepat sambil tetap menjaga keamanan dan tanpa memerlukan sumber daya komputasi yang besar. Selain itu, kemajuan dalam model AI yang multimodal—artinya dilatih dengan berbagai jenis konten seperti gambar, kode, teks, model 3D, dan audio—membuka pintu bagi inovasi baru dalam alat kreasi. Model-model ini mulai menghasilkan output multimodal, misalnya model yang dapat menghasilkan teks sekaligus visual yang melengkapi teks tersebut. Kami melihat terobosan AI ini sebagai peluang besar untuk secara bersamaan meningkatkan efisiensi bagi kreator yang lebih berpengalaman dan memungkinkan lebih banyak orang mewujudkan ide-ide hebat di Roblox. Pada Roblox Developers Conference (RDC) tahun ini, kami mengumumkan beberapa alat baru yang akan membawa AI generatif ke dalam Roblox Studio dan melampauinya untuk membantu siapa pun di Roblox berkembang lebih cepat, beriterasi lebih cepat, dan meningkatkan keterampilan mereka untuk membuat konten yang lebih baik.
Roblox Assistant
Roblox selalu menyediakan alat, layanan, dan dukungan yang dibutuhkan kreator untuk membangun pengalaman 3D yang imersif. Pada saat yang sama, kami melihat para kreator mulai menggunakan AI generatif dan percakapan pihak ketiga untuk membantu mereka berkarya. Meskipun berguna untuk mengurangi beban kerja kreator, versi siap pakai ini tidak dirancang untuk alur kerja Roblox end-to-end atau dilatih menggunakan kode, slang, dan istilah khas Roblox. Artinya, kreator harus menghadapi pekerjaan tambahan yang signifikan untuk menggunakan versi ini dalam membuat konten untuk Roblox. Kami telah bekerja untuk membawa nilai alat-alat ini ke dalam Roblox Studio, dan di RDC kami membagikan contoh awal dari Assistant.
Assistant adalah AI percakapan kami yang memungkinkan kreator dari semua tingkat keahlian menghabiskan waktu jauh lebih sedikit untuk tugas-tugas rutin dan berulang dalam proses pembuatan, serta lebih banyak waktu untuk aktivitas bernilai tinggi, seperti narasi, gameplay, dan desain pengalaman. Roblox memiliki posisi unik untuk mengembangkan model AI percakapan ini untuk dunia 3D imersif, berkat akses kami ke kumpulan besar model 3D publik untuk pelatihan, kemampuan kami mengintegrasikan model dengan API platform kami, serta rangkaian solusi AI inovatif yang terus berkembang. Para kreator akan dapat menggunakan perintah teks bahasa alami untuk membuat adegan, mengedit model 3D, dan menerapkan perilaku interaktif pada objek. Assistant akan mendukung tiga fase pembuatan: pembelajaran, pengkodean, dan pembangunan:
- Belajar: Baik pembuat konten yang baru pertama kali mengembangkan di Roblox maupun yang sudah berpengalaman, Roblox Assistant akan membantu menjawab pertanyaan di berbagai bidang menggunakan bahasa alami.
- Pemrograman: Assistant akan memperluas fitur Code Assist kami yang baru-baru ini diluncurkan. Misalnya, pengembang dapat meminta Assistant untuk memperbaiki kode mereka, menjelaskan bagian kode tertentu, atau membantu mendebug dan menyarankan perbaikan untuk kode yang tidak berfungsi dengan baik.
- Pembuatan: Asisten akan membantu kreator membuat prototipe ide baru dengan cepat. Misalnya, seorang kreator baru dapat menghasilkan adegan lengkap dan mencoba berbagai versi hanya dengan mengetikkan perintah seperti “Tambahkan beberapa lampu jalan di sepanjang jalan ini” atau “Buat hutan dengan berbagai jenis pohon. Sekarang tambahkan semak dan bunga.”
Bekerja dengan Assistant akan bersifat kolaboratif, interaktif, dan berulang, sehingga memungkinkan para kreator untuk memberikan umpan balik dan meminta Assistant bekerja untuk memberikan solusi yang tepat. Ini akan seperti memiliki seorang kreator ahli sebagai mitra yang dapat Anda ajak bertukar ide dan mencoba berbagai ide hingga Anda mendapatkan hasil yang tepat.
Untuk menjadikan Assistant sebagai mitra terbaik, kami membuat pengumuman lain di RDC: Kami mengundang pengembang untuk berpartisipasi dalam menyumbangkan data skrip Luau mereka yang telah dianonimkan. Data skrip ini akan membantu meningkatkan kemampuan alat AI kami, seperti Code Assist dan Assistant, dalam menyarankan dan membuat kode yang lebih efisien, sehingga memberikan manfaat bagi pengembang Roblox yang menggunakannya. Selain itu, jika pengembang memilih untuk berbagi data di luar Roblox, data skrip mereka akan ditambahkan ke kumpulan data yang tersedia bagi pihak ketiga untuk melatih alat obrolan AI mereka agar lebih baik dalam menyarankan kode Luau, memberikan manfaat bagi pengembang Luau di mana pun.
Untuk jelas, melalui riset pengguna yang komprehensif dan percakapan transparan dengan pengembang terkemuka, kami merancang ini sebagai program sukarela dan akan memastikan semua peserta memahami dan menyetujui apa yang termasuk dalam program ini. Sebagai ucapan terima kasih kepada mereka yang memilih untuk berpartisipasi dalam berbagi data skrip dengan Roblox, kami akan memberikan akses ke versi Assistant dan Code Assist yang lebih canggih yang didukung oleh model yang dilatih oleh komunitas ini. Mereka yang tidak ikut serta akan tetap memiliki akses ke versi Assistant dan Code Assist kami yang sudah ada.
Pembuatan Avatar yang Lebih Mudah
Pada akhirnya, kami ingin setiap dari 65,5 juta pengguna harian kami memiliki avatar yang benar-benar mewakili diri mereka dan mengekspresikan jati diri mereka. Kami baru-baru ini meluncurkan kemampuan bagi anggota Program UGC kami untuk membuat dan menjual baik tubuh avatar maupun kepala mandiri. Saat ini, proses tersebut memerlukan akses ke Studio atau Program UGC kami, tingkat keterampilan yang cukup tinggi, dan beberapa hari kerja untuk mengaktifkan ekspresi wajah, gerakan tubuh, rigging 3D, dan sebagainya. Hal ini membuat pembuatan avatar memakan waktu dan hingga saat ini membatasi jumlah opsi yang tersedia. Kami ingin melangkah lebih jauh.
Agar semua orang di Roblox dapat memiliki avatar yang dipersonalisasi dan ekspresif, kami perlu membuat avatar sangat mudah dibuat dan disesuaikan. Di RDC, kami mengumumkan alat baru yang akan dirilis pada 2024, yang memungkinkan pembuatan avatar kustom dengan mudah dari satu gambar atau beberapa gambar. Dengan alat ini, setiap kreator yang memiliki akses ke Studio atau program UGC kami dapat mengunggah gambar, mendapatkan avatar yang dibuat untuk mereka, dan kemudian memodifikasinya sesuai keinginan. Jangka panjang, kami berencana untuk juga membuat ini tersedia langsung di dalam pengalaman di Roblox.
Untuk mewujudkan hal ini, kami melatih model AI menggunakan skema avatar Roblox dan kumpulan model avatar 3D milik Roblox. Salah satu pendekatan memanfaatkan penelitian untuk menghasilkan avatar 3D bergaya dari gambar 2D. Kami juga mempertimbangkan penggunaan model difusi teks-ke-gambar yang telah dilatih sebelumnya untuk melengkapi data pelatihan 3D yang terbatas dengan teknik generatif 2D, serta menggunakan jaringan generasi 3D berbasis Jaringan Adversarial Generatif (GAN) untuk pelatihan. Terakhir, kami sedang mengerjakan penggunaan ControlNet untuk menambahkan pose yang telah ditentukan sebelumnya guna mengarahkan gambar multi-sudut avatar yang dihasilkan.
Proses ini menghasilkan mesh 3D untuk avatar. Selanjutnya, kami memanfaatkan penelitian segmentasi semantik 3D, yang dilatih pada pose avatar 3D, untuk mengambil mesh 3D tersebut dan menyesuaikannya dengan menambahkan fitur wajah yang sesuai, caging, rigging, dan tekstur, pada dasarnya mengubah mesh 3D statis menjadi avatar Roblox. Terakhir, alat pengeditan mesh memungkinkan pengguna untuk mengubah bentuk dan menyesuaikan model agar terlihat lebih mirip dengan versi yang mereka bayangkan. Dan semua ini terjadi dengan cepat—dalam hitungan menit—menghasilkan avatar baru yang dapat diimpor ke Roblox dan digunakan dalam suatu pengalaman.
Memoderasi Komunikasi Suara
Bagi kami, AI bukan hanya tentang kreasi, tetapi juga sistem yang jauh lebih efisien untuk memastikan komunitas yang beragam, aman, dan sopan, dalam skala besar. Saat kami mulai meluncurkan fitur suara baru, termasuk obrolan suara dan Roblox Connect, fitur panggilan baru sebagai avatar Anda, serta API yang diumumkan di RDC, kami menghadapi tantangan baru—memoderasi bahasa lisan secara real time. Standar industri saat ini untuk hal ini adalah proses yang dikenal sebagai Pengenalan Suara Otomatis (ASR), yang pada dasarnya mengambil file audio, mentranskripsikannya untuk mengubahnya menjadi teks, lalu menganalisis teks tersebut untuk mencari bahasa yang tidak pantas, kata kunci, dll.
Proses ini bekerja dengan baik bagi perusahaan yang menggunakannya dalam skala kecil, tetapi saat kami menjajaki penggunaan proses ASR yang sama untuk memoderasi komunikasi suara, kami segera menyadari bahwa hal itu sulit dan tidak efisien pada skala kami. Pendekatan ini juga kehilangan informasi yang sangat berharga yang terkandung dalam volume dan intonasi suara pembicara, serta konteks percakapan secara keseluruhan. Dari jutaan menit percakapan yang harus kami transkrip setiap hari, dalam berbagai bahasa, hanya persentase yang sangat kecil yang mungkin terdengar seperti sesuatu yang tidak pantas. Dan seiring kami terus berkembang, sistem tersebut akan membutuhkan daya komputasi yang semakin besar untuk mengikuti perkembangan. Oleh karena itu, kami meneliti lebih dalam cara melakukannya dengan lebih efisien, dengan membangun alur kerja yang langsung dari audio langsung ke penandaan konten untuk menunjukkan apakah konten tersebut melanggar kebijakan kami atau tidak.
Pada akhirnya, kami berhasil membangun sistem deteksi suara kustom internal dengan menggunakan ASR untuk mengklasifikasikan set data suara internal kami, lalu menggunakan data suara yang telah diklasifikasikan tersebut untuk melatih sistem. Lebih spesifiknya, untuk melatih sistem baru ini, kami memulai dengan audio dan membuat transkrip. Kami kemudian menjalankan transkrip tersebut melalui sistem filter teks Roblox kami untuk mengklasifikasikan audio. Sistem filter teks ini sangat efektif dalam mendeteksi bahasa yang melanggar kebijakan di Roblox karena kami telah mengoptimalkan sistem filter ini selama bertahun-tahun untuk slang, singkatan, dan istilah khusus Roblox. Pada akhir proses pelatihan ini, kami memiliki model yang mampu mendeteksi pelanggaran kebijakan langsung dari audio secara real-time.
Meskipun sistem ini mampu mendeteksi kata kunci spesifik seperti kata-kata kasar, pelanggaran kebijakan jarang hanya berupa satu kata. Satu kata seringkali tampak bermasalah dalam satu konteks dan tidak masalah dalam konteks lain. Pada dasarnya, jenis pelanggaran ini melibatkan apa yang Anda katakan, cara Anda mengatakannya, dan konteks di mana pernyataan tersebut dibuat.
Untuk meningkatkan pemahaman konteks, kami memanfaatkan kekuatan bawaan arsitektur berbasis transformer, yang sangat baik dalam merangkum urutan data. Arsitektur ini dapat mengambil urutan data, seperti aliran audio, dan merangkumnya untuk Anda. Arsitektur ini memungkinkan kami mempertahankan urutan audio yang lebih panjang sehingga kami dapat mendeteksi tidak hanya kata-kata, tetapi juga konteks dan intonasi. Setelah semua elemen ini bersatu, kami memiliki sistem akhir di mana masukan berupa audio dan keluaran berupa klasifikasi—melanggar kebijakan atau tidak. Sistem ini dapat mendeteksi kata kunci dan frasa yang melanggar kebijakan, serta nada, sentimen, dan konteks lain yang penting untuk menentukan niat. Sistem baru ini, yang mendeteksi ucapan yang melanggar kebijakan langsung dari audio, jauh lebih efisien dalam hal komputasi dibandingkan sistem ASR tradisional, yang akan memudahkan skalabilitas seiring kami terus merancang ulang cara orang berinteraksi.
Kami juga membutuhkan cara baru untuk memperingatkan pengguna alat komunikasi suara kami mengenai konsekuensi potensial dari penggunaan bahasa semacam ini. Dengan sistem deteksi inovatif ini, kami kini bereksperimen dengan cara-cara untuk memengaruhi perilaku online guna menjaga lingkungan yang aman. Kami tahu orang terkadang melanggar kebijakan kami tanpa sengaja, dan kami ingin memahami apakah pengingat sesekali dapat membantu mencegah pelanggaran lebih lanjut. Untuk membantu hal ini, kami sedang menguji umpan balik pengguna secara real-time melalui notifikasi. Jika sistem mendeteksi bahwa Anda telah mengatakan sesuatu yang melanggar kebijakan kami beberapa kali, kami akan menampilkan notifikasi pop-up di layar Anda yang memberitahu bahwa bahasa Anda melanggar kebijakan kami dan mengarahkan Anda ke kebijakan kami untuk informasi lebih lanjut.
Notifikasi aliran suara hanyalah salah satu elemen dari sistem moderasi. Kami juga menganalisis pola perilaku di platform, serta keluhan dari pengguna lain di Roblox, untuk mendukung keputusan moderasi secara keseluruhan. Akumulasi sinyal-sinyal ini dapat mengakibatkan konsekuensi yang lebih berat, termasuk pencabutan akses ke fitur audio, atau untuk pelanggaran yang lebih serius, pemblokiran permanen dari platform. Menjaga komunitas kami tetap aman dan beradab sangatlah penting seiring kemajuan model AI multimodal, AI generatif, dan LLM yang bersatu untuk menghadirkan alat dan kemampuan baru yang luar biasa bagi para kreator.
Kami percaya bahwa menyediakan alat-alat ini bagi kreator akan menurunkan hambatan masuk bagi kreator yang kurang berpengalaman dan membebaskan kreator yang lebih berpengalaman dari tugas-tugas yang membosankan dalam proses ini. Hal ini akan memungkinkan mereka untuk menghabiskan lebih banyak waktu pada aspek-aspek kreatif dalam penyempurnaan dan pengembangan ide. Tujuan kami dari semua ini adalah memungkinkan semua orang, di mana pun, untuk mewujudkan ide-ide mereka dan secara signifikan meningkatkan keragaman avatar, item, dan pengalaman yang tersedia di Roblox. Kami juga membagikan informasi dan alat untuk membantu melindungi kreasi baru.
Kami sudah membayangkan kemungkinan-kemungkinan menakjubkan: Misalnya, jika seseorang dapat membuat avatar kembaran langsung dari foto, mereka dapat menyesuaikan avatar tersebut agar lebih tinggi atau menampilkan gaya anime. Atau mereka dapat membangun pengalaman dengan meminta Assistant untuk menambahkan mobil, bangunan, dan pemandangan, mengatur pencahayaan atau kondisi angin, atau mengubah medan. Dari sana, mereka dapat mengulang dan menyempurnakan hal-hal tersebut hanya dengan berinteraksi melalui teks dengan Assistant. Kami tahu bahwa kenyataan dari apa yang diciptakan orang dengan alat-alat ini, seiring ketersediaannya, akan jauh melampaui apa yang bahkan dapat kami bayangkan.




