Nội dung trên trang web này đã được dịch bằng trí tuệ nhân tạo (AI) hoặc công nghệ dịch máy và có thể có lỗi.

Skip to content

Hành trình của Roblox hướng tới Trí tuệ nhân tạo tạo sinh 4D

  • Roblox đang phát triển hướng tới AI tạo sinh 4D, vượt ra ngoài các đối tượng 3D đơn lẻ để hướng tới các tương tác động. 
  • Việc giải quyết thách thức của 4D sẽ đòi hỏi sự hiểu biết đa phương thức về ngoại hình, hình dạng, vật lý và kịch bản.
  • Các công cụ ban đầu làm nền tảng cho hệ thống 4D của chúng tôi đã và đang thúc đẩy quá trình sáng tạo trên nền tảng này.

Roblox trao quyền cho các nhà sáng tạo để xây dựng những trải nghiệm 3D, hình đại diện và phụ kiện sống động bằng cách cung cấp các công cụ, dịch vụhỗ trợ cần thiết để biến ý tưởng của họ thành hiện thực. Chính những nhà sáng tạo này đã xây dựng nội dung sôi động trên nền tảng của chúng tôi, thu hút hơn 77 triệu người dùng hoạt động hàng ngày (tính đến quý 1 năm 2024). Thông qua ứng dụng Roblox Studio miễn phí, chúng tôi đã ra mắt bộ công cụ AI tạo sinh được thiết kế riêng cho quy trình làm việc của Roblox và được đào tạo trên nội dung đặc thù của Roblox.

Các công cụ này giúp quá trình sáng tạo trở nên dễ dàng, hiệu quả và thú vị hơn cho cả chuyên gia lẫn người mới bắt đầu. Assistant cho phép chỉnh sửa không gian làm việc 3D, Animation Capture hỗ trợ ghi lại chuyển động khuôn mặt và cơ thể, Code Assist giúp chỉnh sửa và tạo kịch bản, Material Generator cho phép tạo hiệu ứng vật liệu lặp lại, và Texture Generator hỗ trợ ánh xạ texture cho từng tài sản. Mỗi công cụ AI tạo sinh này đều nâng cao một khía cạnh cụ thể trong quy trình sáng tạo 3D.

Khi kết hợp, các công cụ này mở rộng bộ kỹ năng của người sáng tạo và rút ngắn thời gian từ ý tưởng đến hoàn thiện. Chúng tôi đã phát triển các công cụ này dựa trên những đột phá nghiên cứu sáng tạo của riêng mình cũng như các giải pháp hàng đầu từ hệ sinh thái AI rộng lớn. Chúng giải quyết việc tạo ra các tài sản riêng lẻ ở 1D (kịch bản), 2D (bề mặt) và 3D (không gian). Chúng tôi đã giới thiệu một số kết quả từ phòng thí nghiệm tạo và chỉnh sửa hình học 3D của mình tại các hội nghị nghiên cứu quốc tế, bao gồm cả Hội nghị Nhà phát triển Roblox của chính chúng tôi.

Trong toàn ngành, 1D và 2D là công nghệ tiên tiến nhất, còn 3D là công nghệ tiên phong trong AI tạo hình. Mỗi lĩnh vực đều là một thách thức ngày càng quan trọng, liên tục thúc đẩy những tiến bộ kỹ thuật thú vị. Vì chúng ta sống trong không gian 3D, có vẻ như đó là thách thức cuối cùng của AI tạo hình. Tuy nhiên, dựa trên nhu cầu của cộng đồng, tầm nhìn của chúng tôi đối với công việc này còn vươn xa hơn nữa.

Vị trí hiện tại của chúng tôi

Chúng tôi đang hướng tới AI tạo sinh 4D, trong đó chiều thứ tư là tương tác. Sức mạnh của nền tảng trực tuyến Roblox nằm ở tương tác — giữa con người, vật thể và môi trường. Khác với các trò chơi video trực tuyến truyền thống, động cơ thời gian thực mạnh mẽ của Roblox tận dụng một mô hình lập trình và mô phỏng độc đáo tập trung vào tương tác. Mô hình này được lấy cảm hứng từ khái niệm metaverse, nơi các yếu tố gặp gỡ theo những cách phức tạp, đa chiều và tự phát, thay vì theo những cách được quy định và hạn chế. 

Các công cụ AI tạo sinh 1D, 2D và 3D tạo ra các tài sản riêng lẻ. Thách thức chúng tôi đối mặt với AI tạo sinh 4D là mang những tài sản đó vào cuộc sống theo cách cho phép tương tác không giới hạn phù hợp với nền tảng của chúng tôi. Điều này có nghĩa là, ví dụ, một avatar không chỉ là hình dạng và màu sắc — nó còn là bộ xương, hoạt ảnh và khả năng cầm nắm công cụ và giữ thăng bằng. Avatar đó có thể mặc quần áo không được thiết kế riêng cho nó và tự động điều chỉnh để vừa vặn hoàn hảo cũng như theo dõi mọi chuyển động. Công cụ Avatar AutoSetup mới của chúng tôi là một ví dụ ban đầu về cách AI tạo sinh có thể giúp tự động hóa quá trình tạo ra này. Các nhà phát triển giờ đây có thể hoàn thành quy trình này trong vài phút thay vì vài giờ hoặc vài ngày.

Một chiếc xe thể thao không chỉ là hình dáng mượt mà và lớp sơn bề mặt — nó còn bao gồm động cơ, các bộ phận di động và hệ thống vật lý cho phép nó lao vun vút trên những con đường ảo với độ chính xác và kiểm soát cao. Trong mỗi trường hợp, đối tượng được mở rộng từ 3D để tương tác với tất cả các bộ phận của nó thông qua vật lý và với người dùng thông qua avatar của họ.

Mỗi yếu tố 4D tương tác phong phú này có thể được thêm vào một môi trường lớn hơn, nơi AI tạo hình hài hòa phong cách của từng yếu tố và đưa vào hỗ trợ tương tác giữa các đối tượng và với môi trường. Giờ đây, người dùng, thông qua avatar của mình, có thể lái xe trong một cuộc đua đường phố với các bộ điều chỉnh thiệt hại và điểm số cao, rồi trượt phanh dừng lại tại một cửa hàng thời trang có thương hiệu, nơi họ mua sắm quần áo mới để ăn mừng chiến thắng.

Ngày nay, việc tạo ra những trải nghiệm như vậy đòi hỏi phải tạo thủ công mã nguồn kịch bản, cấu trúc không gian làm việc và mô hình dữ liệu, hình học 3D, hoạt ảnh và vật liệu. Các công cụ AI tạo sinh hiện có của chúng tôi hỗ trợ từng phần của quy trình này. Chúng tôi đang xây dựng một hệ thống sẽ kết nối tất cả các yếu tố này và tạo ra chúng đồng thời. Để đạt được điều này, chúng tôi phải đào tạo hệ thống AI tạo sinh 4D của mình theo cách đa phương thức, tức là trên nhiều loại dữ liệu cùng lúc. Điều này đã được thực hiện cho hình ảnh và văn bản, là nền tảng cho Material Generator. Việc cho phép tương tác và thêm các bộ tối ưu hóa chuyên dụng cho vật lý là cách chúng tôi sẽ đạt đến cấp độ tiếp theo của khả năng 4D.

Chỉ trong năm qua, chúng tôi đã chứng kiến những thay đổi to lớn trong cách nội dung được tạo ra trên Roblox. Nhìn về tương lai, chúng tôi thấy một tương lai nơi bất kỳ ai, ở bất kỳ đâu, đều có thể biến ý tưởng thành hiện thực chỉ bằng cách gõ hoặc nói một lệnh. Để đạt được điều đó, chúng tôi cần bắt đầu giải quyết một số thách thức mà chúng tôi sẽ gặp phải trên con đường này.

Những thách thức phía trước

Các thử nghiệm mà chúng tôi đã chia sẻ ở trên sẽ có sẵn trong tương lai gần. Xa hơn nữa, chúng tôi phải đối mặt với ba thách thức rõ ràng mà chúng tôi cần phải giải quyết: 

1. Chức năng: Các đối tượng được tạo ra bởi công cụ AI tạo sinh trong tương lai này cần phải có chức năng. Điều này liên quan đến việc hệ thống nhìn vào một chiếc xe tải hoặc máy bay, nơi có hình dạng 3D — và không coi nó như một vật thể kín và không trong suốt. Và mà không cần người tạo phải can thiệp, hệ thống có thể tự động nhận diện, đây là những bộ phận cần có khớp nối, hoặc đây là nơi lưới cần mở ra.

Đây là vấn đề AI ở mức độ con người mà các hệ thống này cần giải quyết — ví dụ như xác định vị trí bánh xe chính xác, sau đó thêm trục cho bánh xe để chúng hoạt động giống như trong thế giới thực. Và xác định vị trí cửa, sau đó cắt một lỗ mở và thêm bản lề để cửa có thể mở và đóng.

2. Tương tác: Các vật thể được tạo ra bằng AI sinh thành trong tương lai này không chỉ cần hoạt động độc lập mà còn phải tương tác với các vật thể khác trong môi trường. Vì vậy, sau khi hệ thống đã tạo ra cho chúng ta một chiếc xe có cửa mở và bánh xe quay, nó cần hiểu vật lý của thế giới mà chiếc xe được đặt vào. Chiếc xe di chuyển trên địa hình như thế nào? Nếu nó va chạm vào một tảng đá, nó sẽ biến dạng ở đâu và như thế nào, dựa trên kích thước của tảng đá và tốc độ của chiếc xe?

Thách thức phức tạp này đòi hỏi cả vật thể được tạo ra và môi trường hoặc các vật thể mà nó tương tác phải hiểu được vật lý của nhau. May mắn thay, Roblox có lợi thế trong khía cạnh này, vì nền tảng này được xây dựng như một động cơ vật lý, nghĩa là tất cả các đối tượng trong trải nghiệm đều có thể có tính vật lý. Khi AI tạo sinh tạo ra một đối tượng 4D, các thuộc tính vật lý như vật liệu, khối lượng và độ bền cũng sẽ được thêm vào để chuẩn bị cho việc tương tác với các đối tượng khác có tính vật lý trong thế giới.

3. Có thể kiểm soát: Hiện nay, chúng ta tương tác với AI tạo sinh thông qua các lời nhắc. Đây là một khoa học chưa hoàn hảo, tương tự như một cuộc săn tìm kho báu. Khi ai đó yêu cầu một hình ảnh con thỏ, họ có thể nhận được vô số kết quả: một con thỏ thật, một con thỏ Phục sinh bằng sô-cô-la, một con thỏ hoạt hình, một bức tranh vẽ thỏ, hoặc một bức minh họa về con thỏ mặc áo khoác. Vì vậy, chúng ta tinh chỉnh các lời nhắc, yêu cầu hình ảnh chân thực hoặc hình ảnh “theo phong cách” để điều chỉnh hình ảnh trong đầu mình. Điều này đòi hỏi thời gian và nhiều lần thử nghiệm để đến gần hơn với điều chúng ta đang tìm kiếm.

Hãy tưởng tượng việc áp dụng quy trình này cho một đối tượng 3D có chức năng và tương tác với các đối tượng khác, như chiếc xe tải trong ví dụ trên. Kỹ thuật tối ưu hóa lời nhắc ở mức độ này sẽ phức tạp theo cấp số nhân – không phải ai cũng có thể sử dụng một cách dễ dàng. Để biến ý tưởng của người sáng tạo thành hiện thực, chúng ta cần một cách nhanh chóng và dễ dàng hơn để giao tiếp và tinh chỉnh, về cơ bản là hợp tác với một trợ lý AI đóng vai trò đối tác hơn là một trò chơi tìm kiếm. 

Đây là thách thức chung của ngành, và nhiều công ty đang nỗ lực mang lại khả năng kiểm soát cao hơn cho AI tạo sinh. Chúng tôi đã có một số tiến bộ với các công cụ như ControlNet, cho phép người sáng tạo cung cấp các điều kiện đầu vào bổ sung ngoài các lời nhắc văn bản. Hiện tại, chúng tôi đang khám phá các phương pháp khác hứa hẹn mang lại quy trình làm việc thoải mái, chẳng hạn như để AI tạm dừng sau các bước quan trọng để chờ phản hồi từ người dùng. Tuy nhiên, chúng tôi vẫn còn một chặng đường dài để đạt được trải nghiệm liền mạch.

Chúng tôi rất phấn khích về những tác động đã thấy cho đến nay và càng hào hứng hơn với những gì sắp tới. So với những người sáng tạo không sử dụng phiên bản beta của Material Generator, những người đang sử dụng nó đã tăng cường sử dụng các biến thể vật liệu dựa trên vật lý (PBR) hơn 100% — từ hơn 1.000 vào tháng 3 năm 2023 lên hơn 2.000 vào tháng 6 năm 2024. Tính đến ngày 2 tháng 6 năm 2024, các nhà sáng tạo đã áp dụng khoảng 535 triệu ký tự mã được đề xuất bởi Code Assist. 

Khi chúng ta bắt đầu giải quyết các thách thức trên con đường hướng tới 4D, các nhà sáng tạo sẽ có thể tạo ra nhiều nội dung hơn và nhanh hơn. Chúng tôi cũng kỳ vọng sẽ có sự đa dạng hơn trong các trải nghiệm trên Roblox khi chúng tôi tạo điều kiện cho nhiều người trở thành nhà sáng tạo. Những gì họ xây dựng và cách họ xây dựng sẽ giúp chúng tôi xác định nơi đầu tư vào các công cụ và thuật toán AI mới để hỗ trợ các nhà sáng tạo mới này, bên cạnh cộng đồng hiện tại của chúng tôi. 

Với AI tạo hình 4D, Roblox đã mở ra một lĩnh vực mới cho việc tạo ra trải nghiệm và tài sản. Mặc dù những thách thức là mới, nhưng quy trình đổi mới của chúng tôi đã được trau dồi kỹ lưỡng. Chúng tôi kết hợp các đội ngũ nghiên cứu và phát triển nội bộ hàng đầu, hợp tác với các trường đại học và lặp lại nhanh chóng các nguyên mẫu với sự hợp tác của cộng đồng.