Mục lục

  • Giới thiệu DeepMind Genie 2
  • Tại sao Genie 2 lại quan trọng?
  • Cơ chế hoạt động của Genie 2
  • Thế giới tương tác đa dạng và phức tạp
  • Khả năng tạo mẫu nhanh và ứng dụng
  • Kết luận

Giới thiệu DeepMind Genie 2

DeepMind Genie 2 của Google là một công cụ đột phá, có khả năng tạo ra các môi trường 3D tương tác và có thể chơi được chỉ với một lời nhắc. Đây là một "mô hình thế giới" (world model) được thiết kế để huấn luyện và đánh giá các tác nhân (agent) AI. Người dùng có thể tương tác với môi trường được tạo ra bằng chuột hoặc bàn phím, và thậm chí cả AI khác cũng có thể điều khiển. Khả năng tạo ra một thế giới tương tác do AI sinh ra đã là ấn tượng, nhưng giá trị của nó như một công cụ huấn luyện AI còn đáng kể hơn.

User added image

Tại sao Genie 2 lại quan trọng?

Trò chơi điện tử không chỉ giải trí mà còn là môi trường an toàn và được kiểm soát để huấn luyện AI. DeepMind đã tiên phong trong việc sử dụng game để huấn luyện AI, tuy nhiên, các môi trường hiện có thường bị hạn chế. Thế giới thực quá phức tạp, việc tái tạo các ngữ cảnh cần thiết để chuẩn bị đầy đủ cho AI là gần như bất khả thi. Cho dù đó là hoàn thành các nhiệm vụ đơn giản hay giải quyết các vấn đề thực tế, AI và hầu hết các chương trình khác đều cần được thử nghiệm toàn diện để khắc phục lỗi trong mã hoặc khả năng của chúng.

Cơ chế hoạt động của Genie 2

Khác với Genie 1 chỉ tạo ra thế giới 2D, Genie 2 tạo ra các thế giới 3D đa dạng. Được huấn luyện trên các tập dữ liệu video quy mô lớn, mô hình này "thể hiện nhiều khả năng nổi bật ở quy mô lớn, chẳng hạn như tương tác đối tượng, hoạt ảnh nhân vật phức tạp, vật lý và khả năng mô hình hóa và dự đoán hành vi của các tác nhân khác". Ánh sáng, khói, trọng lực và các yếu tố khác phản ánh chính xác thực tế.

Genie 2 dường như ngang bằng với @worldlabs về độ trung thực, nhưng có các tương tác trong thế giới tiên tiến hơn nhiều. Thật ấn tượng.

— Chris McKay (@cmcky) Ngày 4 tháng 12 năm 2024

Genie 2 phản hồi các hành động của người dùng (bằng bàn phím hoặc chuột) và di chuyển các thành phần phù hợp trên màn hình. AI cũng có thể tạo ra các trải nghiệm phản thực dựa trên phản ứng của người dùng, và nội dung được tạo ra vẫn tuân thủ quy luật thực tế.

User added image

Thế giới tương tác đa dạng và phức tạp

Các môi trường 3D có thể chơi được rất đa dạng và hỗ trợ tạo ra các góc nhìn khác nhau, từ góc nhìn người thứ nhất đến góc nhìn người thứ ba. Người dùng có thể tương tác với các vật thể và chúng sẽ phản hồi một cách phù hợp (ví dụ, chọc thủng bong bóng, đẩy cửa để mở cửa).

Điều thú vị là, DeepMind Genie 2 không chỉ tạo ra các vật thể mà còn tạo ra NPC và thiết kế nhân vật. Các môi trường trò chơi điện tử do AI tạo ra cũng thể hiện bộ nhớ dài hạn, cho phép thế giới không còn trong tầm nhìn được hiển thị lại chính xác khi người dùng quay lại. Công cụ này cũng có thể tiếp tục tạo ra thế giới khi người dùng di chuyển trong tối đa một phút.

Giới thiệu Genie 2: mô hình AI của chúng tôi có thể tạo ra vô số thế giới 3D có thể chơi được – tất cả chỉ từ một hình ảnh duy nhất. 🖼️

Những mô hình thế giới nền tảng quy mô lớn này có thể cho phép các tác nhân trong tương lai được huấn luyện và đánh giá trong vô số môi trường ảo. →…

— Google DeepMind (@GoogleDeepMind) Ngày 4 tháng 12 năm 2024

Khả năng tạo mẫu nhanh và ứng dụng

Khả năng tạo mẫu nhanh cho phép thử nghiệm khả năng của AI nhanh hơn nhiều. Một hình ảnh do AI tạo ra có thể được mở rộng thành một thế giới ảo với DeepMind Genie 2, và một AI khác có thể được yêu cầu khám phá và tương tác với thế giới ảo này. Các kết quả mà Google cung cấp cho thấy AI không hoàn hảo, nhưng nó vẫn là một trong những công cụ hiệu quả nhất mà chúng ta đã thấy gần đây.

Genie 2 chủ yếu là một công cụ nghiên cứu và không nhằm mục đích thay thế các nhà phát triển game. Các môi trường 3D được tạo ra nhằm mục đích hỗ trợ các công cụ AI khác trở nên tinh vi hơn, đồng thời cải thiện khả năng của chính chúng trong quá trình thử nghiệm.

Kết luận

DeepMind Genie 2 là một bước tiến đáng kể trong lĩnh vực AI, mở ra khả năng tạo ra các môi trường ảo đa dạng và phức tạp cho việc huấn luyện và đánh giá AI. Mặc dù vẫn còn những hạn chế, Genie 2 hứa hẹn sẽ đóng góp quan trọng cho sự phát triển của AI trong tương lai.

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top