Mục lục

  1. Giới thiệu về o3 và sự bí ẩn của nó
  2. Bài kiểm tra ARC-AGI: Thử thách sự thích nghi
  3. o3 phá vỡ kỷ lục: AI lần đầu vượt qua con người
  4. Kiến trúc mới: Yếu tố then chốt tạo nên thành công của o3
  5. Vẫn còn nhiều ẩn số xung quanh o3
  6. AGI vẫn là một giấc mơ: o3 chưa phải là tất cả
  7. Lời kết

1. Giới thiệu về o3 và sự bí ẩn của nó

OpenAI vừa giới thiệu một mô hình AI mới mang tên o3, đánh dấu một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo. Tuy nhiên, o3 vẫn còn là một bí ẩn đối với nhiều người, bởi thông tin về nó được tiết lộ khá hạn chế. Thay vì một bài công bố chi tiết, OpenAI chỉ trình làng o3 qua một video quảng cáo. Theo CEO Sam Altman, o3 là một "mô hình cực kỳ thông minh", nhưng cụ thể nó có khả năng gì thì vẫn còn là một dấu hỏi lớn.

Sam Altman and deputies at OpenAI discuss the performance of the new o3 model on the ARC-AGI test. Sam Altman và các cộng sự tại OpenAI thảo luận về hiệu suất của mô hình o3 mới trong bài kiểm tra ARC-AGI.

2. Bài kiểm tra ARC-AGI: Thử thách sự thích nghi

Một trong những cách để đánh giá khả năng của o3 là thông qua bài kiểm tra ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence). Bài kiểm tra này không giống các bài kiểm tra AI thông thường, mà tập trung vào khả năng thích nghi với những tình huống mới. ARC-AGI được thiết kế để đo lường khả năng học hỏi các kỹ năng mới, thay vì chỉ sử dụng kiến thức đã được ghi nhớ.

Bài kiểm tra ARC-AGI gồm các câu đố hình ảnh, trong đó người tham gia phải tìm ra quy luật biến đổi giữa các hình. Mỗi câu đố đưa ra 3-5 ví dụ về hình ảnh đầu vào và đầu ra, sau đó yêu cầu người làm bài xác định đầu ra tương ứng cho một hình ảnh đầu vào khác. Thử thách này không dựa trên ngôn ngữ mà là khả năng nhận biết và xử lý các mẫu hình ảnh trừu tượng.

3. o3 phá vỡ kỷ lục: AI lần đầu vượt qua con người

Trong một đánh giá chính thức được phối hợp bởi OpenAI và François Chollet - tác giả của ARC-AGI, o3 đã đạt được kết quả đáng kinh ngạc: 76% độ chính xác. Điều đáng nói là đây là lần đầu tiên một mô hình AI vượt qua điểm số trung bình của con người (75%) trong bài kiểm tra này.

François Chollet, inventor of ARC-AGI, says that the amount of activity going on with o3 suggests it is using a completely different architecture than its GPT-4 predecessors. François Chollet, người phát minh ra ARC-AGI, cho rằng những gì o3 thể hiện cho thấy nó đang sử dụng một kiến trúc hoàn toàn khác so với các mô hình GPT-4 trước đó.

Theo Chollet, kết quả này là một "bước nhảy vọt quan trọng" và "một sự thay đổi về chất trong khả năng của AI". Ông dự đoán rằng khả năng thích ứng với các nhiệm vụ chưa từng gặp của o3 sẽ sớm giúp nó cạnh tranh với con người trong nhiều công việc.

4. Kiến trúc mới: Yếu tố then chốt tạo nên thành công của o3

Thành công của o3 không chỉ đến từ việc tinh chỉnh mô hình mà còn là sự thay đổi về kiến trúc. Chollet cho rằng o3 đang sử dụng một kiến trúc hoàn toàn khác so với các mô hình GPT trước đây. Ông suy đoán rằng, trong quá trình làm bài kiểm tra, o3 đang thực hiện "tìm kiếm trong không gian các Chuỗi Tư Duy (CoT) có thể", tương tự như cách mà AlphaZero của Google DeepMind đã làm.

Cụ thể, Chollet nhận thấy rằng o3 mất rất nhiều thời gian để giải quyết một câu đố, cho thấy nó đang thực hiện một quá trình tìm kiếm phức tạp, chứ không chỉ đơn thuần dựa trên kiến thức đã được học. Điều này cho thấy sự khác biệt lớn về cách thức hoạt động của o3 so với các mô hình GPT trước đây.

5. Vẫn còn nhiều ẩn số xung quanh o3

Mặc dù đạt được thành tựu đáng kể, o3 vẫn còn nhiều bí ẩn. Vì là một mô hình nguồn đóng, không ai ngoài OpenAI biết chính xác cách nó giải quyết các thử thách. Chollet cũng phải suy đoán về kiến trúc và cách hoạt động của o3.

Một yếu tố khác cần được làm rõ là chi phí để o3 vượt qua ARC-AGI. Bài kiểm tra này không chỉ đo lường độ chính xác mà còn cả hiệu quả sử dụng tài nguyên (thông qua chi phí sử dụng chip GPU). OpenAI chưa công bố thông tin này, khiến cho việc đánh giá đầy đủ về khả năng của o3 trở nên khó khăn hơn.

Ngoài ra, o3 đã được huấn luyện trên bộ dữ liệu đào tạo của ARC-AGI, có nghĩa là nó đã được "chuẩn bị trước" cho bài kiểm tra. Câu hỏi đặt ra là liệu o3 có thể đạt được kết quả tương tự khi không được "học bài" trước hay không.

6. AGI vẫn là một giấc mơ: o3 chưa phải là tất cả

Mặc dù o3 đã vượt qua con người trong ARC-AGI, nhưng Chollet nhấn mạnh rằng nó không đồng nghĩa với việc đạt được AGI (trí tuệ nhân tạo tổng quát). Bài kiểm tra này chỉ là một "công cụ nghiên cứu" và "vượt qua ARC-AGI không tương đương với việc đạt được AGI".

Chollet cũng chỉ ra rằng o3 vẫn thất bại trong một số nhiệm vụ rất đơn giản mà con người có thể dễ dàng giải quyết, như việc di chuyển một hình vuông màu theo một quy luật nhất định. Điều này cho thấy rằng vẫn còn những khác biệt cơ bản giữa trí thông minh của con người và AI.

An example problem from ARC-AGI where the o3 model failed. Một ví dụ về câu đố trong ARC-AGI mà mô hình o3 đã không thể giải quyết.

Chollet dự định sẽ giới thiệu một phiên bản mới của ARC-AGI vào tháng 1, dự kiến sẽ làm giảm đáng kể kết quả của o3. Ông kết luận rằng "bạn sẽ biết AGI đã đến khi việc tạo ra các nhiệm vụ dễ cho người thường nhưng khó cho AI trở nên hoàn toàn bất khả thi".

7. Lời kết

Sự ra mắt của o3 là một dấu mốc quan trọng trong sự phát triển của AI. Tuy nhiên, nó cũng cho thấy rằng chúng ta vẫn còn một chặng đường dài phía trước để đạt được AGI. O3 là một bước tiến lớn, nhưng không phải là điểm dừng cuối cùng. Câu hỏi đặt ra là: liệu những tiến bộ tiếp theo có thể thu hẹp khoảng cách giữa AI và trí thông minh của con người hay không? Chỉ có thời gian mới có thể trả lời được.

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top