OpenAI ra mắt mô hình o1 với khả năng "suy luận"

OpenAI ra mắt mô hình o1 với khả năng "suy luận" - Bản tin tiếng Việt

OpenAI vừa công bố mô hình mới mang tên o1, đánh dấu bước tiến quan trọng trong việc phát triển các mô hình AI có khả năng suy luận phức tạp, nhanh hơn cả con người. Mô hình này, được đồn đại với tên gọi "Strawberry", cùng với phiên bản thu gọn hơn, o1-mini, có thể xử lý các truy vấn phức tạp hơn so với các mô hình trước đây. Tuy nhiên, việc sử dụng o1 cũng đồng nghĩa với chi phí cao hơn và tốc độ xử lý chậm hơn so với GPT-4o.

Theo OpenAI, o1 là một bước tiến quan trọng trên con đường phát triển trí tuệ nhân tạo đạt đến mức độ tương tự con người. Về mặt thực tiễn, o1 thể hiện khả năng viết mã và giải quyết các vấn đề đa bước tốt hơn các mô hình trước. OpenAI coi bản phát hành này là một "phiên bản xem trước" để nhấn mạnh rằng o1 vẫn đang trong giai đoạn phát triển ban đầu.

Hiện tại, người dùng ChatGPT Plus và Team có thể truy cập cả o1-preview và o1-mini, trong khi người dùng Enterprise và Edu sẽ được truy cập vào đầu tuần sau. OpenAI cho biết họ có kế hoạch cung cấp o1-mini cho tất cả người dùng ChatGPT miễn phí, nhưng chưa ấn định ngày phát hành cụ thể. Đối với các nhà phát triển, việc truy cập vào API của o1-preview có giá khá cao: 15 đô la cho mỗi 1 triệu token đầu vào và 60 đô la cho mỗi 1 triệu token đầu ra. Để so sánh, GPT-4o có giá 5 đô la cho mỗi 1 triệu token đầu vào và 15 đô la cho mỗi 1 triệu token đầu ra.

Phương pháp huấn luyện o1 khác biệt hoàn toàn so với các mô hình GPT trước đây. Jerry Tworek, trưởng nhóm nghiên cứu của OpenAI, cho biết o1 đã được huấn luyện bằng một thuật toán tối ưu hóa và bộ dữ liệu huấn luyện mới, được thiết kế riêng cho mô hình này.

Thay vì chỉ bắt chước các mẫu từ dữ liệu huấn luyện, OpenAI đã sử dụng kỹ thuật học tăng cường để huấn luyện o1 tự giải quyết các vấn đề. Mô hình này sử dụng "chuỗi suy nghĩ" để xử lý các truy vấn, tương tự cách con người giải quyết vấn đề từng bước một.

Nhờ phương pháp huấn luyện mới này, o1 được kỳ vọng có độ chính xác cao hơn. "Chúng tôi nhận thấy rằng mô hình này ít bị ảo giác hơn", Tworek cho biết. Tuy nhiên, vấn đề ảo giác vẫn chưa được giải quyết hoàn toàn.

Điểm nổi bật của o1 so với GPT-4o là khả năng giải quyết các vấn đề phức tạp, đặc biệt trong lĩnh vực lập trình và toán học. Mô hình này còn có khả năng giải thích lý do đưa ra các câu trả lời của mình. Bob McGrew, giám đốc nghiên cứu của OpenAI, cho biết o1 đã vượt trội GPT-4o trong các bài kiểm tra toán học, đạt được 83% điểm trong kỳ thi Olympic Toán học Quốc tế, trong khi GPT-4o chỉ đạt 13%.

Trong các cuộc thi lập trình trực tuyến Codeforces, o1 đã đạt được thứ hạng 89% trong số các thí sinh. OpenAI còn tuyên bố rằng phiên bản cập nhật tiếp theo của o1 sẽ đạt được hiệu suất tương đương với các nghiên cứu sinh tiến sĩ trong các bài kiểm tra chuẩn về vật lý, hóa học và sinh học.

Tuy nhiên, o1 cũng có những hạn chế so với GPT-4o. Mô hình này chưa thể hiện hiệu quả trong việc xử lý kiến thức thực tế về thế giới. Nó cũng không có khả năng duyệt web, xử lý tệp hoặc hình ảnh. Dù vậy, OpenAI vẫn cho rằng o1 đại diện cho một loại khả năng hoàn toàn mới. Việc đặt tên là o1 cũng mang ý nghĩa "đặt lại bộ đếm về 1", thể hiện sự khởi đầu mới trong lĩnh vực này.

Mặc dù OpenAI không đồng nhất suy nghĩ của mô hình AI với suy nghĩ của con người, nhưng giao diện của o1 được thiết kế để mô phỏng quá trình suy nghĩ của con người. Các cụm từ như "Tôi tò mò về", "Tôi đang suy nghĩ", "Được rồi, để tôi xem" tạo ra cảm giác như mô hình đang suy nghĩ từng bước một.

OpenAI đang hướng đến việc phát triển các hệ thống tự động, hay các agent, có khả năng đưa ra quyết định và hành động thay mặt cho người dùng. Việc trang bị khả năng suy luận cho các mô hình ngôn ngữ lớn là một bước quan trọng để đạt được mục tiêu này.

Khả năng suy luận là một bước tiến quan trọng trong việc hướng tới trí tuệ nhân tạo đạt đến cấp độ con người. Nếu một mô hình có thể làm được nhiều hơn việc nhận dạng mẫu, nó có thể tạo ra những đột phá trong các lĩnh vực như y học và kỹ thuật. Tuy nhiên, khả năng suy luận của o1 hiện tại vẫn còn khá chậm, chưa đạt đến mức độ tự động, và chi phí sử dụng cho các nhà phát triển còn cao.

OpenAI tin rằng việc nghiên cứu khả năng suy luận là chìa khóa để phát triển trí tuệ nhân tạo. "Chúng tôi đã dành nhiều tháng để nghiên cứu về khả năng suy luận vì chúng tôi tin rằng đây là một bước đột phá quan trọng", McGrew cho biết. "Về cơ bản, đây là một phương thức mới đối với các mô hình để có thể giải quyết các vấn đề thực sự phức tạp, cần thiết để tiến tới các cấp độ trí thông minh tương tự con người."

OpenAI đang tích cực phát triển o1 và các mô hình tương lai, hướng đến một tương lai nơi AI có thể đóng vai trò hỗ trợ và giải quyết những vấn đề khó khăn nhất cho nhân loại.

OpenAI ra mắt mô hình o1 với khả năng "suy luận"