OpenAI: Bí mật đằng sau dự án Strawberry

Mục lục:

Strawberry - Cải tiến vượt bậc trong khả năng suy luận của AI
OpenAI và cuộc đua khẳng định sức mạnh của mô hình AI
Strawberry: Bước tiến mới trong việc đọc hiểu thế giới
Suy luận: Chìa khóa cho trí thông minh nhân tạo
Strawberry: Bí mật vẫn còn ẩn giấu
Strawberry: Tương lai của AI

1. Strawberry - Cải tiến vượt bậc trong khả năng suy luận của AI

OpenAI, công ty đứng sau ChatGPT, đang nghiên cứu một cách tiếp cận mới cho các mô hình trí tuệ nhân tạo (AI) của mình trong một dự án có mật danh Strawberry. Dự án, chưa từng được tiết lộ trước đây, xuất hiện khi công ty khởi nghiệp được Microsoft hậu thuẫn đang nỗ lực chứng minh rằng các mô hình AI do họ cung cấp có khả năng mang đến những khả năng suy luận tiên tiến.

2. OpenAI và cuộc đua khẳng định sức mạnh của mô hình AI

Theo thông tin từ một nguồn tin thân cận và tài liệu nội bộ do Reuters xem xét, các nhóm bên trong OpenAI đang làm việc trên Strawberry. Mục tiêu của dự án là giúp AI của OpenAI không chỉ tạo ra câu trả lời cho các truy vấn mà còn có thể lên kế hoạch trước để tự động điều hướng internet một cách đáng tin cậy và hiệu quả để thực hiện những gì OpenAI gọi là nghiên cứu sâu. Điều này là điều mà các mô hình AI hiện nay chưa thể làm được.

3. Strawberry: Bước tiến mới trong việc đọc hiểu thế giới

Một phát ngôn viên của OpenAI cho biết: Chúng tôi muốn các mô hình AI của mình nhìn và hiểu thế giới giống như chúng ta. Nghiên cứu liên tục về các khả năng AI mới là một thực tiễn phổ biến trong ngành, với niềm tin chung rằng những hệ thống này sẽ cải thiện khả năng suy luận theo thời gian. Tuy nhiên, phát ngôn viên này không trực tiếp trả lời các câu hỏi về Strawberry.

4. Suy luận: Chìa khóa cho trí thông minh nhân tạo

Các nhà nghiên cứu AI cho rằng khả năng suy luận là điều cần thiết để AI đạt được trí thông minh ở mức độ con người hoặc siêu việt. Trong khi các mô hình ngôn ngữ lớn hiện có thể tóm tắt văn bản dày đặc và sáng tác văn xuôi một cách thanh tao nhanh hơn bất kỳ con người nào, công nghệ này thường thất bại trong các vấn đề về lý trí chung mà con người có thể giải quyết một cách trực quan, chẳng hạn như nhận ra các sai lầm logic và chơi trò chơi ô ăn quan. Khi gặp phải những vấn đề này, mô hình thường ảo tưởng ra thông tin sai lệch.

5. Strawberry: Bí mật vẫn còn ẩn giấu

Dự án Strawberry trước đây được gọi là Q*, mà Reuters đã đưa tin vào năm ngoái là đã được xem xét bên trong công ty như một bước đột phá. Hai nguồn tin đã mô tả việc xem các bản demo của Q* đầu năm nay, được các nhân viên của OpenAI cho biết là có khả năng trả lời các câu hỏi khoa học và toán học khó nhằn mà các mô hình thương mại hiện nay không thể giải quyết được.

6. Strawberry: Tương lai của AI

OpenAI hy vọng rằng sự đổi mới này sẽ cải thiện đáng kể khả năng suy luận của các mô hình AI, người quen thuộc với nó cho biết, và bổ sung rằng Strawberry liên quan đến một cách xử lý đặc biệt mô hình AI sau khi nó được đào tạo trước trên các bộ dữ liệu rất lớn.

Các công ty khác như Google, Meta và Microsoft cũng đang thử nghiệm các kỹ thuật khác nhau để cải thiện khả năng suy luận trong các mô hình AI, cũng như hầu hết các phòng thí nghiệm học thuật thực hiện nghiên cứu AI. Tuy nhiên, các nhà nghiên cứu vẫn chưa thống nhất về việc liệu các mô hình ngôn ngữ lớn (LLM) có khả năng kết hợp các ý tưởng và kế hoạch dài hạn vào cách thức dự đoán của chúng hay không. Ví dụ, một trong những người tiên phong của AI hiện đại, Yann LeCun, người làm việc tại Meta, thường nói rằng LLM không thể suy luận như con người.

Strawberry là một thành phần chính trong kế hoạch của OpenAI để khắc phục những thách thức đó. Tài liệu do Reuters xem xét đã mô tả những gì Strawberry hướng đến, nhưng không nói rõ cách thức. Trong những tháng gần đây, công ty đã bí mật báo hiệu cho các nhà phát triển và các bên ngoài rằng họ sắp phát hành công nghệ với khả năng suy luận tiên tiến hơn nhiều.

Strawberry bao gồm một cách thức chuyên biệt được gọi là đào tạo sau các mô hình AI thế hệ của OpenAI, hoặc điều chỉnh các mô hình cơ sở để cải thiện hiệu suất của chúng theo những cách cụ thể sau khi chúng đã được đào tạo trên khối lượng dữ liệu chung. Giai đoạn đào tạo sau của việc phát triển mô hình bao gồm các phương pháp như điều chỉnh tinh, một quy trình được sử dụng trên hầu hết các mô hình ngôn ngữ hiện nay với nhiều biến thể, chẳng hạn như cho phép con người đưa phản hồi cho mô hình dựa trên phản hồi của nó và cung cấp cho nó các ví dụ về câu trả lời tốt và xấu.

Strawberry có điểm tương đồng với một phương pháp được phát triển tại Stanford vào năm 2022 được gọi là Hệ thống tự học suy luận hoặc STaR. STaR cho phép các mô hình AI tự khởi động lên các cấp độ trí thông minh cao hơn thông qua việc tạo dữ liệu đào tạo của riêng chúng một cách lặp đi lặp lại, và về lý thuyết có thể được sử dụng để giúp các mô hình ngôn ngữ vượt qua trí thông minh của con người.

Trong số những khả năng mà OpenAI hướng đến Strawberry là thực hiện các nhiệm vụ dài hạn (LHT), tài liệu cho biết, đề cập đến các nhiệm vụ phức tạp yêu cầu mô hình lên kế hoạch trước và thực hiện một loạt hành động trong một khoảng thời gian dài. Để làm được điều đó, OpenAI đang tạo, đào tạo và đánh giá các mô hình dựa trên những gì công ty gọi là bộ dữ liệu nghiên cứu sâu. OpenAI đặc biệt muốn các mô hình của mình sử dụng những khả năng này để tiến hành nghiên cứu bằng cách duyệt web một cách tự động với sự trợ giúp của một CUA, hoặc một tác nhân sử dụng máy tính, có thể thực hiện các hành động dựa trên những phát hiện của nó. OpenAI cũng có kế hoạch thử nghiệm khả năng của nó trong việc thực hiện công việc của các kỹ sư phần mềm và máy học.

OpenAI: Bí mật đằng sau dự án Strawberry