Mô hình AI "suy luận" của Trung Quốc cạnh tranh với OpenAI's o1
Mục lục
- DeepSeek-R1: Mô hình AI suy luận mới từ Trung Quốc
- Khả năng và giới hạn của DeepSeek-R1
- Ảnh hưởng của chính sách Trung Quốc đối với DeepSeek-R1
- Xu hướng mới trong phát triển AI: Tính toán thời gian thực thi
1. DeepSeek-R1: Mô hình AI suy luận mới từ Trung Quốc
Một phòng thí nghiệm AI của Trung Quốc đã công bố một mô hình AI "suy luận" được cho là có khả năng cạnh tranh với mô hình o1 của OpenAI. Phòng thí nghiệm đó là DeepSeek, được hậu thuẫn bởi một quỹ đầu tư phòng hộ định lượng. Họ đã phát hành bản xem trước của DeepSeek-R1, mô hình mà công ty tuyên bố có khả năng suy luận ngang ngửa với o1. Khác với hầu hết các mô hình khác, các mô hình suy luận tự kiểm tra tính chính xác thông tin bằng cách dành nhiều thời gian hơn để xem xét câu hỏi hoặc truy vấn. Điều này giúp chúng tránh được một số cạm bẫy thường gặp ở các mô hình khác.
2. Khả năng và giới hạn của DeepSeek-R1
Tương tự như o1, DeepSeek-R1 lập luận thông qua các nhiệm vụ, lên kế hoạch trước và thực hiện một loạt các hành động giúp mô hình đưa ra câu trả lời. Điều này có thể mất một thời gian. Giống như o1, tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể "suy nghĩ" trong vài chục giây trước khi trả lời.
DeepSeek tuyên bố rằng DeepSeek-R1 (hoặc chính xác hơn là DeepSeek-R1-Lite-Preview) hoạt động tương đương với mô hình o1-preview của OpenAI trên hai điểm chuẩn AI phổ biến, AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất của một mô hình, trong khi MATH là một tập hợp các bài toán bằng lời. Tuy nhiên, mô hình này không hoàn hảo. Một số người bình luận trên X lưu ý rằng DeepSeek-R1 gặp khó khăn với trò chơi ô ăn quan và các bài toán logic khác (giống như o1).
DeepSeek-R1 cũng có thể dễ dàng bị "jailbreak" - tức là được nhắc nhở theo cách mà nó bỏ qua các biện pháp bảo vệ. Một người dùng X đã khiến mô hình đưa ra công thức chi tiết về ma túy.
Hơn nữa, DeepSeek-R1 dường như chặn các truy vấn được coi là quá nhạy cảm về mặt chính trị. Trong thử nghiệm của chúng tôi, mô hình từ chối trả lời các câu hỏi về nhà lãnh đạo Trung Quốc Tập Cận Bình, Quảng trường Thiên An Môn và các tác động địa chính trị của việc Trung Quốc xâm lược Đài Loan.
3. Ảnh hưởng của chính sách Trung Quốc đối với DeepSeek-R1
Hành vi này có thể là kết quả của áp lực từ chính phủ Trung Quốc đối với các dự án AI trong khu vực. Các mô hình ở Trung Quốc phải trải qua quá trình đánh giá chuẩn bởi cơ quan quản lý internet của Trung Quốc để đảm bảo phản hồi của chúng "thể hiện các giá trị xã hội chủ nghĩa cốt lõi". Được biết, chính phủ đã đề xuất một danh sách đen các nguồn không thể được sử dụng để huấn luyện các mô hình - dẫn đến việc nhiều hệ thống AI của Trung Quốc từ chối trả lời các chủ đề có thể gây ra sự phẫn nộ của các cơ quan quản lý.
4. Xu hướng mới trong phát triển AI: Tính toán thời gian thực thi
Sự chú ý ngày càng tăng đối với các mô hình suy luận xuất hiện khi tính khả thi của "luật mở rộng", các lý thuyết lâu đời cho rằng việc ném thêm dữ liệu và sức mạnh tính toán vào một mô hình sẽ liên tục làm tăng khả năng của nó, đang bị đặt câu hỏi. Nhiều báo cáo báo chí cho thấy các mô hình từ các phòng thí nghiệm AI lớn, bao gồm OpenAI, Google và Anthropic, không được cải thiện ấn tượng như trước đây.
Điều đó đã dẫn đến sự cạnh tranh gay gắt cho các phương pháp tiếp cận, kiến trúc và kỹ thuật phát triển AI mới. Một trong số đó là tính toán thời gian thực thi, làm nền tảng cho các mô hình như o1 và DeepSeek-R1. Còn được gọi là tính toán suy luận, tính toán thời gian thực thi về cơ bản cung cấp cho các mô hình thêm thời gian xử lý để hoàn thành nhiệm vụ.
"Chúng ta đang chứng kiến sự xuất hiện của một định luật mở rộng mới", CEO của Microsoft, Satya Nadella, cho biết trong tuần này tại hội nghị Ignite của Microsoft, đề cập đến tính toán thời gian thực thi.
DeepSeek, cho biết họ có kế hoạch mã nguồn mở DeepSeek-R1 và phát hành một API, là một hoạt động đáng chú ý. Nó được hậu thuẫn bởi High-Flyer Capital Management, một quỹ đầu tư phòng hộ định lượng của Trung Quốc sử dụng AI để hỗ trợ quyết định giao dịch của mình. Một trong những mô hình đầu tiên của DeepSeek, một mô hình phân tích văn bản và hình ảnh đa năng có tên DeepSeek-V2, đã buộc các đối thủ cạnh tranh như ByteDance, Baidu và Alibaba phải giảm giá sử dụng cho một số mô hình của họ - và làm cho các mô hình khác hoàn toàn miễn phí.
High-Flyer tự xây dựng các cụm máy chủ của riêng mình để huấn luyện mô hình, gần đây nhất là cụm máy chủ có 10.000 GPU Nvidia A100 và trị giá 1 tỷ yên (~138 triệu USD). Được sáng lập bởi Liang Wenfeng, một sinh viên tốt nghiệp khoa học máy tính, High-Flyer đặt mục tiêu đạt được AI "siêu thông minh" thông qua tổ chức DeepSeek của mình.
0 comments Blogger 0 Facebook
Đăng nhận xét