Mục lục:
- Giới thiệu về CePO
- Hiệu suất vượt trội của CePO
- Cơ chế hoạt động của CePO
- Tầm nhìn và kế hoạch tương lai của Cerebras
- Thông tin về Cerebras Systems
1. Giới thiệu về CePO
Cerebras Systems, công ty tiên phong trong lĩnh vực tăng tốc AI thế hệ mới, đã công bố Cerebras Planning and Optimization (CePO) tại hội nghị NeurIPS 2024. CePO là một khung công nghệ mạnh mẽ, giúp nâng cao đáng kể khả năng lập luận của dòng mô hình Llama của Meta. Sử dụng các kỹ thuật tính toán tinh vi trong quá trình suy luận, CePO cho phép mô hình Llama 3.3-70B vượt trội so với mô hình Llama 3.1-405B lớn hơn và các mô hình mã nguồn đóng hàng đầu trên các chuẩn đánh giá khó khăn, đồng thời duy trì tốc độ tương tác 100 token mỗi giây – một thành tựu tiên phong trong các mô hình lập luận thời gian thử nghiệm.
CePO đánh dấu một bước đột phá quan trọng trong việc đưa khả năng lập luận tiên tiến đến cộng đồng AI mã nguồn mở. Trong khi các mô hình như OpenAI o1 và Alibaba QwQ đã chứng minh sức mạnh của việc tính toán bổ sung trong thời gian suy luận, CePO mang những khả năng này đến với Llama – dòng mô hình ngôn ngữ lớn (LLM) mã nguồn mở phổ biến nhất thế giới.
2. Hiệu suất vượt trội của CePO
CePO cải thiện đáng kể khả năng lập luận của Llama 3.3-70B, giúp nó vượt trội hơn Llama 3.1-405B trên các chuẩn đánh giá quan trọng bao gồm MATH, MMLU-Pro (Toán), GPQA và CRUX.
Khi so sánh trực tiếp với GPT-4 Turbo và Claude 3.5 Sonnet, Llama 3.3-70B kết hợp với CePO đạt được hiệu suất tương đương trong các chuẩn đánh giá CRUZ, LiveCodeBench và GPQA, đồng thời vượt trội đáng kể trong các đánh giá MATH. Khung công nghệ này cũng cho thấy thành công đáng kể trong các thử thách lập luận cổ điển như Bài kiểm tra Dâu tây và bài toán Roulette Nga được sửa đổi, chứng minh khả năng lập luận thực sự chứ không chỉ là khớp mẫu.
3. Cơ chế hoạt động của CePO
Khung công nghệ lập luận CePO đạt được những cải tiến này thông qua một đường dẫn bốn giai đoạn sáng tạo:
- Lập kế hoạch từng bước: Phân tích bài toán phức tạp thành các bước nhỏ hơn.
- Nhiều đường dẫn thực thi: Đảm bảo tính chắc chắn của giải pháp.
- Phân tích chéo thực thi: Xác định và sửa chữa các mâu thuẫn.
- Đánh giá độ tin cậy có cấu trúc: Trong khuôn khổ Best-of-N.
CePO sử dụng sự kết hợp các kỹ thuật lập luận, tạo ra nhiều kế hoạch và tự kiểm tra công việc của mình, tiêu thụ nhiều token đầu ra hơn (10-20 lần) so với các phương pháp one-shot. Tuy nhiên, nhờ tối ưu hóa phần cứng của Cerebras, nó vẫn đạt tốc độ 100 token mỗi giây – tương đương với các ứng dụng trò chuyện tốt nhất hiện nay như GPT-4 Turbo và Claude 3.5 Sonnet.
4. Tầm nhìn và kế hoạch tương lai của Cerebras
Cerebras sẽ mã nguồn mở khung công nghệ CePO để các nhà nghiên cứu và nhà phát triển trên toàn thế giới có thể xây dựng và nâng cao những kỹ thuật đột phá này. Kế hoạch phát triển của công ty bao gồm việc phát triển các khung công nghệ gợi ý nâng cao tận dụng khả năng lập luận so sánh, tạo ra các tập dữ liệu tổng hợp được tối ưu hóa cho việc tính toán thời gian suy luận và xây dựng các cơ chế xác minh nâng cao cho chuỗi lập luận phức tạp.
5. Thông tin về Cerebras Systems
Cerebras Systems là một nhóm các kiến trúc sư máy tính, nhà khoa học máy tính, nhà nghiên cứu học sâu và kỹ sư tiên phong. Sản phẩm chủ lực của họ, hệ thống CS-3, được cung cấp sức mạnh bởi bộ xử lý AI lớn nhất và nhanh nhất trên thị trường hiện nay, Wafer-Scale Engine-3. Các hệ thống CS-3 dễ dàng được kết nối với nhau để tạo ra các siêu máy tính AI lớn nhất thế giới. Giải pháp Cerebras Inference cung cấp tốc độ suy luận đột phá, giúp khách hàng tạo ra các ứng dụng AI tiên tiến.
Thông tin liên hệ truyền thông: PR@zmcommunications.com
0 comments Blogger 0 Facebook
Đăng nhận xét