Mục Lục
- Giới Thiệu
- Hiệu Năng Vượt Trội
- Khả Năng Suy Luận và Giá Cả
- So Sánh với Các Mô Hình Khác
- Tương Lai Của DeepSeek
1. Giới Thiệu
DeepSeek, một phòng nghiên cứu AI đến từ Trung Quốc, vừa ra mắt DeepSeek-V3, phiên bản mới nhất của mô hình AI tiên tiến của họ. Mô hình "Mixture-of-Experts" này sở hữu tổng cộng 671 tỷ tham số, với 37 tỷ tham số được kích hoạt cho mỗi token, và được đào tạo trên 14,8 nghìn tỷ token. DeepSeek đã công bố mô hình này trên GitHub, kèm theo một tài liệu kỹ thuật chi tiết về các khả năng của nó.
2. Hiệu Năng Vượt Trội
Theo kết quả đánh giá benchmark, DeepSeek-V3 đã vượt trội hơn so với Llama 3.1 405B của Meta và nhiều mô hình thương mại khác. Đáng chú ý, mô hình mới này nhanh hơn gấp ba lần so với người tiền nhiệm DeepSeek V2. Theo tài liệu kỹ thuật, DeepSeek-V3 nổi lên là "mô hình mã nguồn mở mạnh nhất hiện có, đạt được hiệu năng tương đương với các mô hình thương mại hàng đầu như GPT-4o và Claude-3.5-Sonnet."
3. Khả Năng Suy Luận và Giá Cả
DeepSeek cũng cho biết họ đã tích hợp khả năng suy luận từ dòng mô hình DeepSeek R1 vào DeepSeek-V3, giúp cải thiện đáng kể khả năng suy luận của mô hình. Thêm vào đó, mức giá API của DeepSeek-V3 sẽ giữ nguyên như DeepSeek V2 cho đến ngày 8 tháng 2 năm 2025. Sau thời gian này, giá sẽ là 0,27 đô la cho mỗi triệu token đầu vào và 1,10 đô la cho mỗi triệu token đầu ra, khiến nó trở thành một trong những mô hình có giá cả phải chăng nhất hiện nay.
4. So Sánh với Các Mô Hình Khác
Mặc dù khó có thể so sánh trực tiếp, DeepSeek-V3 vẫn có những khác biệt so với OpenAI o1. Trong khi o1 đạt 76% trên benchmark GPQA Diamond (câu hỏi khoa học cấp tiến sĩ), DeepSeek chỉ đạt 59,1%. Phiên bản đầy đủ của o1 vượt trội hơn DeepSeek trên nhiều benchmark, nhưng DeepSeek-V3 lại vượt trội hơn Claude 3.5 Sonnet trên nhiều khía cạnh khác.
Trong bối cảnh đó, DeepSeek đang có những bước tiến lớn trong hệ sinh thái AI mã nguồn mở. Mới đây, công ty đã ra mắt V2.5-1210, mô hình cuối cùng trong dòng V2. Mô hình này có thể được truy cập tại chat.deepseek.com. Người dùng có thể bật tính năng tìm kiếm trên Internet để có kết quả theo thời gian thực hoặc tích hợp mô hình thông qua Hugging Face.
5. Tương Lai Của DeepSeek
Các mô hình AI từ phương Đông đang cạnh tranh mạnh mẽ với các mô hình từ phương Tây, và DeepSeek không phải là trường hợp duy nhất. Alibaba's Qwen 2.5 cũng thể hiện hiệu năng tương đương với nhiều mô hình hàng đầu khác. Dòng Qwen2.5-Coder đặc biệt xuất sắc trong việc tạo mã, sánh ngang với GPT-4o trên các benchmark như EvalPlus, LiveCodeBench và BigCodeBench. Điều này cho thấy rằng DeepSeek và các đối thủ đang làm tăng sự cạnh tranh trong lĩnh vực AI, hứa hẹn mang lại nhiều sự đổi mới trong tương lai.
0 comments Blogger 0 Facebook
Đăng nhận xét