Cerebras thách thức Nvidia trong lĩnh vực suy luận AI, nhưng đối mặt với nhiều khó khăn
Cerebras Systems, một startup phần cứng AI, vừa ra mắt công cụ suy luận AI mới với tham vọng cạnh tranh với các sản phẩm GPU của Nvidia. Tuy nhiên, hành trình chinh phục thị trường của Cerebras sẽ không dễ dàng khi Nvidia đang chiếm ưu thế tuyệt đối.
Cuộc đua hiệu năng và chi phí
Cerebras Inference, sản phẩm mới của Cerebras, có khả năng xử lý 1.800 token mỗi giây cho Llama 3.1 8B và 450 token mỗi giây cho Llama 3.1 70B. Theo Cerebras, tốc độ này vượt trội hơn so với các dịch vụ đám mây siêu quy mô dựa trên GPU của Nvidia.
Được hỗ trợ bởi Wafer-Scale Engine, bộ xử lý độc đáo của Cerebras, Cerebras Inference được quảng cáo là có chi phí thấp hơn so với các giải pháp dựa trên GPU.
Sự chuyển dịch của thị trường AI
Arun Chandrasekaran, một nhà phân tích tại Gartner, cho rằng Cerebras Inference phản ánh sự thay đổi trong thị trường AI tổng quát.
Giai đoạn đầu của làn sóng AI tổng quát tập trung chủ yếu vào việc huấn luyện mô hình. Hiện tại, thị trường đang chuyển hướng sang quan tâm đến hiệu năng và chi phí của quá trình suy luận.
"Đây cũng là dấu hiệu cho thấy các trường hợp sử dụng AI đang bắt đầu tăng sinh và mở rộng vào doanh nghiệp", Chandrasekaran nói. "Đó là lý do tại sao sự đổi mới không chỉ diễn ra ở khía cạnh huấn luyện mà còn ở khía cạnh suy luận."
Khi các trường hợp sử dụng AI tổng quát phát triển trong doanh nghiệp, hiệu năng suy luận trở nên quan trọng hơn, tạo cơ hội cho các nhà cung cấp như Cerebras. Tuy nhiên, cơ hội này cũng dành cho các nhà cung cấp đám mây chuyên biệt đang nổi lên và xây dựng chip riêng, đồng thời cung cấp các mô hình mã nguồn mở trên nền tảng chip đó.
Do đó, mặc dù Cerebras có thể tạo sự khác biệt dựa trên hiệu năng và có thể vượt qua cả Nvidia, nhưng họ cũng sẽ phải cạnh tranh với những đối thủ khác như các nhà cung cấp dịch vụ siêu quy mô như Microsoft, AWS và Google, cũng như các nhà cung cấp suy luận chuyên biệt như Groq, công ty gần đây đã huy động được 640 triệu USD.
Cerebras vs. Nvidia: Cuộc chiến giữa hiệu năng và hệ sinh thái
David Nicholson, nhà phân tích của Futurum Group, nhận định rằng mặc dù Cerebras dường như đã đưa ra "một cách hiệu quả và tinh tế hơn để cung cấp hiệu năng từ góc độ phần cứng và kỹ thuật", nhưng bộ phần mềm và phần cứng của Nvidia vẫn thống trị thị trường và dễ sử dụng hơn cho doanh nghiệp.
Hệ thống Wafer-Scale của Cerebras có thể cung cấp hiệu năng cần thiết cho khối lượng công việc AI ở mức cao hơn và chi phí thấp hơn so với Nvidia.
Tuy nhiên, câu hỏi đặt ra là liệu các doanh nghiệp có sẵn sàng đầu tư để tích hợp hệ thống của họ với Cerebras hay không.
Nhiều doanh nghiệp có thể nhận thấy rằng họ có thể đạt được hiệu năng và chi phí tốt hơn nếu làm việc với hệ thống Cerebras so với các hệ thống có sẵn của Nvidia.
"Câu hỏi thực sự là… bao nhiêu phần của thị trường sẽ hướng tới cách tốt nhất để làm điều này, so với cách được áp dụng rộng rãi nhất, dễ triển khai nhất?" Nicholson nói thêm. "Cerebras phải đối mặt với rào cản gia nhập rất lớn, trong khi Nvidia đang có thị phần áp đảo."
Do đó, các doanh nghiệp có thể sẽ lựa chọn giữa Nvidia và một nhà cung cấp như Cerebras dựa trên quy mô. Các doanh nghiệp nhỏ có khả năng sẽ nghiêng về Nvidia, trong khi các nhà cung cấp có vốn lớn muốn mở rộng quy mô quy trình làm việc AI của họ có thể sẽ nghiêng về Cerebras.
Cerebras Inference hiện có sẵn thông qua giao diện trò chuyện và API.
Tóm tắt:
- Cerebras ra mắt công cụ suy luận AI mới, thách thức Nvidia.
- Hiệu năng vượt trội, chi phí thấp hơn là lợi thế của Cerebras.
- Thị trường AI đang chuyển dịch sang chú trọng hiệu năng suy luận.
- Cerebras đối mặt với thách thức từ Nvidia và các đối thủ khác.
- Quy mô doanh nghiệp sẽ ảnh hưởng đến quyết định lựa chọn giữa Cerebras và Nvidia.

0 comments Blogger 0 Facebook
Đăng nhận xét