Google giảm giá mạnh, tăng tốc và hiệu quả cho mô hình AI Gemini

Google vừa ra mắt hai mô hình cập nhật, Gemini-1.5-Pro-002 và Gemini-1.5-Flash-002, với những cải tiến đáng kể về tốc độ, chi phí và hiệu quả. Các bản cập nhật này không chỉ mang lại hiệu suất tốt hơn mà còn giảm giá, mang lại lợi ích cho các nhà phát triển sử dụng công cụ này.

Logan Kilpatrick, Quản lý sản phẩm cấp cao của Google, cho biết: "Hôm nay, chúng tôi phát hành hai mô hình Gemini sẵn sàng sản xuất đã được cập nhật: Gemini-1.5-Pro-002 và Gemini-1.5-Flash-002." Phiên bản 1.5 Pro mới có mức giá giảm 50% cho cả token đầu vào và đầu ra đối với các lời nhắc dưới 128.000 token. Các mô hình này cũng có giới hạn tốc độ cao hơn và độ trễ thấp hơn; mô hình 1.5 Flash có giới hạn tốc độ tăng lên 2.000 yêu cầu mỗi phút (RPM), trong khi mô hình 1.5 Pro tăng lên 1.000 RPM. Cả hai mô hình đều cho ra kết quả nhanh hơn, với tốc độ tăng gấp đôi và độ trễ giảm gấp ba.

Các nhà phát triển có thể truy cập các mô hình này miễn phí thông qua Google AI Studio và Gemini API. Ngoài ra, các tổ chức lớn và khách hàng của Google Cloud có thể sử dụng các mô hình này trên Vertex AI. Những cập nhật này dựa trên các bản phát hành mô hình thử nghiệm và cung cấp những cải tiến đáng kể so với các mô hình Gemini được giới thiệu tại Google I/O vào tháng 5.

Dòng mô hình Gemini 1.5 mang đến những cải tiến trong nhiều nhiệm vụ, bao gồm tổng hợp văn bản, lập trình và các ứng dụng hình ảnh. Shrestha Basu Mallick, Quản lý sản phẩm nhóm, lưu ý: "Các mô hình Gemini có thể được sử dụng để tổng hợp thông tin từ các tệp PDF 1000 trang, trả lời các câu hỏi về kho lưu trữ có hơn 10.000 dòng mã, xử lý video dài một giờ và tạo nội dung hữu ích từ chúng." Các mô hình này đã cho thấy mức tăng khoảng 7% trong MMLU-Pro, một phiên bản thử thách của một điểm chuẩn phổ biến. Trên các điểm chuẩn MATH và HiddenMath, các mô hình đã đạt được cải thiện khoảng 20%. Thêm vào đó, hiệu suất của khả năng hiểu hình ảnh và tạo mã Python đã được cải thiện khoảng 2 đến 7 phần trăm.

Cài đặt bộ lọc mặc định của các mô hình cũng đã được cập nhật, tập trung vào việc cân bằng hướng dẫn của người dùng và duy trì tính an toàn trong đầu ra của chúng. Kilpatrick nhấn mạnh rằng các nhà phát triển sử dụng các phiên bản mới nhất (được gọi là mô hình -002) "sẽ không có bộ lọc được áp dụng theo mặc định, cho phép họ cấu hình các mô hình dựa trên nhu cầu cụ thể của họ".

Mô hình Gemini-1.5-Pro-002 đặc biệt đáng chú ý vì giá cả đã được giảm. Có hiệu lực từ đầu tháng 10, giá token đầu vào sẽ giảm 64%, token đầu ra giảm 52% và token được lưu trữ tăng dần giảm 64%, ảnh hưởng đến các dự án sử dụng ít hơn 128.000 token. Giảm giá này nhằm mục đích giảm hơn nữa chi phí sử dụng Gemini trong sản xuất, đặc biệt là kết hợp với các tính năng lưu trữ ngữ cảnh.

Các mô hình cập nhật cũng phản ánh những thay đổi dựa trên phản hồi của nhà phát triển. Kilpatrick nhấn mạnh: "Chúng tôi đã làm cho phản hồi của các mô hình ngắn gọn hơn để giảm chi phí và làm cho chúng dễ sử dụng hơn." So với các mô hình trước đó, độ dài đầu ra mặc định cho các tác vụ tóm tắt, trả lời câu hỏi và trích xuất đã giảm khoảng 5-20%. Đối với các sản phẩm dựa trên trò chuyện yêu cầu phản hồi dài hơn, các chiến lược nhắc nhở tùy chỉnh có sẵn để làm cho các mô hình chi tiết và mang tính đối thoại hơn.

Các bản cập nhật thử nghiệm bổ sung cho mô hình Gemini-1.5 bao gồm việc phát hành Gemini-1.5-Flash-8B-Exp-0924, cung cấp những cải tiến hiệu suất đáng kể trên các trường hợp sử dụng văn bản và đa phương thức. Mallick cho biết: "Phản hồi tích cực từ các nhà phát triển về 1.5 Flash-8B là điều tuyệt vời." Công ty có kế hoạch tiếp tục định hình quy trình phát hành từ thử nghiệm sang sản xuất dựa trên phản hồi của nhà phát triển.

Những cập nhật này phản ánh cam kết của Gemini trong việc cung cấp cho các nhà phát triển các mô hình AI mạnh mẽ và tiết kiệm chi phí, cải thiện điểm chuẩn hiệu suất và giảm chi phí vận hành. Những cải tiến mới được giới thiệu dường như củng cố vị thế của Gemini trong bối cảnh cạnh tranh AI, đồng thời cho phép phát triển ứng dụng dễ dàng hơn và hiệu quả hơn.

Google giảm giá mạnh, tăng tốc và hiệu quả cho mô hình AI Gemini