Google Nâng Cấp Công Nghệ GenAI: Tập Trung Vào Độ Chính Xác, Tốc Độ và Hiệu Quả
Mục lục:
- Google Tiếp Tục Đẩy Mạnh Cuộc Chiến GenAI
- Nâng Cao Độ Chính Xác Cho Mô Hình Ngôn Ngữ Lớn
- Cạnh Tranh Gay Gắt Trong Lĩnh Vực GenAI
- Google Tập Trung Vào Lưu Trữ Bối Cảnh
- Chiến Lược Đa Mô Hình Của Google
- Khách Hàng Bắt Đầu Áp Dụng GenAI Vào Thực Tiễn
1. Google Tiếp Tục Đẩy Mạnh Cuộc Chiến GenAI
Google đã công bố những nâng cấp mới cho công nghệ GenAI của mình, bao gồm khả năng grounding và lưu trữ bối cảnh cho mô hình ngôn ngữ lớn đa phương thức Gemini, nhằm nâng cao độ chính xác và hiệu quả sử dụng. Google cũng ra mắt Imagen 3, phiên bản mới nhất của mô hình hình ảnh diffusion, mang đến tốc độ xử lý nhanh hơn, khả năng hiểu prompt tốt hơn và khả năng đánh dấu kỹ thuật số. Ngoài ra, Google cũng chính thức phát hành mô hình Gemini 1.5 Flash với cửa sổ bối cảnh 1 triệu token. Những động thái này diễn ra trong bối cảnh cạnh tranh khốc liệt trong thị trường GenAI đang bùng nổ, nơi Google phải cạnh tranh với những đối thủ như Microsoft và OpenAI, Meta, AWS và các nhà cung cấp AI độc lập nhỏ hơn.
2. Nâng Cao Độ Chính Xác Cho Mô Hình Ngôn Ngữ Lớn
Grounding, hay việc cung cấp trích dẫn hoặc liên kết đến nguồn gốc của đầu ra LLM, đã trở thành một từ khóa trong vũ trụ GenAI khi các nhà cung cấp và người dùng tìm cách giảm thiểu hoặc loại bỏ hiện tượng ảo giác, hay những sai sót, mà LLM dễ mắc phải. Google đã vượt lên trước các đối thủ cạnh tranh GenAI chính của mình về mặt grounding, theo Andy Thurai, một nhà phân tích của Constellation Research. Google sử dụng Google Search làm điểm khởi đầu cho grounding, cung cấp điểm số chính xác dựa trên tỷ lệ phần trăm. Tuy nhiên, Thurai cho rằng nếu kết quả tìm kiếm không chính xác, thì đầu ra của mô hình cũng sẽ không chính xác. Ông cũng bày tỏ hy vọng cao hơn cho grounding của bên thứ ba, dự kiến sẽ có sẵn trên Vertex AI vào cuối năm nay với Moody's cho dữ liệu tài chính, Thomson Reuter cho tin tức và Zoominfo cho dữ liệu công ty. Chế độ grounding độ trung thực cao, hiện đang được xem trước thử nghiệm với phiên bản Gemini 1.5 Flash, cho phép người dùng chọn nguồn xác nhận dữ liệu của riêng mình. Nhiều người quan sát tin rằng grounding sẽ trở thành phương pháp tiêu chuẩn trong ngành để giảm thiểu và loại bỏ những sai sót của LLM.
3. Cạnh Tranh Gay Gắt Trong Lĩnh Vực GenAI
Kể từ khi OpenAI giới thiệu ChatGPT vào tháng 11 năm 2022, cuộc đua GenAI đã trở thành một cuộc chạy đua vượt bậc hàng tháng, với các nhà cung cấp cố gắng vượt trội nhau về tính năng, kích thước, sức mạnh và các thuộc tính khác của LLM. AWS sẽ tổ chức một sự kiện tại thành phố New York vào ngày 10 tháng 7, nơi dự kiến sẽ tung ra các bản phát hành GenAI để cố gắng bắt kịp Google và OpenAI. OpenAI đã tạo ra tiếng vang riêng của mình vào tháng trước với GPT-4o và việc mua lại nhà cung cấp cơ sở dữ liệu trực tuyến Rockset vào tuần trước, và dự kiến sẽ có động thái lớn khác trong thời gian tới. Trong khi đó, các nhà cung cấp AI nhỏ hơn đang ca ngợi những ưu điểm của các mô hình ngôn ngữ nhỏ, ít tốn tài nguyên tính toán và có thể tùy chỉnh cao.
4. Google Tập Trung Vào Lưu Trữ Bối Cảnh
Một trong những yếu tố mà Google quảng bá để giảm chi phí chạy xử lý LLM quy mô lớn là lưu trữ bối cảnh. Được xem trước công khai cho cả hai mô hình 1.5 Pro và Flash trong API trên Vertex AI, lưu trữ bối cảnh là một hình thức bộ nhớ trong LLM cho phép người dùng lưu trữ thông tin bối cảnh dài trong cửa sổ bối cảnh mà không cần phải nhập lại cho mỗi prompt. Theo Google, lưu trữ bối cảnh giúp giảm chi phí bằng cách giảm sử dụng token và tăng tốc độ bằng cách sử dụng lại hiệu quả bối cảnh đã lưu trữ trước đó, chẳng hạn như tài liệu dài hoặc đoạn phim video. Một số mô hình từ các nhà cung cấp khác cũng cung cấp các hình thức lưu trữ để giải quyết hạn chế về kích thước cửa sổ bối cảnh. Tuy nhiên, lợi thế của Google trong cuộc cạnh tranh giành khách hàng doanh nghiệp với các sản phẩm GenAI của mình là khả năng kiểm soát lượng dữ liệu khổng lồ. Theo Mohan, họ có một cơ sở cài đặt lớn và lượng dữ liệu khổng lồ để đào tạo và thử nghiệm các mô hình của họ. Ví dụ, họ có bốn sản phẩm với một tỷ người dùng mỗi ngày: Quảng cáo, Gmail, YouTube và Google Search.
5. Chiến Lược Đa Mô Hình Của Google
Ngoài các mô hình Gemini, Imagen và Gemma của riêng mình, Google đã theo đuổi chiến lược đa mô hình một cách rõ ràng, với hơn 150 LLM và mô hình nền tảng của bên thứ ba trong Model Garden của Vertex AI. AWS cũng đã đi theo con đường tương tự với nền tảng Amazon Bedrock GenAI. Vào thứ Năm, Google đã thêm mô hình Claude 3.5 Sonnet mới của nhà cung cấp GenAI độc lập Anthropic, được phát hành vào ngày 20 tháng 6, vào Vertex AI. Ngoài ra, Google cho biết họ sẽ thêm các LLM phổ biến Mistral Small, Mistral Large và Codestral vào Model Garden vào cuối mùa hè này. Mohan nói: Khách hàng muốn có sự lựa chọn. Họ muốn những mô hình chuyên gia và được đào tạo cho những việc cụ thể.
6. Khách hàng Bắt Đầu Áp Dụng GenAI Vào Thực Tiễn
Tại buổi thông báo cho giới truyền thông và nhà phân tích, Google đã cố gắng chứng minh rằng một số khách hàng của họ đã vượt qua giai đoạn thử nghiệm các ứng dụng GenAI để đưa chúng vào sản xuất. Nick Reed, giám đốc sản phẩm của Moody's, cho biết gã khổng lồ dịch vụ tài chính đã sử dụng công nghệ grounding của Google để cải thiện độ chính xác trong xếp hạng tín dụng và cửa sổ bối cảnh lớn của các mô hình Gemini để trích xuất kiến thức từ các tập dữ liệu và tài liệu lớn.

0 comments Blogger 0 Facebook
Đăng nhận xét