Groq ra mắt LLaVA V1.5 7B, nhanh hơn OpenAI GPT-4o

Ngày 5 tháng 9 năm 2024 - Groq, một công ty công nghệ chuyên về phần cứng và phần mềm AI, đã giới thiệu LLaVA V1.5 7B, một mô hình trực quan mới hiện có sẵn trên Developer Console của Groq. Sự ra mắt này đánh dấu GroqCloud trở thành nền tảng đa phương thức, hỗ trợ cả hình ảnh, âm thanh và văn bản.

LLaVA, viết tắt của Large Language and Vision Assistant, kết hợp khả năng ngôn ngữ và thị giác. Mô hình này được xây dựng dựa trên CLIP của OpenAI và Llama 2 7B của Meta, sử dụng kỹ thuật điều chỉnh hướng dẫn trực quan để nâng cao khả năng theo dõi hướng dẫn tự nhiên dựa trên hình ảnh và suy luận thị giác.

Nhờ đó, LLaVA có thể xử lý xuất sắc các nhiệm vụ như trả lời câu hỏi bằng hình ảnh, tạo chú thích, nhận dạng ký tự quang học và hội thoại đa phương thức.

Artificial Analysis cho biết: "LLaVA-v1.5-7B hỗ trợ đầu vào hình ảnh/thị giác, và trong đánh giá hiệu suất ban đầu, thời gian phản hồi nhanh hơn GPT-4o trên OpenAI đến hơn 4 lần."

Mô hình mới này mở ra nhiều ứng dụng thực tiễn. Các nhà bán lẻ có thể sử dụng LLaVA để theo dõi hàng tồn kho, các nền tảng mạng xã hội có thể nâng cao khả năng tiếp cận bằng cách thêm mô tả hình ảnh, và các chatbot dịch vụ khách hàng có thể xử lý tương tác dựa trên văn bản và hình ảnh.

Ngoài ra, LLaVA còn hỗ trợ tự động hóa các nhiệm vụ trong các ngành sản xuất, tài chính, bán lẻ và giáo dục, tối ưu hóa quy trình và nâng cao hiệu quả.

Các nhà phát triển và doanh nghiệp có thể trải nghiệm LLaVA V1.5 7B ở chế độ xem trước trên GroqCloud.

Groq gần đây đã hợp tác với Meta để cung cấp cho cộng đồng các mô hình Llama 3.1 mới nhất, bao gồm 405B Instruct, 70B Instruct và 8B Instruct, với tốc độ xử lý của Groq.

Cựu nhà nghiên cứu của OpenAI, Andrej Karpathy, đã đánh giá cao tốc độ suy luận của Groq: "Điều này thật tuyệt vời. Cảm giác như AGI - bạn chỉ cần nói chuyện với máy tính và nó sẽ làm mọi thứ ngay lập tức. Tốc độ thực sự khiến AI trở nên dễ chịu hơn nhiều."

Được thành lập vào năm 2016 bởi Jonathan Ross, Groq tự phân biệt mình bằng cách từ bỏ GPU để sử dụng phần cứng độc quyền, LPU.

Kết luận: Sự ra mắt của LLaVA V1.5 7B là một bước tiến đáng chú ý của Groq trong việc thúc đẩy sự phát triển của AI đa phương thức. Mô hình này hứa hẹn sẽ mang đến những giải pháp hiệu quả và sáng tạo cho các doanh nghiệp và cá nhân trong nhiều ngành nghề.

Groq ra mắt LLaVA V1.5 7B, nhanh hơn OpenAI GPT-4o