Cuộc Chiến Trợ Lý AI: Google Gemini Live Đối Đầu GPT-4o Với Giọng Nói Siêu Thực

Sau màn ra mắt ấn tượng của GPT-4o với giọng nói như người thật, Google đã ngay lập tức đáp trả bằng công cụ tương tự mang tên Gemini Live.

Gemini Live là trợ lý AI mới nhất của Google, sở hữu khả năng tương tác bằng giọng nói tự nhiên, gần gũi với con người. Công cụ này được tích hợp khả năng ngữ điệu, thậm chí là các từ ngữ biểu cảm như "ừm", "à" giống như cách người thật giao tiếp, tạo nên trải nghiệm ấn tượng cho người dùng.

Tương tự GPT-4o, Gemini Live cho phép người dùng lựa chọn nhiều giọng nói khác nhau. Hiện tại, công cụ này mới chỉ hỗ trợ tiếng Anh và có sẵn trên ứng dụng Google Gemini dành cho thiết bị Android. Để sử dụng Gemini Live, người dùng cần đăng ký gói Gemini Advanced với giá 19,99 USD mỗi tháng.

Vậy Gemini Live có thể làm được gì?

Gemini Live hoạt động tương tự Siri và các trợ lý ảo khác, nhưng nổi trội hơn hẳn nhờ khả năng trò chuyện tự nhiên, mượt mà. Thay vì chỉ hiển thị kết quả tìm kiếm như trước, Gemini Live có thể trực tiếp trả lời câu hỏi của bạn bằng thông tin phù hợp nhất.

Trong video giới thiệu trên YouTube, Google đã trình diễn ba giọng nói cho Gemini Live là Vega, Ursa và Nova. Bên cạnh đó, Google cũng gợi ý một số trường hợp sử dụng Gemini Live như luyện tập phỏng vấn, xây dựng thói quen tích cực và lên ý tưởng.

Mặc dù có nhiều điểm tương đồng với chế độ thoại của ChatGPT được OpenAI công bố vào tháng 5/2024, Gemini Live vẫn sở hữu những lợi thế nhất định. Theo VentureBeat, Google hiện có hơn 3 tỷ người dùng Android và 2,2 tỷ người dùng iOS, đồng nghĩa với việc công cụ AI giọng nói này có tiềm năng tiếp cận lượng người dùng lớn hơn đáng kể so với đối thủ.

Vượt qua thách thức, hướng đến tương lai

Sissie Hsiao, Phó chủ tịch kiêm Tổng giám đốc phụ trách trải nghiệm Gemini và Google Assistant, chia sẻ: "AI mở ra những khả năng mới đầy hứa hẹn, nhưng đồng thời cũng đặt ra những thách thức mới. Việc sử dụng mô hình ngôn ngữ lớn giúp hiểu rõ ngôn ngữ tự nhiên và xử lý tác vụ phức tạp, nhưng đôi khi lại khiến các tác vụ đơn giản mất nhiều thời gian hơn để hoàn thành."

Bà cũng thừa nhận: "Mặc dù AI tạo sinh đủ linh hoạt để giải quyết nhiều loại nhiệm vụ, đôi khi nó có thể hoạt động theo những cách không mong muốn hoặc cung cấp thông tin không chính xác."

Để khắc phục hạn chế này, Google đã tích hợp các mô hình như Gemini 1.5 Flash, giúp cung cấp phản hồi nhanh hơn và chất lượng cao hơn.

Mặc dù vậy, bà Hsiao vẫn tin tưởng vào tiềm năng phát triển của Gemini: "Chúng ta mới chỉ đang ở giai đoạn đầu trong việc khám phá tất cả những cách thức mà trợ lý AI có thể hỗ trợ con người. Gemini sẽ ngày càng hoàn thiện hơn trong tương lai."

Cuộc chiến giữa các ông lớn công nghệ trong lĩnh vực AI đang ngày càng nóng lên. Với những nỗ lực không ngừng nghỉ, Google Gemini Live được kỳ vọng sẽ là đối thủ đáng gờm cạnh tranh trực tiếp với GPT-4o của OpenAI, mang đến cho người dùng những trải nghiệm tuyệt vời hơn trong tương lai.


Blog post image

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top