Mục lục
- Cuộc Chiến AI: Google Trả Đũa OpenAI
- Whisk: Không Chỉ Là Một Trình Tạo Ảnh AI Thông Thường
- Cách Whisk Hoạt Động: Đơn Giản Mà Hiệu Quả
- Whisk: Cỗ Máy Đào Tạo AI Ngầm?
- Tính Năng Đã Thử Nghiệm, Nhưng Chưa Hoàn Hảo
- Kết luận
1. Cuộc Chiến AI: Google Trả Đũa OpenAI
Trong khi OpenAI đang làm mưa làm gió với sự kiện "12 Ngày" đầy ắp các tính năng mới của ChatGPT, Google, đối thủ nặng ký của họ, không hề chịu lép vế. Hãng đã tung ra bản nâng cấp Gemini 2.0, các AI Agent đầu tiên, và nền tảng Android AR cho các thiết bị XR, cùng với kính thông minh AR chạy trên nền tảng Gemini. Và chưa dừng lại ở đó, Google tiếp tục giới thiệu một công cụ AI mới, một trình tạo ảnh độc đáo mang tên Whisk.
2. Whisk: Không Chỉ Là Một Trình Tạo Ảnh AI Thông Thường
Khác với các trình tạo ảnh AI thông thường yêu cầu bạn nhập một đoạn mô tả (prompt) để tạo ảnh, Whisk cho phép bạn tải lên các hình ảnh có sẵn để tạo ra những cảnh mới dựa trên đó. Hiện tại, Whisk đang ở giai đoạn thử nghiệm tại Google Labs và chỉ dành cho người dùng ở Mỹ. Tuy vậy, công cụ này đã cho thấy tiềm năng đầy thú vị của mình.
3. Cách Whisk Hoạt Động: Đơn Giản Mà Hiệu Quả
Thay vì bắt bạn phải đau đầu nghĩ ra prompt chi tiết, Whisk yêu cầu bạn cung cấp 3 bức ảnh:
- Một ảnh chứa chủ thể chính
- Một ảnh thể hiện bối cảnh
- Một ảnh thể hiện phong cách
Sau đó, Gemini sẽ phân tích các ảnh này, tạo ra một prompt dựa trên đó, và chuyển đến công cụ tạo ảnh Imagen 3 của Google để tạo ra ảnh mới. Theo Google, quá trình này sẽ "nắm bắt được tinh túy của chủ thể, chứ không phải bản sao y hệt."
Nếu bạn không hài lòng với kết quả ban đầu, bạn có thể bổ sung prompt bằng văn bản để AI tạo ra một phiên bản phù hợp hơn với ý tưởng của bạn. Whisk được Google định vị là một "công cụ sáng tạo mới," tập trung vào việc khám phá ý tưởng nhanh chóng chứ không phải chỉnh sửa ảnh đến từng pixel.
4. Whisk: Cỗ Máy Đào Tạo AI Ngầm?
Một số người dùng Reddit đã thử nghiệm Whisk và nhận thấy rằng nó có thể tạo ra các chủ thể rất sống động, ví dụ như chú mèo dưới đây:
Điều thú vị hơn nữa là, Whisk có vẻ như đang âm thầm giúp Google đào tạo AI của mình. Bằng cách cung cấp ảnh, bạn đang giúp Gemini hiểu rõ hơn về các khái niệm và cách chúng kết hợp với nhau. Thậm chí, các prompt văn bản bạn sử dụng để tinh chỉnh ảnh cũng là một hình thức phản hồi cho Gemini. Trong bối cảnh các công ty AI đang "khát" dữ liệu để đào tạo AI, những thử nghiệm như Whisk có thể trở nên vô cùng giá trị.
Tuy nhiên, Google chưa công bố rõ về việc sử dụng các tương tác của người dùng với Whisk, cũng như các ảnh bạn tải lên và các cuộc hội thoại với Gemini.
5. Tính Năng Đã Thử Nghiệm, Nhưng Chưa Hoàn Hảo
Whisk vẫn đang trong giai đoạn thử nghiệm tại Google Labs và chưa có mặt ở các thị trường quốc tế. Có lẽ, Google đang muốn thu thập thêm phản hồi từ người dùng để hoàn thiện công cụ này.
6. Kết Luận
Google Whisk mang đến một cách tiếp cận mới lạ và thú vị cho việc tạo ảnh bằng AI. Thay vì tập trung vào việc tạo ra những bức ảnh hoàn hảo đến từng chi tiết, nó khuyến khích người dùng khám phá và sáng tạo một cách nhanh chóng và dễ dàng. Liệu Whisk có đủ sức tạo nên đột phá và cạnh tranh với các trình tạo ảnh AI khác? Chúng ta hãy cùng chờ xem.
Bạn có thể thử nghiệm Whisk bằng cách đăng ký tại Google Labs nếu bạn đang ở Mỹ.
0 comments Blogger 0 Facebook
Đăng nhận xét