Google Gemini: Khả năng chỉnh sửa hình ảnh AI chính xác sắp ra mắt

Mục lục:

Giới thiệu về tính năng chỉnh sửa hình ảnh mới của Gemini
Cách thức hoạt động của tính năng chỉnh sửa
Minh chứng qua video demo
Những điểm mạnh và hạn chế
Thời gian ra mắt và kỳ vọng

1. Giới thiệu về tính năng chỉnh sửa hình ảnh mới của Gemini

Google Gemini, trợ lý AI đa năng của Google, hiện cho phép người dùng tạo hình ảnh từ các mô tả văn bản. Tuy nhiên, việc chỉnh sửa hình ảnh sau khi tạo chưa thực sự thuận tiện. Người dùng phải dựa vào các gợi ý văn bản bổ sung, thiếu tính chính xác và trực quan. Tin vui là Google đang phát triển một tính năng chỉnh sửa hình ảnh AI tiên tiến, cho phép người dùng chọn vùng cụ thể trên hình ảnh để chỉnh sửa một cách chính xác hơn. Bài viết này sẽ dựa trên phân tích mã nguồn (APK teardown) của phiên bản beta ứng dụng Gemini trên Android để hé lộ cách thức hoạt động của tính năng đột phá này.

2. Cách thức hoạt động của tính năng chỉnh sửa

Tính năng chỉnh sửa chính xác trong Gemini hoạt động như sau: sau khi tạo hình ảnh bằng mô tả văn bản, người dùng có thể chọn một vùng cụ thể trên hình ảnh. Sau đó, họ có thể đưa ra các gợi ý chỉnh sửa chi tiết hơn, chỉ áp dụng cho vùng đã chọn. Điều này khác biệt hoàn toàn so với phương pháp chỉnh sửa truyền thống chỉ dựa trên các mô tả văn bản toàn hình ảnh, dẫn đến hiệu quả chỉnh sửa không cao và đôi khi làm thay đổi toàn bộ hình ảnh một cách không mong muốn. Tuy nhiên, cần lưu ý rằng, mặc dù người dùng có thể chọn vùng cụ thể, hệ thống AI vẫn có khả năng tác động đến toàn bộ hình ảnh, tùy thuộc vào độ phức tạp của lệnh chỉnh sửa.

3. Minh chứng qua video demo

Một video demo từ phiên bản beta (v15.40.31.29) cho thấy tính năng này hoạt động. Video minh họa quá trình tạo hình ảnh từ mô tả văn bản, sau đó người dùng chọn một phần của hình ảnh và đưa ra lệnh chỉnh sửa bổ sung. Ví dụ, người dùng có thể yêu cầu thêm một đối tượng vào một vùng cụ thể của hình ảnh. Tuy nhiên, như video thể hiện, việc chỉnh sửa không phải lúc nào cũng hoàn hảo. Đôi khi, ngay cả những chỉnh sửa đơn giản cũng có thể dẫn đến sự thay đổi không mong muốn ở các phần khác của hình ảnh, thậm chí làm biến đổi đối tượng chính. Điểm cộng là người dùng luôn có thể quay lại phiên bản hình ảnh trước đó nếu không hài lòng với kết quả chỉnh sửa. Quá trình chỉnh sửa được lưu trữ như một cuộc hội thoại chatbot thông thường, giúp người dùng dễ dàng tiếp tục chỉnh sửa từ bất kỳ bước nào.

4. Những điểm mạnh và hạn chế

Điểm mạnh:

Chỉnh sửa chính xác hơn: Cho phép người dùng chỉnh sửa các vùng cụ thể trên hình ảnh, mang lại độ chính xác cao hơn so với phương pháp chỉnh sửa bằng mô tả văn bản toàn bộ hình ảnh.
Quản lý phiên bản: Cho phép người dùng quay lại các phiên bản hình ảnh trước đó, đảm bảo tính linh hoạt trong quá trình chỉnh sửa.
Giao diện người dùng trực quan: Quá trình chỉnh sửa được tích hợp liền mạch vào giao diện trò chuyện, giúp người dùng dễ dàng sử dụng.

Hạn chế:

Tính chính xác chưa hoàn hảo: Việc chỉnh sửa vẫn chưa hoàn toàn chính xác và có thể dẫn đến những thay đổi không mong muốn ở các phần khác của hình ảnh.
Thời gian xử lý: Quá trình tạo và chỉnh sửa hình ảnh có thể mất khá nhiều thời gian, đặc biệt là khi sử dụng Gemini Advanced.

5. Thời gian ra mắt và kỳ vọng

Hiện tại, tính năng chỉnh sửa hình ảnh chính xác này vẫn đang trong giai đoạn thử nghiệm. Google chưa công bố chính thức thời gian ra mắt rộng rãi. Tuy nhiên, dựa trên bản demo và tốc độ phát triển hiện tại, chúng ta có thể kỳ vọng tính năng này sẽ sớm được triển khai cho tất cả người dùng. Sự cải tiến này sẽ nâng cao đáng kể khả năng tạo và chỉnh sửa hình ảnh của Gemini, đưa nó đến gần hơn với một công cụ sáng tạo hình ảnh mạnh mẽ và toàn diện. Mặc dù vẫn còn một số hạn chế cần được khắc phục, nhưng bước tiến này đánh dấu một cột mốc quan trọng trong việc phát triển công nghệ AI tạo ảnh.

Google Gemini: Khả năng chỉnh sửa hình ảnh AI chính xác sắp ra mắt