Google Gemini: Khắc phục điểm yếu gây khó chịu trong tạo ảnh AI

Mục lục:

Giới thiệu Google Gemini và thách thức đạo đức trong ngành sáng tạo
Cải tiến đáng kể: Tùy chỉnh kích thước ảnh Gemini
Năm bận rộn của Gemini trong lĩnh vực tạo ảnh AI
Sự tích hợp Gemini vào các ứng dụng Google khác
Kết luận

1. Giới thiệu Google Gemini và thách thức đạo đức trong ngành sáng tạo

Google Gemini là một trong những tân binh đáng chú ý nhất, thậm chí có thể nói là "ngôi sao sáng" trong làng trí tuệ nhân tạo năm 2024. Đây là nỗ lực của Google nhằm mở rộng tầm ảnh hưởng của mình sang một lĩnh vực mới, bằng cách tích hợp Gemini vào hầu hết các ứng dụng trong Google Workspace. Tuy nhiên, sự tiện lợi của AI cũng đặt ra những thách thức lớn về mặt đạo đức cho ngành sáng tạo. Những câu hỏi về cách huấn luyện AI, vấn đề bản quyền và tranh chấp tiền lương công bằng đang là tâm điểm tranh luận. Công cụ tạo ảnh văn bản thành ảnh Imagen 3 của Google cũng nằm trong tâm điểm của cuộc tranh luận này, nhưng Google khẳng định sẽ bảo vệ người dùng nếu các hình ảnh AI của họ vi phạm bản quyền. Bất kể những tranh luận này, trải nghiệm người dùng khi tạo ảnh với Gemini đang được cải thiện đáng kể với nhiều tùy chọn cá nhân hóa hơn.

2. Cải tiến đáng kể: Tùy chỉnh kích thước ảnh Gemini

Một trong những điểm yếu thường gặp của cả Imagen 3 và Imagen 2 là việc chỉ tạo ra các hình ảnh có kích thước vuông. Điều này sắp thay đổi với phiên bản ổn định sắp ra mắt của ứng dụng Google. Theo báo cáo của Android Authority, phiên bản beta 15.41.34.29.arm64 hiện đã có cài đặt điều chỉnh kích thước ảnh Gemini. Đây không đơn thuần là công cụ cắt và thay đổi kích thước thông thường. Gemini sẽ bổ sung thêm chi tiết nền khi thu nhỏ và tự động lấp đầy các khoảng trống khi phóng to hình ảnh, mang lại trải nghiệm chỉnh sửa ảnh AI mượt mà và tự nhiên hơn.

3. Năm bận rộn của Gemini trong lĩnh vực tạo ảnh AI

Google đang nỗ lực không ngừng hoàn thiện các công cụ tạo ảnh của Gemini. Imagen 3, ra mắt vào tháng 8, đã được cải thiện đáng kể so với phiên bản trước (Imagen 2) về khả năng hiểu ngữ cảnh và thêm tùy chọn xuất 4 hình ảnh cùng lúc (Imagen 3 Fast). Tuy nhiên, một điểm hạn chế (hoặc có thể xem là một điều tích cực cho xã hội) là Gemini hiện không thể tạo hình ảnh người. Google đã thừa nhận rằng khả năng tạo ảnh của Gemini ban đầu "không đáp ứng được kỳ vọng", và mặc dù vẫn chưa tạo được ảnh người, đây được xem là một quyết định đúng đắn.

4. Sự tích hợp Gemini vào các ứng dụng Google khác

Imagen 3 đã được tích hợp vào nhiều ứng dụng Google khác nhau, chẳng hạn như Slides. Người dùng có thể tạo hình ảnh AI ngay trong Slides mà không cần phải chuyển sang ứng dụng khác, nhưng cần có tài khoản Enterprise hoặc Education, hoặc truy cập vào Google Workspace Labs. Tài khoản cá nhân có thể sử dụng tính năng này bằng cách đăng ký Google One AI Premium. Ngoài Slides, ứng dụng chụp ảnh màn hình trên Google Pixel 9 cuối cùng cũng đã được tích hợp với Gemini.

5. Kết luận

Google đang tích cực phát triển các công cụ tạo ảnh AI của Gemini, với những cải tiến liên tục về khả năng hiểu lệnh và tùy chỉnh. Việc bổ sung tùy chọn điều chỉnh kích thước ảnh là một bước tiến đáng kể, cải thiện trải nghiệm người dùng và giải quyết một trong những điểm yếu gây khó chịu trước đây. Mặc dù vẫn còn những thách thức về mặt đạo đức cần được giải quyết, sự phát triển nhanh chóng của Gemini cho thấy tiềm năng to lớn của AI trong lĩnh vực sáng tạo nội dung.

Google Gemini: Khắc phục điểm yếu gây khó chịu trong tạo ảnh AI