Mô hình Gemini 2.5 Flash Image “nano banana” giúp Google cải thiện độ nhất quán khi chỉnh sửa ảnh bằng AI, giữ nguyên chi tiết gốc qua nhiều lần thay đổi.
Google vừa công bố một bước tiến mới trong công nghệ chỉnh sửa hình ảnh bằng trí tuệ nhân tạo. Mô hình “nano banana”, hay còn gọi là Gemini 2.5 Flash Image, đã nhanh chóng vươn lên dẫn đầu bảng xếp hạng LMArena nhờ khả năng xử lý vượt trội và tính nhất quán cao. Tính năng này hiện đã chính thức được tích hợp vào ứng dụng Gemini.
Khác với việc phải chỉnh sửa thủ công trên Photoshop, người dùng chỉ cần nhập lệnh để AI thực hiện thay đổi trên ảnh. Google đã giới thiệu khả năng này từ đầu năm, song kết quả đôi khi chưa ổn định do tính ngẫu nhiên vốn có của AI. Với “nano banana”, DeepMind đã khắc phục nhược điểm đó: hệ thống có thể ghi nhớ chi tiết và giữ nguyên đặc điểm của chủ thể qua nhiều lần chỉnh sửa liên tiếp, thay vì tạo ra kết quả khác biệt mỗi lần thay đổi.

Theo Google, điều này mở ra nhiều ứng dụng thú vị. Ví dụ, bạn có thể tải ảnh một người bất kỳ và biến họ thành một nhân vật khác — như đấu sĩ bò tót hay ngôi sao sitcom thập niên 90 — mà vẫn giữ nguyên gương mặt gốc. Ngay cả khi thực hiện nhiều thao tác chỉnh sửa nối tiếp, hình ảnh cuối cùng vẫn bảo toàn sự nhận diện từ ảnh ban đầu.
Không chỉ dừng lại ở việc thay đổi phong cách, Gemini còn có thể ghép nhiều bức ảnh lại thành một tác phẩm mới. Chẳng hạn, Google minh họa bằng việc kết hợp ảnh một người phụ nữ với ảnh chú chó để tạo ra khung cảnh chú chó được âu yếm. Công cụ cũng có thể xử lý các ý tưởng trừu tượng hơn, miễn là không vi phạm các nguyên tắc an toàn của mô hình.
Để tăng tính minh bạch, mọi hình ảnh tạo ra từ Gemini 2.5 Flash Image đều được gắn watermark “AI” hiển thị rõ ràng, cùng với dấu nhận diện kỹ thuật số SynthID ẩn, đảm bảo vẫn phát hiện được ngay cả khi ảnh đã qua chỉnh sửa.
Người dùng có thể trải nghiệm ngay khả năng chỉnh sửa ảnh mới trên ứng dụng Gemini. Trong thời gian tới, mô hình này cũng sẽ được triển khai rộng rãi hơn qua Gemini API, AI Studio và Vertex AI, mang đến công cụ mạnh mẽ cho các nhà phát triển.