Ngày 26/2, Google công bố phiên bản mới của mô hình tạo ảnh Nano Banana 2 có thể tạo hình ảnh chân thực hơn và nhanh hơn so với bản trước. Tên kỹ thuật của mô hình này là Gemini 3.1 Flash Image.
Nano Banana 2 sẽ trở thành mô hình mặc định trong ứng dụng Gemini ở các chế độ Fast (ưu tiên tốc độ), Thinking (ưu tiên suy luận phức tạp hơn) và Pro (phiên bản nâng cao).
Google lần đầu giới thiệu Nano Banana vào tháng 8/2025 và nhanh chóng thu hút người dùng tạo hàng triệu hình ảnh, đặc biệt tại Ấn Độ. Tháng 11 cùng năm, công ty ra mắt Nano Banana Pro – phiên bản cho phép tạo ảnh chi tiết và chất lượng cao hơn.
Theo Google, Nano Banana 2 giữ được một số đặc tính “độ trung thực cao” (high-fidelity), nghĩa là hình ảnh có nhiều chi tiết, ánh sáng tự nhiên và kết cấu rõ nét như bản Pro, nhưng tốc độ xử lý nhanh hơn. Người dùng có thể tạo ảnh với độ phân giải từ 512 pixel đến 4K (mức chất lượng rất cao), cùng nhiều tỷ lệ khung hình khác nhau như vuông, ngang hoặc dọc.
Google cho biết mô hình mới có thể xử lý các yêu cầu phức tạp với nhiều chi tiết cụ thể, ví dụ mô tả rõ ánh sáng, chất liệu vải, biểu cảm nhân vật… Ảnh tạo ra có ánh sáng sống động hơn, bề mặt vật thể chân thực hơn và chi tiết sắc nét hơn.
Sau khi ra mắt, Nano Banana 2 sẽ được dùng mặc định cho tính năng tạo ảnh trong toàn bộ hệ sinh thái Gemini. Google cũng áp dụng mô hình này cho Flow – công cụ chỉnh sửa video bằng AI của hãng.
Trong lĩnh vực tìm kiếm, Nano Banana 2 sẽ được tích hợp làm mặc định cho kết quả hiển thị qua Google Lens (công cụ tìm kiếm bằng hình ảnh) và trong AI Mode (chế độ tìm kiếm có tích hợp AI) tại 141 quốc gia, trên cả ứng dụng Google và phiên bản web.
Với người dùng trả phí các gói Google AI Pro và Ultra, họ vẫn có thể chọn dùng Nano Banana Pro cho các tác vụ chuyên biệt. Việc này được thực hiện bằng cách nhấn vào biểu tượng ba chấm (three-dot menu) – thường nằm ở góc giao diện, mở ra các tùy chọn bổ sung – rồi chọn tạo lại hình ảnh bằng phiên bản Pro.
Đối với nhà phát triển, Nano Banana 2 sẽ được cung cấp bản xem trước (preview) thông qua Gemini API (giao diện lập trình cho phép phần mềm bên ngoài kết nối với Gemini), Gemini CLI (công cụ dòng lệnh dành cho lập trình viên) và Vertex API (nền tảng AI đám mây của Google). Mô hình này cũng có mặt trên AI Studio – môi trường thử nghiệm AI – và Antigravity, công cụ phát triển được Google giới thiệu vào tháng 11 năm ngoái.
Google cho biết tất cả hình ảnh tạo bằng Nano Banana 2 sẽ được gắn watermark SynthID – một dạng “dấu chìm” kỹ thuật số giúp nhận diện nội dung do AI tạo ra. Ngoài ra, ảnh cũng tương thích với chuẩn C2PA Content Credentials – tiêu chuẩn xác thực nguồn gốc nội dung số do một liên minh công nghệ gồm Adobe, Microsoft, Google, OpenAI và Meta phát triển.
Theo Google, kể từ khi triển khai công cụ xác minh SynthID trong ứng dụng Gemini vào tháng 11, người dùng đã sử dụng tính năng này hơn 20 triệu lần.

Mô hình tạo ảnh Nano Banana 2. Ảnh:Google

