Google ra mắt Gemini 3 Flash, mặc định trong ứng dụng Gemini

Google hôm thứ Năm đã phát hành Gemini 3 Flash – mô hình nhanh và chi phí thấp, được xây dựng dựa trên Gemini 3 ra mắt hồi tháng trước – với mục tiêu “lấn át” OpenAI. Đồng thời, công ty cũng đưa Gemini 3 Flash trở thành mô hình mặc định trong ứng dụng Gemini và chế độ AI trên công cụ tìm kiếm.

Mô hình Flash mới xuất hiện chỉ sáu tháng sau khi Google công bố Gemini 2.5 Flash, mang lại nhiều cải tiến đáng kể. Trên các thước đo đánh giá, Gemini 3 Flash vượt trội rõ rệt so với phiên bản trước và, ở một số tiêu chí, đạt hiệu năng ngang với các mô hình “đỉnh cao” khác như Gemini 3 Pro và GPT-5.2.

Chẳng hạn, trên bài kiểm tra Humanity’s Last Exam – được thiết kế để đánh giá mức độ chuyên môn trên nhiều lĩnh vực – Gemini 3 Flash đạt 33,7% khi không sử dụng công cụ hỗ trợ. Trong khi đó, Gemini 3 Pro đạt 37,5%, Gemini 2.5 Flash chỉ đạt 11%, còn GPT-5.2 mới ra mắt đạt 34,5%.

Ở bài kiểm tra về đa phương thức và suy luận MMMU-Pro, mô hình mới vượt qua tất cả các đối thủ với điểm số 81,2%.

Triển khai cho người dùng phổ thông

Google đang triển khai Gemini 3 Flash làm mô hình mặc định trong ứng dụng Gemini trên toàn cầu, thay thế Gemini 2.5 Flash. Người dùng vẫn có thể chọn mô hình Pro trong danh sách lựa chọn khi cần xử lý các câu hỏi về toán học và lập trình.

Theo Google, mô hình mới có khả năng nhận diện nội dung đa phương thức và đưa ra câu trả lời dựa trên những dữ liệu đó. Ví dụ, người dùng có thể tải lên một đoạn video ngắn chơi pickleball để xin gợi ý cải thiện kỹ năng; vẽ một phác thảo để mô hình đoán nội dung; hoặc tải tệp ghi âm để phân tích hay tạo câu đố.

Công ty cũng cho biết Gemini 3 Flash hiểu rõ hơn ý định của truy vấn và có thể tạo ra các câu trả lời mang tính trực quan hơn, với những yếu tố như hình ảnh và bảng biểu.

Người dùng cũng có thể sử dụng mô hình mới để tạo nguyên mẫu ứng dụng ngay trong ứng dụng Gemini thông qua các câu lệnh gợi ý.

Ngoài ra, Gemini 3 Pro hiện đã khả dụng cho tất cả người dùng tại Mỹ trong tìm kiếm, và nhiều người dùng hơn tại Mỹ cũng có thể truy cập mô hình tạo ảnh Nano Banana Pro trong tìm kiếm.

Khả năng tiếp cận cho doanh nghiệp và nhà phát triển

Google cho biết các công ty như JetBrains, Figma, Cursor, Harvey và Latitude đã sử dụng Gemini 3 Flash. Mô hình này hiện có mặt thông qua Vertex AI và Gemini Enterprise.

Đối với các nhà phát triển, Google cung cấp Gemini 3 Flash dưới dạng bản xem trước thông qua giao diện lập trình ứng dụng và trong Antigravity – công cụ lập trình mới mà Google phát hành hồi tháng trước.

Công ty cho biết Gemini 3 Pro đạt 78% trên thước đo SWE-bench đã được xác minh về lập trình, chỉ xếp sau GPT-5.2. Google cũng nhấn mạnh rằng mô hình này đặc biệt phù hợp cho phân tích video, trích xuất dữ liệu và hỏi-đáp trực quan; nhờ tốc độ cao, nó thích hợp cho các quy trình làm việc nhanh và lặp lại.

Giá sử dụng mô hình là 0,50 USD cho mỗi 1 triệu token đầu vào và 3,00 USD cho mỗi 1 triệu token đầu ra. Mức này cao hơn đôi chút so với Gemini Flash 2.5, nhưng Google khẳng định mô hình mới vượt trội hơn Gemini 2.5 Pro khi nhanh gấp ba lần. Với các tác vụ cần suy luận, Gemini 3 Flash sử dụng trung bình ít hơn 30% số token so với 2.5 Pro, đồng nghĩa với việc người dùng có thể tiết kiệm chi phí token trong một số trường hợp.

“Chúng tôi thực sự định vị Flash như một mô hình ‘xương sống’ cho công việc. Nếu nhìn vào mức giá đầu vào và đầu ra ở đầu bảng, Flash rõ ràng là lựa chọn rẻ hơn nhiều. Điều đó cho phép nhiều công ty xử lý các tác vụ khối lượng lớn,” bà Tulsee Doshi, Giám đốc cấp cao kiêm Trưởng bộ phận sản phẩm cho các mô hình Gemini, chia sẻ trong buổi họp báo.

Kể từ khi phát hành Gemini 3, Google cho biết họ đã xử lý hơn 1.000 tỷ token mỗi ngày thông qua API, trong bối cảnh cuộc cạnh tranh khốc liệt với OpenAI về tốc độ ra mắt và hiệu năng.

Đầu tháng này, Sam Altman được cho là đã gửi “Cảnh báo đỏ” tới đội ngũ OpenAI sau khi lưu lượng truy cập ChatGPT sụt giảm, trong khi thị phần người dùng của Google tăng lên. Sau đó, OpenAI đã tung ra GPT-5.2 và một mô hình tạo ảnh mới, đồng thời nhấn mạnh mức độ sử dụng trong khối doanh nghiệp ngày càng tăng và cho biết số lượng tin nhắn trên ChatGPT đã tăng gấp 8 lần kể từ tháng 11/2024.

Dù không trực tiếp đề cập đến cuộc cạnh tranh với OpenAI, Google cho rằng việc liên tục ra mắt các mô hình mới đang buộc tất cả các công ty phải hoạt động tích cực hơn.

“Hầu như những gì đang diễn ra trong toàn ngành là các mô hình ngày càng trở nên ấn tượng, thách thức lẫn nhau và mở rộng ranh giới,” bà Doshi nói. “Điều thú vị nữa là khi các công ty tung ra những mô hình này, chúng tôi cũng giới thiệu các thước đo mới và những cách đánh giá mới. Chính điều đó cũng đang thúc đẩy chúng tôi tiến lên.”

Ảnh minh họa Gemini 3 Flash của Google. Ảnh: Google