Gemini Deep Research: Công cụ AI mới của Google có thể xử lý các câu hỏi phức tạp nhiều bước

By Hoàng Sơn (Theo TechCrunch) 13 Tháng 12 2025, 08:11

Google hôm thứ Năm đã giới thiệu phiên bản mới của tác nhân nghiên cứu Gemini Deep Research, được xây dựng trên Gemini 3 Pro, mô hình nền tảng tối tân mà hãng đang đặc biệt kỳ vọng.

Tác nhân mới không chỉ còn là công cụ tạo báo cáo nghiên cứu như trước. Giờ đây, Google cho phép các nhà phát triển tích hợp khả năng nghiên cứu chuyên sâu theo kiến trúc SATA trực tiếp vào ứng dụng của họ thông qua một giao diện lập trình ứng dụng (API) mới.

Gemini Deep Research được thiết kế để tổng hợp lượng thông tin rất lớn và xử lý các lệnh có ngữ cảnh mở rộng. Theo Google, khách hàng đang dùng nó cho nhiều tác vụ từ thẩm định chuyên sâu (due diligence) đến nghiên cứu độc tính của thuốc.

Google cho biết họ sẽ sớm tích hợp tác nhân này vào nhiều dịch vụ như Google Search, Google Finance, ứng dụng Gemini và NotebookLM. Đây được xem là bước chuẩn bị cho một tương lai nơi AI sẽ tự thay con người thực hiện phần lớn các truy vấn tìm kiếm.

Theo Google, Deep Research hưởng lợi từ Gemini 3 Pro — mô hình “đúng sự thật nhất” của hãng, được huấn luyện để giảm thiểu hiện tượng ảo giác thông tin trong các tác vụ phức tạp. Hiện tượng ảo giác rất nguy hiểm đối với các tác vụ suy luận kéo dài, vì chỉ một quyết định sai lệch cũng có thể khiến toàn bộ kết quả bị hỏng.

Để chứng minh bước tiến của mình, Google còn giới thiệu thêm bộ kiểm chuẩn mới DeepSearchQA nhằm đánh giá khả năng xử lý các nhiệm vụ tìm kiếm thông tin nhiều bước. Bộ kiểm chuẩn này đã được mở mã nguồn.

Hãng cũng kiểm thử Deep Research với một số bộ đánh giá độc lập khác như Humanity’s Last Exam, vốn kiểm tra kiến thức tổng hợp qua các nhiệm vụ siêu chuyên biệt; và BrowserComp, bộ kiểm chuẩn dành cho các tác vụ tác nhân vận hành trong môi trường trình duyệt web.

Kết quả: tác nhân của Google đứng đầu ở bộ kiểm chuẩn của chính hãng và cả Humanity’s Last Exam. Tuy nhiên, ChatGPT 5 Pro của OpenAI lại bám sát rất sít sao và thậm chí vượt Google một chút ở BrowserComp.

Dù vậy, các phép so sánh này nhanh chóng trở nên lỗi thời. Bởi đúng trong ngày Google công bố Deep Research mới, OpenAI tung ra GPT-5.2, tên mã “Garlic”. OpenAI cho biết mô hình mới của họ vượt qua các đối thủ — đặc biệt là Google — ở nhiều bộ đánh giá tiêu chuẩn, bao gồm cả bộ kiểm chuẩn do chính OpenAI xây dựng.

CEO của Google Sundar Pichai. Ảnh: Getty Images