Mô hình AI lạ gây chú ý, nghi của DeepSeek

By Hoàng Sơn (Theo Reuters, NDTV) 19 Tháng 3 2026, 06:07

Một mô hình trí tuệ nhân tạo (AI) mạnh mẽ xuất hiện ẩn danh trên một nền tảng dành cho lập trình viên tuần trước đã làm dấy lên đồn đoán rằng startup Trung Quốc DeepSeek có thể đang âm thầm thử nghiệm hệ thống AI thế hệ mới trước khi ra mắt chính thức.

Mô hình miễn phí mang tên Hunter Alpha xuất hiện trên nền tảng OpenRouter từ ngày 11/3 mà không có thông tin về nhà phát triển, và sau đó được nền tảng này mô tả là một “mô hình hoạt động bí mật”.

Trong các thử nghiệm do Reuters thực hiện, chatbot Hunter Alpha tự mô tả là “một mô hình AI Trung Quốc, chủ yếu được huấn luyện bằng tiếng Trung”, đồng thời cho biết dữ liệu huấn luyện của nó kéo dài đến tháng 5/2025 — trùng với mốc cập nhật kiến thức của chatbot do DeepSeek phát triển.

Tuy nhiên, khi được hỏi về nhà phát triển, hệ thống từ chối tiết lộ. “Tôi chỉ biết tên mình, quy mô tham số và độ dài cửa sổ ngữ cảnh,” chatbot cho biết.

Sau khi thử nghiệm, nhiều người dùng trên mạng xã hội nhận thấy mô hình này được tối ưu cho các quy trình “tác nhân” (agentic), tức có thể tự lập kế hoạch, suy luận và thực hiện các nhiệm vụ kéo dài một cách tự động. Những mô hình như vậy không chỉ dùng để trò chuyện, mà còn có thể xử lý các công việc phức tạp, nhiều bước một cách đáng tin cậy.

Cả DeepSeek lẫn OpenRouter đều chưa xác nhận ai là tác giả của mô hình và không phản hồi các đề nghị bình luận.

Theo trang giới thiệu, Hunter Alpha là mô hình có quy mô 1.000 tỷ tham số — tức được huấn luyện với khoảng một nghìn tỷ biến số điều chỉnh cách hệ thống xử lý ngôn ngữ và tạo phản hồi. Những mô hình có số lượng tham số lớn thường đòi hỏi năng lực tính toán rất cao.

Hệ thống cũng hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token — thước đo lượng văn bản mà AI có thể xử lý hoặc “ghi nhớ” trong một lần tương tác. Mỗi token tương ứng với một đơn vị văn bản ngắn, thường là một phần của từ.

“Điểm kết hợp đáng chú ý ở đây là cửa sổ ngữ cảnh 1 triệu token cùng khả năng suy luận và lại được cung cấp miễn phí,” Nabil Haouam, một kỹ sư phát triển hệ thống tác nhân AI, nhận xét. “Phần lớn các mô hình tiên tiến có mức ngữ cảnh như vậy đều đi kèm chi phí rất lớn khi triển khai ở quy mô rộng.”

Các thông số này tương đồng với những kỳ vọng trên truyền thông Trung Quốc về mô hình V4 thế hệ tiếp theo của DeepSeek, được cho là có thể ra mắt sớm nhất vào tháng 4. DeepSeek, giống nhiều đối thủ trong nước, có nguồn tài chính dồi dào, dù cấu trúc sở hữu khá đặc biệt khi công ty mẹ là một quỹ đầu cơ định lượng thay vì tập đoàn công nghệ.

Dù sự trùng khớp chưa đủ để khẳng định mối liên hệ trực tiếp, nó đã làm gia tăng suy đoán trong cộng đồng lập trình viên rằng đây có thể là phiên bản thử nghiệm sớm của sản phẩm sắp ra mắt.

Việc ẩn danh phản ánh xu hướng rộng hơn trong ngành công nghệ, khi các công ty ngày càng tung ra mô hình AI dưới dạng “bí mật” để thu thập phản hồi thực tế một cách khách quan, không bị ảnh hưởng bởi kỳ vọng thương hiệu. Cách tiếp cận này có thể triển khai trên các nền tảng như OpenRouter, nơi cho phép các nhà phát triển thử nghiệm nhiều mô hình song song.

“Mô hình suy luận theo chuỗi (chain-of-thought) có lẽ là tín hiệu rõ ràng nhất,” Daniel Dewhurst, một kỹ sư AI phân tích hệ thống này, cho biết. “Phong cách suy luận rất khó che giấu và thường phản ánh cách mô hình được huấn luyện.”

Ông cũng cho rằng quy mô và khả năng ghi nhớ của Hunter Alpha phù hợp với các thông số đã được đồn đoán về DeepSeek V4 từ đầu năm.

Tuy vậy, một số chuyên gia cảnh báo rằng các bằng chứng hiện tại vẫn chưa đủ thuyết phục. Umur Ozkul, người vận hành các bài kiểm thử AI độc lập, nhận định: “Phân tích của tôi cho thấy Hunter Alpha nhiều khả năng không phải DeepSeek V4”, viện dẫn sự khác biệt trong cách xử lý token và cấu trúc so với các hệ thống hiện có của DeepSeek.

Logo DeepSeek trong một hình minh họa. Ảnh: Reuters