
Tập đoàn Alibaba vừa tung ra phiên bản mới của mô hình ngôn ngữ lớn (LLM) Qwen3, đạt thành tích vượt trội so với nhiều đối thủ như GPT-4o của OpenAI và DeepSeek trong các bài kiểm tra về toán học, lập trình và xử lý ngôn ngữ.
Theo South China Morning Post, biến thể Qwen3-235B-A22B-2507-Instruct đã được phát hành trên nền tảng mã nguồn mở Hugging Face và ModelScope, kèm phiên bản hiệu suất cao sử dụng chuẩn FP8 – giúp giảm đáng kể nhu cầu bộ nhớ và tính toán. Mô hình này có thể chạy trên phần cứng cơ bản như một GPU hoặc máy cá nhân, hỗ trợ các doanh nghiệp nhỏ hoặc người dùng cá nhân dễ tiếp cận công nghệ AI mạnh mẽ.
Trong kỳ thi toán học AIME 2025, Qwen3 ghi được 70,3 điểm, bỏ xa DeepSeek (46,6 điểm) và GPT-4o (26,7 điểm). Trong bài kiểm tra lập trình MultiPL-E, mô hình đạt 87,9 điểm – gần bằng Claude Opus 4 Non-thinking của Anthropic (88,5 điểm) và vượt nhiều đối thủ khác.
Một điểm đáng chú ý là phiên bản mới chỉ hỗ trợ chế độ “không suy nghĩ” – trả lời trực tiếp mà không trình bày chuỗi lý luận. Tuy vậy, nó có thể xử lý các đoạn văn bản dài tới 256.000 token trong một lượt chạy – hữu ích cho các tài liệu lớn hoặc hội thoại kéo dài.
Đây là kết quả của việc Alibaba quyết định loại bỏ chế độ “lai” giữa lập luận và không lập luận trước đây. Thay vào đó, công ty sẽ huấn luyện riêng hai mô hình: một chuyên tuân thủ hướng dẫn, một chuyên xử lý lý luận. Đại diện nhóm phát triển viết trên mạng xã hội rằng cách tiếp cận mới sẽ cải thiện chất lượng và độ ổn định của mô hình.
Phiên bản Qwen3 cũng đang được tích hợp vào các sản phẩm thương mại. Một mô hình nhỏ hơn với 3 tỷ tham số sẽ được sử dụng trong trợ lý ảo Xiaowei Hui – một tính năng do HP phát triển dành cho người dùng máy tính tại Trung Quốc.
Ra mắt hồi tháng 4, dòng Qwen3 hiện bao gồm nhiều biến thể, từ mô hình 600 triệu tham số đến 235 tỷ tham số. Một trong các biến thể – Qwen3-235B-A22B-no-thinking – hiện xếp trong nhóm LLM mã nguồn mở hàng đầu toàn cầu, theo nền tảng LMArena.
Theo bảng xếp hạng tháng trước của Hugging Face, nhiều mô hình Qwen đang nằm trong top 10 mô hình AI hàng đầu Trung Quốc, khẳng định vị thế ngày càng vững chắc của Alibaba trong lĩnh vực AI mã nguồn mở.
Ảnh minh họa mô hình trí tuệ nhân tạo Qwen của Alibaba. Ảnh: Techwire Asia