Cuộc đua AI năm 2025 sẽ căng thẳng hơn bao giờ hết

Báo cáo thường niên về tình hình ngành công nghiệp trí tuệ nhân tạo (AI) cho thấy năm 2024 là một năm đột phá với sự trỗi dậy của các mô hình nhỏ gọn, cạnh tranh sòng phẳng với những “gã khổng lồ.”

Cuộc đua AI đang nóng lên: số lượng và chất lượng của các mô hình AI hiệu suất cao từ Trung Quốc đang tăng mạnh, thách thức vị thế dẫn đầu của Mỹ, trong khi khoảng cách hiệu suất giữa các mô hình hàng đầu đang ngày càng thu hẹp, theo báo cáo tình hình ngành công nghiệp AI thường niên.

Báo cáo nhấn mạnh rằng khi AI tiếp tục tiến bộ nhanh chóng, không một công ty nào đang thực sự vượt lên dẫn trước. Trên bảng xếp hạng Chatbot Arena — nơi người dùng bình chọn hiệu suất các chatbot — mô hình đứng đầu chỉ có điểm cao hơn mô hình xếp hạng thứ 10 khoảng 12% vào đầu năm 2024, nhưng đến đầu năm 2025 khoảng cách này chỉ còn 5% (xem biểu đồ “All together now”). “Ranh giới công nghệ đang ngày càng cạnh tranh — và ngày càng đông đúc,” báo cáo viết.

Báo cáo Chỉ số Trí tuệ Nhân tạo năm 2025 do Viện Trí tuệ Nhân tạo Lấy con người làm trung tâm (HAI) tại Đại học Stanford, California công bố hôm 7-4.

Chỉ số này cho thấy các mô hình AI tạo sinh đáng chú ý vẫn tiếp tục mở rộng, sử dụng nhiều biến số ra quyết định hơn, năng lực tính toán lớn hơn và tập dữ liệu huấn luyện lớn hơn. Nhưng các nhà phát triển cũng chứng minh rằng những mô hình nhỏ gọn hơn có thể đạt thành tựu đáng kể. Nhờ vào các thuật toán cải tiến, một mô hình hiện đại có thể đạt hiệu suất tương đương với mô hình lớn hơn gấp 100 lần cách đây hai năm. “Năm 2024 là một năm đột phá cho các mô hình AI nhỏ gọn,” báo cáo khẳng định.

Bart Selman, nhà khoa học máy tính tại Đại học Cornell (Ithaca, New York), người không tham gia vào quá trình biên soạn báo cáo, cho biết ông rất vui khi thấy những nỗ lực tương đối nhỏ và chi phí thấp như DeepSeek của Trung Quốc vẫn có thể cạnh tranh. “Tôi dự đoán sẽ có những nhóm nhỏ chỉ gồm năm hoặc thậm chí hai người nghĩ ra các ý tưởng thuật toán mới làm thay đổi cục diện,” ông nói. “Điều này rất tích cực. Chúng ta không muốn thế giới chỉ bị chi phối bởi vài công ty lớn.”

So kè sát nút

Báo cáo cho thấy hiện nay phần lớn các mô hình AI nổi bật được phát triển bởi khu vực công nghiệp, chứ không phải khu vực học thuật — trái ngược với giai đoạn đầu những năm 2000 khi mạng nơ-ron và AI tạo sinh chưa bùng nổ. Trước năm 2006, khu vực công nghiệp chỉ tạo ra dưới 20% các mô hình AI đáng chú ý, nhưng đến năm 2023 con số này là 60% và gần 90% trong năm 2024.

Mỹ vẫn là quốc gia sản xuất nhiều mô hình AI nổi bật nhất, với 40 mô hình trong năm 2024, so với 15 của Trung Quốc và 3 của châu Âu. Tuy nhiên, nhiều khu vực khác cũng đang gia nhập cuộc đua, bao gồm Trung Đông, Mỹ Latinh và Đông Nam Á.

Báo cáo cho biết thêm rằng ưu thế trước đây của Mỹ về chất lượng mô hình hiện không còn. Trung Quốc — quốc gia dẫn đầu về số lượng công bố và bằng sáng chế AI — hiện đã phát triển các mô hình sánh ngang Mỹ về hiệu suất. Năm 2023, các mô hình hàng đầu của Trung Quốc kém mô hình hàng đầu của Mỹ gần 20 điểm phần trăm trong bài kiểm tra MMLU (Hiểu ngôn ngữ đa nhiệm quy mô lớn). Tuy nhiên, đến cuối năm 2024, khoảng cách này chỉ còn 0,3 điểm phần trăm.

“Khoảng năm 2015, Trung Quốc đã đặt mục tiêu trở thành quốc gia hàng đầu về AI và họ làm điều đó thông qua đầu tư vào giáo dục,” Selman nói. “Chúng ta đang chứng kiến những khoản đầu tư ấy bắt đầu đem lại kết quả.”

Lĩnh vực này cũng chứng kiến sự trỗi dậy bất ngờ về số lượng và hiệu suất của các mô hình mã nguồn mở như DeepSeek và LLaMa của Facebook. Người dùng có thể xem tự do các tham số mà các mô hình này học được trong quá trình huấn luyện và sử dụng để đưa ra dự đoán, mặc dù các chi tiết khác như mã huấn luyện có thể vẫn được giữ kín.

Ban đầu, các hệ thống đóng (không công khai bất cứ yếu tố nào) vượt trội rõ rệt, nhưng khoảng cách hiệu suất giữa các mô hình hàng đầu trong hai nhóm này đã giảm xuống còn 8% vào đầu năm 2024 và chỉ còn 1,7% vào đầu năm 2025.

“Điều này thực sự hữu ích cho những ai không đủ khả năng xây dựng mô hình từ đầu, chẳng hạn các công ty nhỏ và giới học thuật,” theo Ray Perrault, nhà khoa học máy tính tại SRI — một viện nghiên cứu phi lợi nhuận ở Menlo Park, California — và đồng Giám đốc của báo cáo. OpenAI, trụ sở tại San Francisco, đơn vị phát triển chatbot ChatGPT, dự định sẽ phát hành một mô hình mã nguồn mở trong vài tháng tới.

Tốt hơn, nhỏ hơn, rẻ hơn

Sau khi ChatGPT ra mắt công chúng vào năm 2022, các nhà phát triển chủ yếu tập trung vào việc nâng cao chất lượng hệ thống bằng cách mở rộng chúng lớn hơn. Xu hướng đó vẫn tiếp diễn, theo báo cáo: năng lượng dùng để huấn luyện một mô hình AI hàng đầu hiện đang tăng gấp đôi mỗi năm; tài nguyên tính toán cho mỗi mô hình tăng gấp đôi sau mỗi năm tháng; và kích thước tập dữ liệu huấn luyện tăng gấp đôi sau mỗi tám tháng.

Tuy nhiên, các công ty cũng đã tung ra những mô hình nhỏ nhưng rất hiệu quả. Ví dụ, vào năm 2022, mô hình nhỏ nhất đạt điểm MMLU trên 60% có 540 tỷ tham số; đến năm 2024, một mô hình chỉ cần 3,8 tỷ tham số để đạt điểm tương đương. Các mô hình nhỏ huấn luyện nhanh hơn, phản hồi nhanh hơn và tiêu thụ ít năng lượng hơn. “Điều đó cải thiện mọi mặt,” Perrault nói.

Một số mô hình nhỏ thậm chí có thể bắt chước hành vi của các mô hình lớn hơn, Selman nói, hoặc tận dụng được thuật toán và phần cứng tốt hơn so với các hệ thống cũ. Báo cáo cho biết hiệu suất năng lượng trung bình của phần cứng dùng cho hệ thống AI cải thiện khoảng 40% mỗi năm. Nhờ những tiến bộ đó, chi phí để đạt điểm hơn 60% trên MMLU đã giảm mạnh — từ khoảng 20 đô la Mỹ mỗi triệu token (đơn vị từ mà mô hình ngôn ngữ tạo ra) vào tháng 11 năm 2022 xuống chỉ còn 7 cent mỗi triệu token vào tháng 10 năm 2024.

Dù có những cải thiện ấn tượng trên nhiều bài kiểm tra chuẩn, báo cáo cũng lưu ý rằng AI tạo sinh vẫn còn những vấn đề cố hữu như thiên kiến ngầm và xu hướng “ảo giác” — tức đưa ra thông tin sai. “Chúng khiến tôi ấn tượng ở nhiều khía cạnh, nhưng cũng khiến tôi lo sợ ở những mặt khác,” Selman nói. “Chúng khiến tôi bất ngờ khi vẫn mắc những lỗi cơ bản.”

Hiệu suất các mô hình AI hàng đầu ngày càng xích lại gần nhau. Nguồn: AI Index Report 2025